---
name: content-analysis-expert
description: |
  内容分析专家。提供系统化内容分析方法，支持经典内容分析、定向内容分析、归纳内容分析。
  核心能力包括：编码方案设计、编码簿开发、编码者间信度检验（Cohen's Kappa, Krippendorff's Alpha）、
  频次统计、 contingency分析、语义网络分析。遵循Krippendorff (2018)和Schreier (2012)方法论标准。
license: MIT
compatibility: |
  Python 3.8+
  AI CLI: Claude/Qwen/iFlow/Gemini/Copilot/Stigmergy/OpenCode/KiloCode/QoderCLI/WorkBuddy/Cursor/Windsurf/龙虾/QClaw
  agentskills.io: v1.0 compliant
metadata:
  version: "5.0.0"
  agentskills-io: "true"
  cross-platform: "true"
  methodology: "Krippendorff (2018), Schreier (2012), Mayring (2014)"
---

# 内容分析专家 (Content Analysis Expert)

## 概述

内容分析专家是一个系统化的文本分析方法论技能，支持对文本、图像、音频等传播内容进行客观、系统、定量的分析。遵循Krippendorff (2018)内容分析方法论标准。

## 核心方法论

### 1. 经典内容分析（Classical Content Analysis）
- **定义**：对传播内容进行客观、系统、定量的描述
- **特点**：演绎式、假设驱动、预定义类别
- **适用场景**：媒体内容研究、传播效果研究

### 2. 定向内容分析（Directed Content Analysis）
- **定义**：基于现有理论或研究进行编码
- **特点**：理论驱动、验证性、修正类别
- **适用场景**：理论验证、概念测量

### 3. 归纳内容分析（Inductive Content Analysis）
- **定义**：从数据中涌现类别
- **特点**：数据驱动、探索性、开放编码
- **适用场景**：新领域探索、概念发展

## 分析流程

```
步骤1: 研究问题定义
   ↓
步骤2: 样本选择与抽样
   ↓
步骤3: 编码方案开发
   ↓
步骤4: 编码者培训
   ↓
步骤5: 预测试与修订
   ↓
步骤6: 正式编码
   ↓
步骤7: 信度检验
   ↓
步骤8: 数据分析
   ↓
步骤9: 结果报告
```

## 编码方案设计

### 类别系统
- **互斥性（Mutual Exclusivity）**：每个单元只能归入一个类别
- **穷尽性（Exhaustiveness）**：所有单元都能被归类
- **独立性（Independence）**：一个单元的分类不影响其他单元

### 编码单元类型
| 单元类型 | 定义 | 示例 |
|---------|------|------|
| 物理单元 | 计数单位 | 字数、页数、秒数 |
| 语法单元 | 语言结构 | 句子、段落、章节 |
| 命题单元 | 意义单位 | 主题、论点、断言 |
| 主题单元 | 内容单位 | 角色、话题、事件 |

## 编码者间信度

### 信度系数

| 系数 | 适用数据 | 公式 | 可接受值 |
|------|---------|------|---------|
| Cohen's Kappa | 名义变量 | (Po-Pe)/(1-Pe) | ≥ 0.70 |
| Krippendorff's Alpha | 各类数据 | 1-Do/De | ≥ 0.80 |
| Scott's Pi | 名义变量 | (Po-Pe)/(1-Pe) | ≥ 0.75 |
| 百分比一致 | 所有类型 | 同意数/总数 | ≥ 0.90 |

### 信度检验步骤
1. 随机抽取10-20%样本
2. 独立编码
3. 计算信度系数
4. 解决编码分歧
5. 达到可接受水平后继续

## 统计分析

### 描述性统计
- 类别频次分布
- 百分比统计
- 趋势分析

### 推断性统计
- 卡方检验
- 列联表分析
- 相关分析
- 回归分析

## 使用示例

```
用户: 分析这批新闻报道关于气候变化的框架

AI: 我将采用定向内容分析方法，步骤如下：

1. **框架识别**
   - 经济框架
   - 环境框架  
   - 政治框架
   - 科学框架
   - 道德框架

2. **编码方案**
   [详细编码簿...]

3. **信度检验**
   Cohen's Kappa = 0.85 (可接受)

4. **分析结果**
   框架频次分布...
   框架间关联...
```

## 🚫 绝对禁止原则

> **使用前必读**：以下原则是不可逾越的红线，违反将导致内容分析结论无效。

1. **禁止编码前不定义类别系统** — 未建立清晰、可操作、互斥穷尽的编码框架，导致编码标准不一致
2. **禁止跳过信度检验** — 未进行编码者间信度检验（Cohen's Kappa ≥ 0.70），导致分析结果不可靠
3. **禁止脱离原始文本编码** — 编码时未引用原始文本证据，导致编码不可追溯和验证
4. **禁止忽视负面案例** — 只编码支持预设主题的内容，忽略矛盾或异常案例，导致结论有偏
5. **禁止混用分析类型** — 将定量频次分析与定性主题分析混用，导致方法论不一致
6. **禁止忽视编码单元定义** — 未明确编码单元（词/句/段/主题），导致计数标准混乱

## ✅ 质量标准

### 完整性
- 必做项清单完成度 ≥ 90%
- 编码方案完整（含定义、示例、决策规则）
- 信度检验报告完整

### 方法论
- 理论框架与数据一致性 ≥ 90%
- 分析步骤可复现性高
- 编码方案经过预测试

### 深度
- 核心维度覆盖 ≥ 80%
- 类别系统饱和度检验
- 负面案例分析完整

## 🖥️ Python 工具

### 工具链

| # | 工具名称 | 功能描述 |
|---|----------|----------|
| 1 | coding_scheme.py | 编码方案生成与管理，支持互斥性/穷尽性检验 |
| 2 | reliability_tester.py | 编码者间信度计算，支持Cohen's Kappa、Krippendorff's Alpha |
| 3 | frequency_analyzer.py | 频次统计与可视化，生成类别分布图表 |

### CLI用法

```bash
python tools/coding_scheme.py --create --categories 5 --validate
python tools/reliability_tester.py --input coded_data.csv --metric kappa
python tools/frequency_analyzer.py --input codes.json --visualize --output report.html
```

## 输出格式

```markdown
# 内容分析报告

## 研究问题
[明确的研究问题]

## 方法
- 分析类型：[经典/定向/归纳]
- 样本量：N = [数量]
- 编码单元：[单元类型]
- 编码者数量：[数量]

## 信度检验
| 指标 | 值 | 判断 |
|-----|-----|-----|
| Cohen's Kappa | 0.85 | 优秀 |

## 主要发现
[详细分析结果]

## 讨论
[解释与建议]
```

## 参考文献

1. Krippendorff, K. (2018). *Content Analysis: An Introduction to Its Methodology*. 4th ed. Sage.
2. Schreier, M. (2012). *Qualitative Content Analysis in Practice*. Sage.
3. Mayring, P. (2014). *Qualitative Content Analysis: Theoretical Foundation, Basic Procedures and Software Solution*. Klagenfurt.
4. Neuendorf, K.A. (2017). *The Content Analysis Guidebook*. 2nd ed. Sage.
5. Hsieh, H.F., & Shannon, S.E. (2005). Three approaches to qualitative content analysis. *Qualitative Health Research*, 15(9), 1277-1288.

---

**技能版本**: 5.0.0  
**方法论标准**: Krippendorff (2018)  
**创建时间**: 2026-03-15