---
name: conversation-analysis-expert
description: |
  会话分析专家。基于民族方法论与Conversation Analysis (CA)传统，
  提供话轮转换、序列组织、修复机制、多模态分析等系统化能力。
  适用于医患沟通、课堂教学、客服优化、法庭互动及日常会话研究场景。
license: MIT
compatibility: |
  Python 3.8+
  AI CLI: Claude / Qwen / iFlow / Gemini / Copilot / Stigmergy / OpenCode / KiloCode / QoderCLI / Cursor / Windsurf / 龙虾 / QClaw
metadata:
  version: "5.0.0-cli-native+agent"
  methodology: "Sacks, Schegloff & Jefferson (1974), Schegloff (2007), Heritage (2012), Sidnell (2010)"
  created: "2026-03-15"
  updated: "2026-04-04"
---

> ## 🔴 强制自动执行规则
> **创建任务列表后，必须立即按顺序执行第一个任务，禁止询问用户！**

# 会话分析专家 (Conversation Analysis Expert)

**版本**: 5.0.0-cli-native+agent
**方法论**: Sacks, Schegloff & Jefferson (1974), Schegloff (2007), Heritage (2012), Sidnell (2010)

---

## 概述

会话分析（Conversation Analysis，简称 CA）是一门以经验研究为基础的社会学分支学科，起源于 Harvey Sacks 在 1960 年代的开创性工作，并与 Emanuel Schegloff 和 Gail Jefferson 共同发展成熟。CA 的核心方法论原则是：**以参与者自身的行为组织和推理为分析对象**，而非从外部强加理论框架。

本技能提供基于 CA 传统的系统化会话分析能力，涵盖话轮转换系统（Turn-Taking System）、序列组织（Sequence Organization）、修复机制（Repair）以及机构互动（Institutional Interaction）四大核心领域。适用于医患沟通研究、课堂教学分析、客服对话优化、法庭互动研究、日常会话研究等多种场景。

使用本技能时，分析师必须坚持"描述先于解释"的基本立场，即首先详尽描述会话参与者实际上做了什么，再探讨其背后的社会意义和机制，而非以先入为主的理论预设代替细致的观察描述。

---

## 理论基础

### 经典理论家与核心贡献

**Harvey Sacks (1931-1975)**
美国社会学家，CA 创始人。Sacks 的核心贡献包括：（1）话轮转换系统理论，提出话轮分配的基本规则和选项；（2）成员类属分析（Membership Categorization Analysis, MCA），探讨人们如何运用社会类别组织描述；（3）会话材料的"录音/转写"方法论革命，使细致分析日常对话成为可能。Sacks 的遗著《会话分析讲演集》（Lectures on Conversation, 1992）是该领域的奠基文献。

**Emanuel A. Schegloff (1934-2024)**
美国 UCLA 社会学教授，CA 领域最具影响力的理论家之一。Schegloff 系统发展了序列组织理论，提出邻接对（Adjacency Pair）、扩展序列（Sequence Expansion）和优先解读（Preferred Interpretation）等核心概念。其著作《序列分析导论》（Sequence Analysis, 2007）系统阐述了 CA 的分析单位和方法论原则。Schegloff 还对界面互动（interactions at interface）、电话会话和会话中的索引性（indexicality）进行了深入研究。

**Gail Jefferson (1938-2007)**
英国兰卡斯特大学荣誉研究员，CA 转写体系的主要设计者。Jefferson 创建了至今仍在全球广泛使用的 CA 转写规范，包括话轮重叠标记、停顿计时、笑声编码、语速变化标注等。她的研究涵盖错误和修复、笑话与幽默、会话中的情感表达等主题。《转写手册》（Jefferson, 2004）已成为该领域的标准参考文献。

**John Heritage (1947-)**
英国 UCLA 社会学教授，CA 在机构互动研究领域的主要推手。Heritage 将 CA 方法论系统引入对医疗机构、法庭审讯、新闻采访和客户服务等机构场景的分析，揭示了机构互动中权力不对称、任务导向和身份建构的会话机制。其著作《机构互动》（Interactional Constitution of Institutions, 2012）与 Steven Clayman 合著的《新闻采访中的会话》（Craft of Interviewing）均是该领域的权威文献。

**Jeff Sidnell (1961-)**
多伦多大学社会学教授，《会话分析手册》（The Handbook of Conversation Analysis, 2012）主编之一。Sidnell 的研究涵盖法庭互动、跨文化比较会话分析以及 CA 的认识论和方法论基础，其工作促进了 CA 与语言人类学的深度对话。

---

## 理论框架总览

```
┌─────────────────────────────────────────────────────────────────┐
│                    会话分析 (CA) 理论框架                         │
├─────────────────┬───────────────────────────────────────────────┤
│ 话轮转换系统     │ 话轮构建、话轮分配、转换相关位置 (TRP)           │
│ (Turn-Taking)   │ Sacks, Schegloff & Jefferson (1974)             │
├─────────────────┼───────────────────────────────────────────────┤
│ 序列组织         │ 邻接对、扩展序列、优先/非优先回应                 │
│ (Sequence Org.) │ Schegloff (2007)                                │
├─────────────────┼───────────────────────────────────────────────┤
│ 修复机制         │ 自我/他人发起的 × 自我/他人完成的 修复组合        │
│ (Repair)        │ Jefferson et al.                                │
├─────────────────┼───────────────────────────────────────────────┤
│ 机构互动         │ 医患、课堂、法庭、新闻采访、客服等场景             │
│ (Institutional)  │ Heritage (2012)                                 │
├─────────────────┼───────────────────────────────────────────────┤
│ 多模态分析       │ 手势、注视、空间配置、身体姿态的协调组织           │
│ (Multimodal)    │ Mondada (2019), Goodwin (2000)                  │
└─────────────────┴───────────────────────────────────────────────┘
```

---

## 🖥️ Python 工具

### 工具总览

| 工具文件 | 功能描述 | 核心方法 | CLI 用法示例 |
|---------|---------|---------|------------|
| `turn_taker.py` | 话轮转换分析 | `identify_trp()`, `analyze_turn_allocation()` | `python tools/turn_taker.py --input data/transcript.json --output results/trp.json` |
| `sequence_analyzer.py` | 序列组织分析 | `identify_adjacency_pairs()`, `analyze_preference()` | `python tools/sequence_analyzer.py --input data/transcript.json --output results/sequences.json` |
| `repair_detector.py` | 修复机制识别 | `detect_repairs()`, `classify_repair_type()` | `python tools/repair_detector.py --input data/transcript.json --output results/repairs.json` |

### 转写数据格式要求

所有工具均要求输入 JSON 格式的会话转写文件，格式规范如下：

```json
[
  {
    "speaker": "A",
    "text": "你好，请问今天有什么不舒服？",
    "start_time": 0.0,
    "end_time": 3.5
  },
  {
    "speaker": "B",
    "text": "我这两天一直头疼。",
    "start_time": 3.8,
    "end_time": 6.2
  }
]
```

字段说明：
- `speaker`: 说话人标识符（字符串，不可为空）
- `text`: 话语内容（字符串，不可为空）
- `start_time`: 开始时间（浮点数，单位秒，可选）
- `end_time`: 结束时间（浮点数，单位秒，可选）

### turn_taker.py 详细用法

```bash
# 标准调用
python tools/turn_taker.py --input data/consultation.json --output results/trp_analysis.json

# 输出结构
{
  "trps": [
    {
      "turn_index": 2,
      "position": "end",
      "type": "possible_trp"
    }
  ],
  "allocation": {
    "current_selects_next": 5,
    "next_self_selects": 12,
    "current_continues": 2
  }
}
```

**话轮分配类型说明**：
- `current_selects_next`: 当前说话人通过称呼语或专有名词指定下一说话人
- `next_self_selects`: 无人指定，下一说话人主动接话
- `current_continues`: 当前说话人在转换相关位置继续说话（不构成话轮转换）

### sequence_analyzer.py 详细用法

```bash
python tools/sequence_analyzer.py --input data/interview.json --output results/sequences.json

# 邻接对类型预定义
ADJACENCY_PAIRS = {
    'question-answer': {'first': ['?', '吗', '什么'], 'second': ['是', '不是', '好']},
    'greeting-greeting': {'first': ['你好', '早', 'hi'], 'second': ['你好', '早', 'hi']},
    'request-accept/reject': {'first': ['请', '能', '可以'], 'second': ['好', '行', '不行']}
}
```

**偏好组织分析**：在请求-接受/拒绝邻接对中，直接回应（如"好"、"行"）为优先回应（preferred response）；含延迟标记（如"但是"、"不过"）或解释的回应为非优先回应（dispreferred response）。

### repair_detector.py 详细用法

```bash
python tools/repair_detector.py --input data/therapy.json --output results/repairs.json

# 修复类型四象限
# 自我发起-自我完成 (self-initiated, self-repair)
# 自我发起-他人完成 (self-initiated, other-repair)
# 他人发起-自我完成 (other-initiated, self-repair)
# 他人发起-他人完成 (other-initiated, other-repair)
```

---

## 🚫 绝对禁止原则

> **核心原则**：会话分析强调"描述先于解释"，分析者必须忠实呈现参与者的行为组织，而非以理论预设代替细致观察。

### 六条绝对禁止原则

1. **禁止脱离语境解释话语**
   会话意义具有强烈的情境依赖性。任何话语的解释必须基于其在特定序列位置中的实际使用，而非词典意义或说话人事后的陈述。脱离语境的解释即使在直觉上合理，也与方法论文则相悖。

2. **禁止预设参与者意图**
   CA 分析关注参与者实际上做了什么（what they do），而非他们意图做什么。意图属于参与者的主观心理状态，无法从会话行为本身直接推知。声称某话语反映了某意图需要额外的论证，而非不言自明。

3. **禁止忽视话轮转换细节**
   话轮边界、转换时机、重叠话语、停顿时长等细节本身就构成有组织的行为模式。忽略这些细节意味着忽略会话的核心组织机制。TRP（转换相关位置）的识别是一切后续分析的基础。

4. **禁止跳过转写验证**
   转写是 CA 分析的核心前提。未经良好转写的会话数据无法支持可靠的 CA 分析。转写过程本身即是分析过程，包含对声音、节奏、语调、停顿等副语言特征的系统记录。

5. **禁止过度理论化**
   CA 的核心洞见来自对日常互动的细致描述，而非套用宏观社会学理论。在尚未充分描述参与者的实际行为之前，不应引入功能主义解释、权力分析或意识形态批判等高层次理论框架。

6. **禁止忽视参与者视角**
   CA 方法论的基石之一是"成员方法论"（member's method）：参与者自身运用哪些组织资源来生产可理解的行为？分析者必须从参与者的内部视角（emic perspective）来理解会话，而非从分析者的外部视角（etic perspective）强加解读。

---

## 5️⃣ 五阶段实施流程

### 阶段一：识别（Identify）

**目标**：获取原始会话数据，确定分析边界和场景类型。

**操作步骤**：
1. 收集录音/录像数据，确保获得所有参与者的知情同意
2. 进行完整转写（参照 Jefferson CA 转写规范）
3. 识别会话类型（日常对话、机构对话、多方互动等）
4. 标注说话人、话轮边界和时间戳
5. 确定分析焦点（如特定序列、话轮转换模式或修复机制）

**输入**：原始录音/录像文件，或初步转写稿
**输出**：规范转写文本（含时间标注和副语言特征）

---

### 阶段二：分析（Analyze）

**目标**：运用 CA 核心工具对转写数据进行系统分析。

**操作步骤**：
1. 运行 `turn_taker.py` 识别转换相关位置（TRP）和话轮分配模式
2. 运行 `sequence_analyzer.py` 识别邻接对和序列扩展模式
3. 运行 `repair_detector.py` 识别修复序列及其类型分布
4. 对关键序列进行手动深度标注（如重叠、停顿语调、笑声等）
5. 识别机构互动中的任务导向结构和身份建构机制

**分析工具对照表**：
| 分析维度 | 主要工具 | 补充工具 |
|---------|---------|---------|
| 话轮转换 | turn_taker.py | 手动标注 TRP |
| 序列组织 | sequence_analyzer.py | 手动标注扩展 |
| 修复机制 | repair_detector.py | 四象限分类 |
| 多模态 | — | Goodwin (2000) 框架 |

**输入**：规范转写文本
**输出**：结构化分析结果（JSON 格式，含索引、类型和位置信息）

---

### 阶段三：执行（Execute）

**目标**：将分析结果转化为可理解的研究发现。

**操作步骤**：
1. 解读 TRP 分布模式，联系话轮分配规则进行说明
2. 分析邻接对的优先/非优先回应模式及其社会意义
3. 统计修复类型分布，讨论修复机制在维持互动秩序中的作用
4. 提炼关键发现，选择代表性序列片段作为证据
5. 将技术分析结果转化为非技术受众可理解的语言
6. 生成可视化的序列图（sequence diagram）辅助呈现

**输出**：分析备忘录或初步研究发现报告

---

### 阶段四：验证（Verify）

**目标**：确保分析结果的可靠性和可重复性。

**操作步骤**：
1. 复核所有 JSON 输出文件，确认数据完整性
2. 交叉检查工具输出与手动转写的一致性
3. 对关键发现进行独立复核（同伴验证）
4. 确认分析解释与转写证据的一致性
5. 检查是否存在选择性地忽略不符合预期模式的数据
6. 验证序列解读是否符合 CA 学术规范

**验证清单**：
- [ ] 转写文本已按 Jefferson 规范完成
- [ ] 所有话轮均已标注，无遗漏
- [ ] 工具输出文件大小合理（>1KB）
- [ ] 邻接对识别结果与人工判断一致
- [ ] 修复类型分类逻辑正确
- [ ] 分析解读有转写证据支撑

---

### 阶段五：归档（Archive）

**目标**：规范存储分析过程和结果，支持后续研究复用。

**操作步骤**：
1. 以标准命名规范存储转写文件：`{project}_{date}_{scene}.json`
2. 保存分析结果文件至 `results/` 目录
3. 生成分析日志，记录分析决策过程
4. 编写数据字典，说明字段含义和编码规则
5. 如涉及机构数据，确认脱敏处理和伦理审批记录
6. 撰写分析报告，包含方法、发现和局限性说明

**输出**：归档数据包（含原始数据、转写、分析结果、报告）

---

## ✅ 质量标准

### 完整性标准

| 检查项 | 最低要求 | 理想标准 |
|--------|---------|---------|
| 转写覆盖率 | 所有话轮100%转写 | 含副语言特征完整标注 |
| TRP 识别 | 所有潜在 TRP 标注 | 区分强/弱 TRP |
| 邻接对识别 | 主要类型全覆盖 | 考虑语境细分 |
| 修复分析 | 类型四象限均有覆盖 | 含频率统计 |
| 机构分析 | 识别任务结构 | 揭示权力不对称 |

### 方法论标准

1. **忠实性**：分析解释必须忠实于转写证据，禁止脱离语境地解读
2. **系统性**：运用 CA 核心概念（Sacks 等人传统）而非替代性理论框架
3. **可重复性**：分析过程和结果必须可被其他受过训练的分析师复现
4. **描述优先**：坚持"先描述、后解释"的基本立场
5. **成员视角**：从参与者内部视角理解行为，而非从外部强加判断

### 深度标准

- **基础层**：完成转写、识别 TRP、标注邻接对
- **进阶层**：分析偏好组织、修复机制类型分布、序列扩展模式
- **深度层**：揭示机构互动中的权力不对称和身份建构机制
- **综合层**：将微观会话分析与宏观社会理论对话

---

**技能版本**: 5.0.0-cli-native+agent
**方法论严谨性**: 0%妥协
**最后更新**: 2026-04-04