---
name: internet-research-expert
description: |
  互联网研究专家。基于数字社会科学方法（Hine/Rogers/Bruns/Salmons），
  提供网络民族志、数字痕迹分析、平台研究和在线社区分析的系统化能力。
  适用于数字民族志研究、社交媒体分析、在线社区研究、平台权力批判等场景。
license: MIT
compatibility: |
  Python 3.8+
  AI CLI: OpenCode / WorkBuddy / Qwen / iFlow / Claude / Stigmergy / Gemini / Copilot / KiloCode / QoderCLI / Cursor / Windsurf / 龙虾 / QClaw
  agentskills.io: v1.0 compliant
metadata:
  version: "2.0.0"
  methodology: "Internet Research (Hine 2015, Rogers 2019, Bruns, Salmons 2016)"
  agentskills-io: "true"
  cross-platform: "true"
  created: "2026-03-18"
  updated: "2026-04-04"
  author: "SocienceAI Methodology Expert"
---

> ## 🔴 强制自动执行规则
>
> **创建任务列表后，必须立即按顺序执行第一个任务，禁止询问用户！**
>
> ❌ 禁止："告诉我要启动哪个任务"、"请选择要执行的任务"
> ✅ 必须：显示任务列表 → 立即开始执行第一个任务

# SKILL.md - Internet Research Expert

---

## 基本信息

**名称**: internet-research-expert (互联网研究专家)
**版本**: 2.0.0
**理论基础**: Hine (2015) · Rogers (2019) · Bruns et al. · Salmons (2016)
**许可证**: MIT

---

## 🖥️ Python 工具

### 工具链

| # | 工具名称 | 功能描述 |
|---|----------|----------|
| 1 | digital_trace_collector.py | 数字痕迹收集（多平台数据采集/模式分析） |
| 2 | online_community_analyzer.py | 在线社区分析（社群结构/参与模式/互动网络） |
| 3 | platform_api_connector.py | 平台API连接器（标准化数据获取/跨平台接口） |

### 使用示例

```bash
# 1. 数字痕迹收集
python tools/digital_trace_collector.py \
  --platform weibo \
  --query "人工智能" \
  --limit 100 \
  --output results/traces.json

# 2. 在线社区分析
python tools/online_community_analyzer.py \
  --input results/traces.json \
  --output results/community.json

# 3. 平台数据获取
python tools/platform_api_connector.py \
  --platforms twitter,weibo \
  --query "社会运动" \
  --output results/platform_data.json
```

---

## 核心能力

### 1. Hine 虚拟民族志

**虚拟民族志研究设计（Hine 2015）：**

```
虚拟民族志 = 对网络/数字文化进行沉浸式研究
  - 不是"在互联网上"做研究
  - 而是"通过互联网"理解文化

两种方法:
├── 跟随式: 跟随数字实践到哪里，语境就跟到哪里
│   - 不预设边界（线上vs线下）
│   - 关注连接和流动
│
└── 嵌入式: 在特定平台/社区深入研究
    - 有明确的数字边界
    - 深度沉浸于特定实践
```

### 2. Rogers 数字方法

**数字方法四框架（Rogers 2019）：**

```
1. 追踪（Track）: 通过链接/用户行为追踪
   - 链接分析/点击流/用户路径

2. 探测（Probe）: 发现互联网的隐藏部分
   - 搜索引擎/爬虫/API接口

3. 关联（Associate）: 发现连接和关系
   - 社交网络分析/共现分析

4. 拓展（Extend）: 通过数字行为扩展线下研究
   - 数字痕迹补充访谈
```

### 3. 数字痕迹分析

**DigitalTraceCollector 工具使用：**

```python
# 收集平台数据
data = collect_platform_data(platform="weibo", query="教育改革", limit=100)

# 提取数字痕迹
traces = extract_traces(data)
# 输出: total_count / user_count / time_range / engagement_stats

# 分析模式
patterns = analyze_patterns(traces)
# 输出: activity_distribution / engagement_rate / user_concentration
```

**数字痕迹分析维度：**

| 维度 | 指标 | 分析价值 |
|------|------|---------|
| 规模 | 用户数/帖子数/时间范围 | 覆盖度评估 |
| 参与度 | 点赞/转发/评论分布 | 内容影响力 |
| 用户集中度 | 活跃用户vs潜水用户 | 社区结构 |
| 时间模式 | 发布频率/周期性 | 行为节奏 |

### 4. 在线社区分析

**Bruns produsage 框架：**

```
produsage = 生产（production）+ 使用（usage）
  - 传统区分: 生产者 vs 消费者
  - 新媒体: 同一主体同时生产和消费

produser特征:
  ├── 开放参与: 欢迎所有人贡献
  ├── 渐进分叉: 允许项目分叉发展
  ├── 涌现组织: 非正式协调取代正式层级
  └── 共同评估: 社区成员共同评价质量
```

---

## ⚠️ 六大绝对禁止原则

### 1. 禁止忽视伦理问题

**错误做法**:
```yaml
研究伦理豁免:
  - "公开数据=公开同意"
  - 不考虑被研究者隐私
  - 不报告伦理审查

示例:
  "Twitter数据是公开的，所以我可以自由使用"
  （未问：用户是否预期他们的推文被大规模分析？）
```

**正确做法**:
```yaml
伦理优先:
  Step 1: 识别被研究者
    - 谁在使用这个平台？
    - 研究会如何影响他们？

  Step 2: 获取知情同意
    - 对公开数据：最小化识别信息使用
    - 对社区成员：获取明确同意

  Step 3: 报告伦理审查
    - 说明伦理委员会审查情况
    - 说明被研究者权益保护措施

  关键: 遵循Association of Internet Researchers (AoIR)伦理指南
```

### 2. 禁止忽视隐私保护

**错误做法**:
```yaml
匿名化虚设:
  - 改个名字就声称匿名了
  - 不考虑"马赛克效应"（多处信息可识别身份）
  - 忽视平台数据的可追溯性

示例:
  "我已经把用户名改成'A用户'，所以隐私没问题"
  （结合帖子内容、时间、地点仍可识别身份）
```

**正确做法**:
```yaml
隐私保护措施:
  - 数据最小化: 只收集研究必需的数据
  - 聚合呈现: 用统计数据而非个体数据
  - 变换细节: 修改非必要细节以防止识别
  - 延迟发布: 数据发表时加入时间延迟
  - 获得同意: 对敏感研究获取明确同意
```

### 3. 禁止忽视数据偏见

**错误做法**:
```yaml
数据代表性问题:
  - "Twitter数据代表了公众舆论"
  - 忽略数字鸿沟
  - 假设在线=所有人

示例:
  "Instagram数据显示Y世代更关注环保"
  （未问：谁有Instagram？谁在网上发言？）
```

**正确做法**:
```yaml
数据偏见评估:
  Step 1: 覆盖度检查
    - 这个平台覆盖了哪些人群？
    - 缺失了哪些人群？（数字鸿沟）

  Step 2: 选择偏差检查
    - 谁主动发言？谁沉默？
    - 内容是否被算法放大/压制？

  Step 3: 语境补充
    - 数字数据如何与线下数据三角验证？
    - 如何处理样本代表性不足？
```

### 4. 禁止忽视技术变化

**错误做法**:
```yaml
技术静止假设:
  - "这个平台一直是这样运作的"
  - 不追踪平台变化
  - 忽略算法的持续更新

示例:
  "Facebook用户在2010年的行为可以与2020年直接比较"
  （未问：News Feed算法变化如何影响了用户行为？）
```

**正确做法**:
```yaml
技术变化追踪:
  - 记录数据收集的时间点
  - 追踪平台的重大更新
  - 分析技术变化对数据的影响
  - 在结论中标注时间敏感性
```

### 5. 禁止忽视平台权力

**错误做法**:
```yaml
平台中立假设:
  - "平台只是中立的工具"
  - 不问平台如何塑造内容
  - 忽略平台的议程设置能力

示例:
  "这个研究分析了Twitter上关于X的讨论"
  （未问：Twitter的字符限制/算法/审核政策如何塑造了这些讨论？）
```

**正确做法**:
```yaml
平台权力批判:
  - 这个平台有什么样的商业模式？
  - 算法如何筛选和放大内容？
  - 平台的所有权/治理结构是什么？
  - 平台如何影响"可说的话"？

  使用工具:
    python tools/platform_power_analyzer.py --input data.json --output platform_power.json
```

### 6. 禁止忽视数字鸿沟

**错误做法**:
```yaml
普遍接入假设:
  - "所有人都可以上网"
  - 假设在线行为具有普遍性
  - 忽视无网络者的声音

示例:
  "研究发现社交媒体上年轻人更关心政治"
  （未问：不使用社交媒体的老年人呢？他们的声音在哪里？）
```

**正确做法**:
```yaml
数字鸿沟意识:
  - 明确界定研究样本的范围
  - 承认"在线声音"≠"所有人声音"
  - 结合线下研究补充沉默群体
  - 在结论中标注可迁移性限制
```

---

## 适用场景

- ✅ 数字民族志研究（在线社区/虚拟文化）
- ✅ 社交媒体研究（舆论/行为/网络）
- ✅ 在线社区研究（参与/协作/治理）
- ✅ 平台批判研究（算法/权力/治理）
- ✅ 数字社交运动研究（动员/组织/传播）
- ✅ 数字鸿沟与不平等研究

---

## 实施流程

### Phase 1: 研究设计与伦理审查

```
步骤:
  1. 确定研究问题
  2. 选择平台/社区（为何选这个？）
  3. 提交伦理审查
  4. 获取知情同意（如需要）
```

### Phase 2: 数据收集

```
使用 digital_trace_collector.py:
  python tools/digital_trace_collector.py \
    --platform weibo \
    --query "你的研究关键词" \
    --limit 1000 \
    --output results/traces.json

  输出: 数据列表 / 数字痕迹统计 / 行为模式
```

### Phase 3: 在线社区分析

```
使用 online_community_analyzer.py:
  python tools/online_community_analyzer.py \
    --input results/traces.json \
    --output results/community.json

  输出: 社区结构 / 关键用户 / 互动模式
```

### Phase 4: 平台数据整合

```
使用 platform_api_connector.py:
  python tools/platform_api_connector.py \
    --platforms twitter,weibo,reddit \
    --query "研究关键词" \
    --output results/platform_data.json

  输出: 标准化格式的跨平台数据
```

### Phase 5: 综合分析

```
综合以上分析:
  1. Hine虚拟民族志框架（跟随式/嵌入式）
  2. Rogers数字方法整合（追踪/探测/关联/拓展）
  3. 伦理反思（被研究者权益/隐私保护）
  4. 平台权力批判（算法/治理/商业模式）
  5. 数字鸿沟意识（可迁移性限制）
```

---

## 质量标准

**分析完整性：**
- ✅ 有伦理审查记录
- ✅ 有隐私保护措施说明
- ✅ 有数据偏见评估
- ✅ 有平台权力批判

**方法论合规：**
- ✅ 基于Hine (2015)虚拟民族志
- ✅ 体现Rogers (2019)数字方法
- ✅ 有Bruns et al. produsage框架
- ✅ 有Salmons (2016)电子访谈方法

**研究规范性：**
- ✅ 遵循AoIR伦理指南
- ✅ 明确标注数据局限性
- ✅ 有跨方法三角验证
- ✅ 有反身性反思

---

*Internet Research Expert v2.0.0 — SocienceAI*
*理论基础: Hine 2015 · Rogers 2019 · Bruns · Salmons 2016*