研究生工作坊讲义

从检索到 research gap:AI Agent 辅助文献综述工作流

本手册说明如何用指定文献库、PRISMA-lite 流程和多 Agent 分工,生成一版可检查、可回溯的初步文献综述,并把结论收束到 research gap。

检索结果先成为材料题名、摘要、关键词和元数据需要经过筛选与整理。
gap 来自比较文献矩阵、主题结构和证据边界共同支持 gap 判断。
PRISMA-lite 是训练框架这里训练流程记录和证据边界,不替代正式 PRISMA 2020。
BLOCK 01

使用说明:从检索到 research gap

这份手册处理一个具体问题:如何把一批检索到的文献,整理成一条有依据的 research gap 判断链。

research gap 要有材料依据。它来自文献筛选、信息抽取、主题比较和人工确认。
检索结果 文献库 纳入 / 排除 文献矩阵 主题聚类 共识与分歧 research gap 后续研究问题
从文献库到初步综述和展示的流程总览

交付物

交付物作用检查重点
criteria.md记录研究问题、纳入标准、排除标准问题是否具体,标准是否可执行
literature_inventory.md说明文献库数量、字段和材料边界是否只基于指定文献库作判断
screening_table.md记录每篇文献的纳入 / 排除理由理由是否能回到 RQ 和标准
synthesis_matrix.md整理主题、方法、数据、结论和局限是否已经做跨文献比较
research_gaps.md提出 gap 候选及其证据依据每个 gap 是否能回到文献矩阵
mini_review.md形成初步综述和后续研究问题结论是否克制,边界是否清楚
BLOCK 02

文献综述概述:为什么需要流程

文献综述围绕一个问题、概念、理论或方法,对已有研究进行识别、筛选、评价、综合和解释。合格的综述需要跨文献比较,不能停留在逐篇摘要。

不同综述类型的差异,主要体现在问题类型、检索强度、纳入标准、质量评价、合成方式和结果形态。先判断“要回答什么问题”,再选择合适的综述类型。类型选错,后面的检索、筛选和写作都会变形。

常见综述类型及适用场景

类型主要目的适合的问题方法要求常见结果形态
系统综述(systematic review)用预先设定的方法回答聚焦问题,尽量降低选择偏倚某种干预是否有效、某类因素是否相关、某种方法是否可靠明确 RQ、检索式、数据库、纳入 / 排除标准、筛选流程和质量评价PRISMA 流程图、研究特征表、偏倚风险表、叙述综合或统计合成
元分析(meta-analysis)在研究可比时,对量化结果进行统计合并多个研究是否可以合并出总体效应量需要可比结局、统一效应指标、异质性处理和发表偏倚检查森林图、漏斗图、敏感性分析、亚组分析
快速综述(rapid review)在时间受限下形成相对可靠的证据摘要政策、管理或实践场景中需要较快判断的问题可以简化数据库数量、筛选方式或灰色文献检索,但需要说明简化步骤和可能偏倚证据摘要、简化流程表、限制说明
范围综述(scoping review)描绘研究范围、概念边界、研究类型和缺口主题较新、概念不清、研究分散,还不适合直接回答效果问题问题通常较宽,检索可迭代,纳入文献类型可更广;质量评价不一定是必需步骤证据地图、分类表、主题分布、研究空白清单
叙述性综述(narrative review)围绕主题、机制、争议或发展脉络解释已有研究需要理解一个领域如何发展、有哪些主要争论不一定追求穷尽检索,但应说明主题边界、资料来源、选择逻辑和综合框架主题段落、理论脉络、概念框架
理论综述(theoretical review)比较、整合、修正或生成理论解释同一现象存在多种理论解释,或概念关系尚不清楚纳入对象可能包括理论文本、经典论文和跨学科文献;重点在概念路径可追溯理论比较表、概念模型、命题体系
方法综述(methodological review)审视研究设计、测量、抽样、分析和报告实践需要了解某领域通常怎样做研究,方法上有哪些缺陷需要清楚的编码规则、变量定义、方法类别和可复核表格方法矩阵、编码表、规范建议
批判性综述(critical review)评价并挑战已有假设,提出新的解释或命题领域已有共识需要重新审视,或主流解释存在明显限制需要公平呈现相反证据,批评应建立在文献比较上批判矩阵、论证链、概念模型或新命题

容易混淆的几组概念

概念容易混淆的地方本手册采用的处理方式
系统综述与元分析系统综述是一套证据综合设计;元分析只是可能使用的统计合成方法。没有统计合并,也可以是系统综述。保留系统综述的筛选记录思路,不做元分析。
系统综述与范围综述系统综述通常回答聚焦问题;范围综述用于摸清概念、范围、类型和缺口。范围综述有独立功能,不能当作系统综述的简化版。先用系统综述的透明流程整理材料,再用范围综述的思路理解 gap。
快速综述与随意简化快速综述可以压缩步骤,但要说明压缩了什么,以及可能带来什么偏倚。所有简化都写进材料边界和 review check。
叙述性综述与资料堆积叙述性综述不等于随意选文献。它仍需要主题边界、选择逻辑和综合框架。初步综述可以采用叙述性表达,但每个判断仍要回到文献 ID。
gap 与泛泛建议“未来应加强研究”这类笼统表述不足以构成 research gap。gap 应说明缺什么、为什么缺、依据是什么。每条 gap 都要对应文献矩阵中的对象、场景、方法、数据、理论或结论字段。

写作结构与评价要点

多数综述都需要交代研究背景、问题、方法、结果或综合、讨论和局限。不同类型的侧重点不同:系统综述看方法透明度,范围综述看分类和边界,叙述性综述看论证连贯性,理论综述看概念整合,方法综述看编码规则,批判性综述看证据是否支持批评。

评价维度检查问题常见问题
研究问题与类型匹配题目、研究对象、问题和综述类型是否一致题目像系统综述,实际只是叙述性总结
检索与纳入边界数据库、关键词、时间范围、纳入 / 排除标准是否可审查只写“检索相关文献”,没有具体过程
评价标准是否使用合适的质量评价或批判标准;若不做正式评价,是否说明理由生搬硬套评价工具,或完全没有评价口径
综合深度是否形成主题、比较、分歧和局限,是否超越逐篇摘要结果部分变成文献清单
结论边界结论是否与材料范围一致,是否说明局限把少量文献写成整个领域的趋势
可复核性是否保留筛选表、矩阵、检索记录和排除理由只留下最终文字,无法回看判断过程

这里使用的 PRISMA-lite

PRISMA-lite 是本手册采用的简化训练方案。它借用 PRISMA 的流程记录方式,保存文献来源、筛选过程、排除理由和纳入结果。更准确的成果表述是:基于指定文献库的 PRISMA-lite 初步综述训练。它可以训练过程意识和证据边界,但不能写成完整系统综述,也不替代投稿时需要遵循的 PRISMA 2020。

research gap 从哪里来

gap 类型判断问题需要回到什么材料
对象 gap哪些研究对象很少被讨论?文献对象字段、样本描述
场景 gap哪些地区、行业、教学平台或使用情境缺少研究?研究情境、数据来源、案例区域
方法 gap现有研究是否集中使用少数方法?方法字段、数据类型、分析技术
数据 gap是否缺少长期数据、实证数据或对比数据?数据字段、样本规模、研究设计
理论 gap现有研究是否只是描述现象,缺少解释框架?理论框架、概念模型、机制解释
结论 gap文献之间是否存在明显分歧?主要发现、局限、讨论部分
实践 gap研究结论是否难以转化为教学、政策或工具设计?应用建议、实践场景、实施条件
BLOCK 03

AI Agent 概述:把判断过程拆开

Agent 的作用是把任务分解、保存过程、写清理由。研究判断仍然需要人工复核。

普通聊天窗口的问题

普通聊天可以解释概念、改写段落和总结材料,但它通常不会自动保存文献来源、处理步骤、筛选理由和人工确认记录。

Agent 工作流的目标

Agent 工作流把输入、规则、工具、输出和人工确认放在同一个项目中。这样做的目的,是让综述过程可以回看、可以检查、可以修订。

从普通聊天窗口转向可追踪 Agent 工作流

本手册中的 Agent 构成

Agent = 对话模型 + 项目文件 + 可用工具 + 任务规则 + 人工确认
Prompt、Agent、Skills 和 Workflow 的关系

多 Agent 分工

角色主要任务不能替代人的部分
Orchestrator调度流程,确保不跳过筛选、复核和综合不能自行决定研究目标
Screener根据 RQ 和标准做初步纳入 / 排除判断不能把低相关文献强行纳入
Critic质疑筛选结果,检查方法、相关性和过度结论不能为了反对而机械反对
Arbiter综合 Screener 和 Critic 意见,做最终裁决需要保留不确定性说明
Synthesizer形成主题结构、共识、争议和 gap 候选不能逐篇摘要代替综合
PRISMA 统计 Agent统计 identified、screened、excluded、included数字要与筛选表一致
BLOCK 04

AI Agent 辅助文献综述工作流

这一部分是主线:从检索结果进入文献库,再通过筛选、抽取和比较,最后收束到 research gap。

检索结果 → 文献库 → PRISMA-lite 筛选 → 文献矩阵 → 主题聚类 → 共识 / 分歧 / 局限 → research gap → 后续研究问题
从主题收窄到成果展示的判断链

七步流程

步骤人工任务Agent 任务输出确认点
1. 明确问题写 RQ、纳入标准、排除标准帮助收窄问题,检查标准是否可执行criteria.mdRQ 是否具体,标准是否能用于筛选
2. 整理文献库准备题名、摘要、关键词和元数据检查字段完整性,生成材料概览literature_inventory.md文献数量和字段是否支持当前任务
3. 筛选文献确认纳入 / 排除判断Screener 初筛,Critic 质疑,Arbiter 裁决screening_table.md排除理由是否清楚,误纳入是否被发现
4. 抽取信息确认抽取字段和表格口径提取对象、方法、数据、结论、理论和局限synthesis_matrix.md字段是否一致,是否遗漏关键证据
5. 主题聚类判断主题命名是否合理归纳 3–5 个主题,比较共识和分歧theme_structure.md主题是否过宽,文献是否错分
6. 形成 gap检查 gap 与证据的对应关系生成 gap 候选,标注文献依据和不确定性research_gaps.mdgap 是否能回到文献矩阵
7. 写初稿审查表达边界和引用依据生成 mini review、abstract 和后续问题mini_review.md是否避免把本次文献库写成整个领域

从矩阵到 gap 的判断方式

矩阵中看到的现象可以推导的 gap 候选不能直接写成什么
多数文献集中在同一类对象其他对象研究不足整个领域完全忽视其他对象
研究方法高度集中方法多样性不足,缺少对比研究现有研究方法都不可靠
多篇文献承认数据时间短长期数据和追踪研究不足所有结论都没有价值
主题之间结论不一致存在解释分歧,需要更细分情境领域没有共识
应用建议多,但实证检验少实践转化证据不足这些建议都不可行
BLOCK 05

OpenCode 入门:进入项目与常用指令

初次使用 Agent 时,先不用记全部命令。先把三个动作做对:进入正确项目、连接模型、让 Agent 先读项目并给出计划。

OpenCode 是执行环境。研究判断仍由使用者负责。所有操作都应发生在当前项目文件夹中,输出也应保存为可回看的过程文件。

第一次启动:按顺序检查

顺序操作检查点
1在 VS Code 中打开本组项目文件夹左侧能看到 AGENTS.mdliterature_library/outputs/
2打开 VS Code 内置终端终端路径位于当前项目文件夹,不在桌面或其他目录
3运行 opencode --version能显示版本号;如果无法识别命令,说明 OpenCode 尚未安装或环境变量未生效
4运行 opencode终端进入 OpenCode 对话界面
5输入 /connect选择 DeepSeek 等模型服务商,并粘贴 API Key
6输入 /models选择课程指定模型
7先发只读任务要求 Agent 只读取项目结构、复述文件内容,不修改文件
opencode --version
opencode
/help
/connect
/models
第一条任务建议:请先只读取当前项目结构,说明有哪些文件夹和关键文件,不要修改任何文件。请确认你理解本项目用于“基于指定文献库做 PRISMA-lite 初步综述训练”。

Plan、Build 与 Review

使用 OpenCode 时,先让它分析材料、列计划、指出风险;确认后,再让它生成文件或修改内容。完成后检查输出文件和表达边界。

OpenCode 计划模式和执行模式的使用关系
阶段适合做什么操作提醒
Plan读取项目结构、分析任务、列步骤、指出风险先看计划是否理解了材料范围,不急着让它动手
Build生成 md 文件、整理表格、运行脚本、修改 HTML只有确认范围后再执行;完成后检查输出文件和改动内容
Review查看输出、检查证据边界、收窄过强判断所有结论都要回到本次文献库,不写成整个领域结论

常用斜杠指令

斜杠指令用于控制 OpenCode 本身。文献综述任务仍写成普通 prompt。常用指令先记下面这些,遇到问题再用 /help 查看完整说明。

指令用途什么时候用
/help查看 OpenCode 可用命令不知道下一步能做什么时先输入
/connect连接模型服务商和 API Key第一次配置 DeepSeek 或更换服务商时使用
/models查看或切换模型连接成功后选择课程指定模型
/init创建或更新 AGENTS.md项目还没有规则文件,或需要补充项目规则时使用
/new开启新会话换任务、旧上下文太乱,或开始新阶段时使用
/sessions查看并切换历史会话需要回到之前的任务记录时使用
/compact压缩长对话,生成阶段摘要对话很长、模型开始遗漏前文时使用
/details查看 Agent 做过哪些步骤或调用了哪些工具想知道它是否读了文件、运行了命令时使用
/undo回退上一轮改动发现 Agent 改错文件或输出方向明显不对时使用
/redo恢复刚才撤销的改动误撤销后使用
/export导出当前会话过程需要保存操作记录或课后复盘时使用
/exit退出 OpenCode完成本轮操作后退出
OpenCode 常用斜杠命令

本手册建议的安全说法

场景推荐说法不建议的说法
刚进入项目请只读取项目结构并复述,不要修改文件。请直接完成整个综述。
生成过程文件请生成 literature_inventory.md,并说明依据来自哪些字段。帮我写一个领域综述。
需要修改输出请基于当前矩阵改写 research gap,只保留能回到文献编号的判断。请直接润色 gap,不用管文献编号。
发现错误先查看输出文件和 /details,必要时用 /undo连续追问,让错误沿着流程继续扩大。
BLOCK 06

操作流程:生成一版可检查成果

操作重点是保留过程记录。每一步都要看清输入、输出和需要人工确认的地方。

准备材料

  • 每组准备 15–25 篇相关文献,优先使用题名、摘要、关键词和基本元数据。
  • 统一文献 ID,例如 P01P02P03
  • 初步写出 1 个研究问题、3–5 条纳入标准和 3–5 条排除标准。
  • PDF 可作为备查材料,不建议作为现场操作的唯一输入。

实操流程

顺序内容产出
1确认从检索到 research gap 的完整路径任务理解
2文献综述类型与 PRISMA-lite 边界RQ 和标准初稿
3AI Agent 与多 Agent 分工Agent 角色理解
4文献库摸查与 Screener 初筛screening_table.md
5Critic 复核与 Arbiter 裁决included_studies.md
6文献矩阵与主题聚类synthesis_matrix.mdtheme_structure.md
7生成 research gap 和初步综述research_gaps.mdmini_review.md
8检查与展示review_check.md

项目文件夹建议

literature-review-workshop/
├── AGENTS.md
├── literature_library/
│   ├── metadata.csv
│   ├── abstracts.md
│   └── pdfs/
├── prompts/
├── outputs/
│   ├── criteria.md
│   ├── literature_inventory.md
│   ├── screening_table.md
│   ├── included_studies.md
│   ├── synthesis_matrix.md
│   ├── theme_structure.md
│   ├── research_gaps.md
│   ├── mini_review.md
│   └── review_check.md
└── scripts/

工具配置提示

可使用 OpenCode、Codex 或 Claude Code。工具只是执行环境。关键是让 Agent 在同一个项目文件夹中读取材料、保存输出,并在关键节点暂停等待确认。OpenCode 的启动、模式和常用指令见上一节。

BLOCK 07

Prompt 模板与成果检查

Prompt 放在最后使用。先准备问题、标准和材料,再调用 Agent。边界不清时,不要让 AI 直接写综述。

统一输入模板

研究问题(RQ):

纳入标准:
1.
2.
3.

排除标准:
1.
2.
3.

文献字段:
- 文献 ID
- 作者和年份
- 标题
- 摘要
- 关键词
- 方法
- 数据或案例

限制:
- 只基于本次指定文献库作判断。
- 不把初步发现写成本领域总体结论。
- 每个主要判断都要能回到文献 ID。
Orchestrator Prompt
你是系统综述工作流调度器。请协调多个 Agent 完成一版 PRISMA-lite 初步综述。

请按以下顺序执行:
1. 读取研究问题、纳入标准、排除标准和文献库。
2. 调用 Screener 对每篇文献做初步纳入 / 排除判断。
3. 调用 Critic 检查筛选结果,指出可能的误纳入、误排除和方法问题。
4. 调用 Arbiter 综合前两步意见,形成最终纳入清单。
5. 调用 Synthesizer 对纳入文献做主题归类和综合。
6. 输出 PRISMA-lite 统计、主题结构、research gap 候选和初步综述大纲。

要求:
- 不允许直接跳到最终结论。
- 每一步都要保存输出文件。
- 不确定的判断单独标注。
Screener Prompt
你是系统综述的文献筛选 Agent。

任务:
根据研究问题、纳入标准和排除标准,判断每篇文献是否应该进入本次 PRISMA-lite 初步综述。

输出字段:
- 文献 ID
- 纳入 / 排除 / 不确定
- 判断理由 1–3 条
- 与 RQ 的匹配度:高 / 中 / 低
- 初步主题标签

要求:
- 只做初步筛选,不写综述结论。
- 排除理由要具体,不能只写“不相关”。
- 如果信息不足,标为“不确定”,不要强行判断。
Critic Prompt
你是系统综述的批判性复核 Agent。

任务:
复核 Screener 的筛选结果,检查是否存在误纳入、误排除、方法学弱点或与 RQ 不匹配的问题。

输出字段:
- 文献 ID
- 对 Screener 判断的意见
- 可能问题:相关性 / 方法 / 数据 / 理论 / 结论边界
- 是否建议修改判断:是 / 否 / 不确定
- 修改理由

要求:
- 保持严格,但不要为了反对而反对。
- 如果没有发现关键问题,也要说明“暂未发现推翻理由”。
- 所有质疑都要基于文献字段和本次标准。
Arbiter Prompt
你是系统综述的裁决 Agent。

任务:
综合 Screener 和 Critic 的意见,对每篇文献做最终纳入、排除或暂缓判断。

裁决原则:
1. 与 RQ 的匹配度优先。
2. 纳入标准和排除标准优先于文字表面相关。
3. 方法或数据缺陷会影响使用方式,但不一定直接排除。
4. 保留不确定性。

输出字段:
- 文献 ID
- 最终决定:纳入 / 排除 / 暂缓
- 裁决理由
- 可用于哪些主题
- 不确定性说明
Synthesizer Prompt
你是文献综述主题综合 Agent。

任务:
只基于最终纳入文献,归纳 3–5 个主题,并形成 research gap 候选。

每个主题需要包含:
- 主题名称
- 主题定义
- 对应文献 ID
- 共识
- 分歧
- 方法或数据局限
- 可推导的 gap 候选

要求:
- 不逐篇摘要。
- 需要做跨文献比较。
- 每个 research gap 都要标注文献依据。
- 不能把本次文献库发现写成整个领域的最终判断。
research gap 检查 Prompt
请检查以下 research gap 候选是否成立。

检查标准:
1. 是否有文献矩阵依据,是否存在凭空生成的内容。
2. 是否能对应具体文献 ID。
3. 是否说明了 gap 类型:对象、场景、方法、数据、理论、结论或实践。
4. 是否避免过度概括。
5. 是否可以转化为后续研究问题。

请输出:
- 保留的 gap
- 需要改写的 gap
- 应删除的 gap
- 每条修改理由

最终成果检查清单

  • RQ 是否足够具体。
  • 纳入标准和排除标准是否能执行。
  • 筛选表是否记录每篇文献的理由。
  • PRISMA-lite 数字是否与表格一致。
  • 文献矩阵是否包含方法、数据、发现和局限。
  • 主题是否来自多篇文献比较。
  • research gap 是否能回到文献 ID。
  • 初步综述是否避免过度概括。
  • 每个后续研究问题是否对应至少一个 gap。
  • 最终展示是否说明本次材料边界。
最后检查这一点:如果一个 research gap 不能回到文献矩阵,就不能作为本次综述的正式结论。