思维链 CoT：通过中间步骤激发模型推理能力

FreeGuideOnline 最新 2026-06-14

引言：从“直接回答”到“展示思考”

你是否曾遇到这样的情形：向大语言模型提出一个复杂的数学题、逻辑谜题或需要多步推理的问题，模型却直接给了一个错误答案？这并非模型“不够聪明”，而是它缺少了中间推理步骤的引导。思维链（Chain-of-Thought，CoT）正是为解决这一问题而生——它通过示范或引导模型生成推理过程片段，大幅提升其在复杂任务上的准确性。本教程将带你从零开始，理解思维链的原理、用法、变体和最佳实践。

什么是思维链？

思维链 Prompting 是一种提示工程技巧，核心思想是：在向模型提问时，不要求它直接输出最终答案，而是要求它先输出一系列自然的、语言表述的中间推理步骤，最后再给出结论。这种“逐步思考”的格式能够激活模型的潜在推理能力，显著提升算术推理、常识推理和符号运算等任务的正确率。

简单类比：就像你在解数学应用题时会先在草稿纸上写下过程，思维链要求模型把这种“草稿”显式地说出来。

为什么思维链有效？

分解复杂问题
将一个大问题拆解为多个小步骤，每一步都更简单，模型更容易处理。
状态追踪与错误纠正
中间步骤让模型有机会在生成下一步时引用之前的正确信息，发现并修正潜在错误。
从少量示例中泛化
在少样本（Few-shot）设置下，提供几个带有推理链条的示例，模型就能学会“展示思考”的模式，并泛化到新问题上。
人类可解释性
透明的推理过程让结果更容易验证、错误更容易定位，增强了用户对模型的信任。

思维链的基本范式

1. Few-shot CoT（少样本思维链）

这是最经典的样式：在提示中给出若干问题、推理过程、答案的完整示例，然后提出新问题让模型延续这种模式。

示例提示模板：

问题：罗杰有5个网球。他又买了2罐网球，每罐有3个。他现在有多少个网球？
推理：罗杰开始有5个球。2罐每罐3个，总共是2×3=6个网球。5+6=11。最终答案是11。
问题：食堂有23个苹果，如果用了20个来做午餐，又买了6个，现在有多少个苹果？
推理：

模型会尝试模仿示例的推理格式，输出类似：

食堂原来有23个苹果。用掉20个，剩下23-20=3个。又买了6个，所以3+6=9。最终答案是9。

2. Zero-shot CoT（零样本思维链）

你甚至不需要提供示例，只需在问题末尾添加一句触发器，如 “让我们一步一步地思考” 或 “请逐步推理”，即可让模型产生思维链。

示例：

一个长方形的长是宽的2倍，周长是36厘米，求面积。让我们一步一步地思考。

模型会自行进行分析、列方程、求解并计算面积。研究表明，这类简单措辞就能唤醒模型的结构化推理能力。

3. 自洽性采样（Self-Consistency）

单一思维链有时会出错，而自洽性采样是一种增强策略。它让模型生成多条不同的推理路径（通过调节温度等采样参数），然后对最终答案进行多数投票。由于推理过程多样化，正确的推理往往在最终答案上趋于一致，这能进一步提高准确率，尤其适合有精确答案的数学题。

动手实践：手写一个思维链提示

场景：货币单位换算

假设你有一个 Few-shot 提示，旨在让模型学会人民币元、角、分的换算。

提示示例：

问题：小明有3元5角，买笔花了1元2角，还剩多少钱？
推理：先将所有金额统一为角：3元5角=35角，1元2角=12角。花掉后剩余35-12=23角。23角=2元3角。最终答案是2元3角。
问题：小红有5张1元，3张5角，一共是多少元？
推理：

你可以试着补全这个提示，然后交给模型，观察它是否会按照相同格式输出推理过程。

进阶技巧：思维链的变体与应用

1. 思维树

将推理过程展开为一棵树状结构，在每个步骤探索多个可能的思路分支，然后通过搜索/评估选择最佳路径。这适用于需要规划和前瞻的任务，如创意写作或策略游戏。

2. 思维图

比树更灵活，允许不同思路彼此交叉引用和合并，形成图网络。用来处理更开放、需要多角度交叉验证的复杂问题。

3. 主动思维链与工具使用

在推理过程中，模型可以主动调用外部工具（计算器、搜索引擎、代码解释器），并将工具返回的结果纳入后续推理。这是当前智能体（Agent）架构的基础能力。

常见问题与调试指南

推理正确但答案格式错误
在提示中明确指定答案的提取格式，例如：“最终答案用‘答案是：X’的形式给出。”并可在示例中体现。
逻辑跳跃或幻觉
尝试将任务分解得更细，使用分步提示：把一个大问题人工拆成几个小问，依次提问。还可以在提示中强调“请检查每一步的依据是否合理”。
长篇推理导致上下文超限
精简推理链条，只保留关键步骤；或采用 “最小充分推理” 思路：仅生成必要的最少中间步骤。对于超长任务，考虑分段处理。
零样本CoT效果不佳
改用 Few-shot 并提供2-3个高质量示例；或者结合角色设定：“你是一名严谨的数学老师，请一步步展示解题过程。”

思维链的局限与未来

无法保证推理的绝对正确：模型可能写出看似合理但实际错误的推理。这需要人工校验或引入外部验证工具。
上下文长度消耗大：长推理链条会迅速用尽上下文窗口，对超长文档或巨量步骤任务需特殊设计。
太依赖自然语言描述：对于某些更适合结构化表示的推理（如符号逻辑），纯文本思维链可能冗余。研究者正在探索将自然语言与程序化表示结合的“程序辅助语言模型”等新范式。

思维链已经从简单的提示技巧发展为一个丰富的技术家族，它让语言模型从“黑箱回答者”进化为“可解释的推理者”。掌握思维链，你将能够解锁模型在逻辑、数学、规划等领域的真正潜力，并构建出更可靠、更透明的AI应用。

延伸学习

阅读原始论文：《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》
实践平台：在 Jupyter Notebook 中通过 API 调用 GPT 系列模型，对比有无思维链提示的效果差别。
关注变体：探索 Tree of Thoughts、Graph of Thoughts 以及 ReAct（推理+行动）等组合范式。