图思维 GoT：任意图结构的复杂推理聚合

FreeGuideOnline 最新 2026-06-14

图思维 (Graph-of-Thoughts) 完全指南：用任意图结构实现复杂推理聚合

第一章：为什么需要图思维

人类在解决复杂问题时，很少像一条笔直的锁链那样思考。我们会发散、会回溯、会将多个想法组合成一个新的想法，然后重新审视之前的路径。但长期以来，大语言模型的主流推理范式——“思维链（Chain-of-Thought）”却强迫模型沿着线性链条前进，这就像用一根绳子代替了整个大脑的神经元网络。

图思维 (Graph-of-Thoughts, GoT) 的出现，彻底打开了推理结构的自由度。它将推理抽象为一张有向图：每个节点是一个“思维”，每条边代表一个思维到另一个思维的推进，而你可以任意组合、合并、精炼这些想法，最终得到一个经过深度聚合的结论。

本教程将带你从零开始，掌握图思维的核心机制、设计思想与实战框架，即使你是第一次接触这个概念，也能迅速构建出属于自己的图推理系统。

第二章：从链思维到图思维——一场推理范式的升维

2.1 思维链 (Chain-of-Thought, CoT)

结构：一条线性序列。思维① → 思维② → 思维③ → ... → 最终答案
局限：无法同时探索多个分支；一旦某一步推导出错，后续全部漂移；无法利用不同推理路径之间的协同信息。

2.2 思维树 (Tree-of-Thoughts, ToT)

结构：树状分支。允许在每个层级产生多个候选“思维”，并使用评估器选择最有前景的路径进行深度优先或广度优先搜索。
进步：支持多路探索，解决了“只走一条路”的问题。
残余约束：同层级思维之间无法直接交互；无法将树枝间的信息融合成一个更抽象的思想。

2.3 图思维 (Graph-of-Thoughts, GoT)

结构：任意有向图。节点是思维，边是依赖关系。允许：
- 分支：从一个思维衍生出多个后继。
- 聚合：将多个思维的精华合并成一个新思维（如“合并”操作）。
- 精炼：多次迭代同一个思维节点，持续优化。
- 回溯与循环：支持在图中形成环，模拟自我修正。
本质升维：推理不再是一个有限拓扑模板，而是一个可自由编程的推理拓扑。这种结构更接近人脑的神经网络式处理，也更能胜任多步规划、开放域问答、科学发现等高阶任务。

第三章：图推理的核心抽象——节点、边与聚合器

在 GoT 框架中，一切推理都由三个基本元素构成：

3.1 思维节点 (Thought Node)

一个思维节点封装了一段离散的文本或向量表示，代表当前推理阶段的一个“想法”。它可以是一句话、一个步骤、一个假设，甚至是一个完整的段落。

属性：内容、唯一 ID、状态（待处理、已处理、废弃）。
生成方式：由大语言模型根据输入提示和前置思维生成。

3.2 思维边 (Thought Edge)

有向边表达思维的流动方向。一条边 A → B 表示 B 是基于 A 的推导。

一对多：一个节点可以激发多个后继（发散）。
多对一：多个节点可以共同注入一个后继（聚合）。

3.3 聚合操作 (Aggregation)

聚合是 GoT 区别于 ToT 的决定性能力。当多条边汇聚到一个节点时，系统会调用一个专门的“聚合提示”，让模型将多个来源的思维压缩、对比、取长补短，并生成一个信息密度更高、冗余更少的新思维。

示例聚合提示：

"你是一位逻辑分析专家。以下是从不同角度得出的三个分结论：<思维1> <思维2> <思维3>。请将这些观点整合为一个统一、更精确、无矛盾的综合结论，并保留所有有价值的细节。"

节点可以自循环，通过反复迭代改进自身内容。例如：

初始思维：“巴黎是法国的首都。”
第一次精炼（加入历史背景）：“巴黎是法国的首都，也是该国政治、文化中心。”
第二次精炼（用户要求更专业的表达）：“巴黎是法兰西第五共和国的首都，位于巴黎盆地中央，是全球重要的外交、商业与艺术中心。”

第四章：GoT 工作流——以“复杂推理任务”为例

我们通过一个真实的推理任务——“为什么北极熊的皮肤是黑色的？”来演示 GoT 的完整生命周期。

4.1 步骤1：定义图拓扑

为任务选择一种有向图结构。本例中我们设计如下拓扑：

根节点：问题本身。
分支层：从问题出发生成三个子方向：
- ① 物理学解释（光吸收、热力学）
- ② 进化生物学解释（自然选择、适应性）
- ③ 观察与行为解释（与栖息地环境的关系）
聚合节点：将三个方向的思维合并成一个统一答案。
精炼循环：对聚合结果连续两次自我提问“这个解释是否足够简洁且没有错误？”，每次修正后生成新版本。

4.2 步骤2：提示工程准备

你需要为三种操作设计不同的提示模板：

分支提示：规定如何在当前节点上生成多个异构思维。
聚合提示：规定如何融合多个思维为一个。
评价提示（可选）：对每个思维打分，决定是否保留/继续扩展。

4.3 步骤3：执行图推理

使用大语言模型反复调用这三个模板，按拓扑顺序推进图流。伪代码如下：

graph = Graph()
root = graph.add_node("为什么北极熊的皮肤是黑色的？")
physics = graph.extend(root, branch_prompt, num=1, direction="物理")
biology = graph.extend(root, branch_prompt, num=1, direction="进化")
behavior = graph.extend(root, branch_prompt, num=1, direction="行为生态")
merged = graph.aggregate([physics, biology, behavior], aggregation_prompt)
refined_v1 = graph.refine(merged, refinement_prompt)
refined_v2 = graph.refine(refined_v1, refinement_prompt)
final_answer = refined_v2

4.4 步骤4：解读中间结果

物理分支产出：黑色皮肤能最大效率吸收紫外线和热量，帮助北极熊在极寒环境保持体温。
进化分支产出：黑皮透明毛的配置是长期自然选择的结果，既保暖又利用保护色。
行为分支产出：北极熊的栖息地遍布积雪，黑色皮肤被厚实白毛遮盖，不影响捕猎隐蔽。
聚合节点综合三家之言：北极熊的黑色皮肤是一种高效热收集器，其上覆盖的中空透明毛发将可见光传导至黑色表皮吸收，同时毛发散射阳光呈白色用于伪装，这是一项精巧的进化适应。
精炼后的最终输出更紧凑、更少冗余，且主动澄清了“黑色皮肤不可见”的常见误解。

第五章：GoT 的四大官方操作原语

在 GoT 论文中，作者形式化了四种原子变换。理解它们，你就能像搭建乐高一样构造任意推理图。

操作	符号	含义	示例
生成 (Generate)	`G(p, n)`	从当前节点生成 n 个后继	将“发明一种新颜色的名字” 生成为 3 个候选
改良 (Refine)	`R(n)`	对节点 n 的内容进行迭代改善	连续修改一份草稿，提升逻辑严密性
聚合 (Aggregate)	`A(n₁…nₖ)`	将 k 个节点合成一个	将三个论证合并为一个综合性论证
评分 (Score)	`S(n)`	对节点 n 输出数值评价（1-10分）	用于剪枝，保留高分分支

任意组合：你可以先用 G 发散，再用 S 筛选高分节点，再用 A 聚合，再 R 精炼，最后 G 输出最终样式。图的形状由任务决定，而不再是框架限制。

第六章：动手实现——最简 Python 演示 (基于LangChain思想)

以下是一个可直接运行的极简 GoT 引擎伪代码，仅需 OpenAI API Key 即可体验。

import openai

def call_llm(prompt):
    # 实际使用请配置你自己的客户端
    response = openai.ChatCompletion.create(
        model="gpt-4",
        messages=[{"role": "user", "content": prompt}]
    )
    return response.choices[0].message.content

class GraphOfThoughts:
    def __init__(self, seed):
        self.nodes = {0: seed}
        self.edges = []
        self.next_id = 1

    def generate(self, parent_id, branch_prompt, count=2):
        new_ids = []
        parent_text = self.nodes[parent_id]
        for i in range(count):
            full_prompt = branch_prompt.format(thought=parent_text, index=i+1)
            new_text = call_llm(full_prompt)
            new_id = self.next_id
            self.nodes[new_id] = new_text
            self.edges.append((parent_id, new_id))
            self.next_id += 1
            new_ids.append(new_id)
        return new_ids

    def aggregate(self, ids, agg_prompt):
        thoughts = "\n---\n".join(self.nodes[i] for i in ids)
        full_prompt = agg_prompt.format(thoughts=thoughts)
        aggregated_text = call_llm(full_prompt)
        new_id = self.next_id
        self.nodes[new_id] = aggregated_text
        for i in ids:
            self.edges.append((i, new_id))
        self.next_id += 1
        return new_id

    def refine(self, node_id, refine_prompt, steps=1):
        current_text = self.nodes[node_id]
        for _ in range(steps):
            current_text = call_llm(refine_prompt.format(thought=current_text))
        self.nodes[node_id] = current_text
        return node_id

# 使用示例
got = GraphOfThoughts("如何用仅三天时间筹备一场生日惊喜派对？")
# 分支：预算、创意、人员
branches = got.generate(0, branch_prompt="围绕派对主题，从{index}个角度思考：{thought} 角度：", count=3)
# 聚合
merged_id = got.aggregate(branches, "整合以下想法为一个执行计划：{thoughts}")
# 精炼
got.refine(merged_id, refine_prompt="让这个计划更具体、步骤清晰：{thought}")
print(got.nodes[merged_id])

这个极简引擎展示了“分支—聚合—精炼”的基本循环。在实际系统中，你可以引入评分器对思维打分、剪枝，并利用队列控制图遍历。

第七章：进阶技巧与常见陷阱

7.1 怎样设计有效的聚合提示？

明确角色：“你是一个多角度信息融合专家。”
指定冲突消解策略：“如果观点矛盾，请说明矛盾原因并给出最合理的调和方案。”
强制保持结构：“输出必须包含‘综合结论’和‘保留的细节’两段。”

7.2 如何避免节点爆炸？

图思维能力过度发散会使节点数量指数增长。两种控制手段：

得分剪枝：每个生成节点立即评分，仅保留 Top-K。
相似度合并：使用文本嵌入计算节点间的余弦相似度，对语义重复的节点提前合并，避免冗余分支浪费资源。

7.3 循环与回溯的合理使用

允许图为带环有向图时，可赋予系统自我纠错能力：

输出一个最终答案节点后，再追加一个“质疑”节点，指向答案节点，提示模型批评该答案。若批评有意义，则继续精炼。
为防止无限循环，设定最大迭代次数或要求评分单调上升时停止。

第八章：图思维 vs. 其他推理范式——全景对比

标尺	思维链 (CoT)	思维树 (ToT)	图思维 (GoT)
拓扑结构	线性	树形	任意有向图
多路探索	无	有，但分支不融合	有，且分支可融合
信息聚合	仅靠最终总结	无聚合，路径独立	原生支持多路合并
自我改进	无	可回溯重选路径	支持节点级精炼和循环修正
适合任务	简单算术、常识问答	需要搜索的推理（24点、创意写作）	复杂多步规划、科学研究、矛盾调和

比CoT强在哪里：突破了线性思考的单路限制。
比ToT强在哪里：不再受树结构限制，可以“把多条枝干编织成一条更强壮的树干”。

第九章：GoT 的当前局限与未来方向

局限

成本高昂：调用次数随分支增多而急剧上升。
提示设计复杂：每个聚合、精炼环节都需要精心调试，否则容易产生语义稀释。
缺乏原生评估标准：目前主要依靠大模型自身打分，可能与真实质量有偏差。

未来方向

动态拓扑学习：根据任务难度自动决定哪个位置分支、哪个位置聚合。
混合符号推理：将GoT与外部知识图谱、数学求解器结合，让思维节点引用结构化事实。
多智能体图思维：不同 LLM 担任图中的不同节点角色（生成者、批评者、聚合者），用图拓扑定义多智能体协作协议。

第十章：总结与实践建议

图思维将大语言模型的推理能力从“单线程流水线”升级为“可并发、可融合的思维网络”。其核心不是具体算法，而是一种以图为纲的元认知框架：把复杂问题理解为可分解、可组合、可审视的思维单元集合。

给初学者的上手路线图：

从一个简单的“分支-聚合”实验开始，体会信息融合的力量。
尝试加入评分器，手动剪枝，观察图规模对最终答案质量的影响。
将一个你工作中的多步骤任务（如报告生成、方案策划）改造为GoT流程，对比原始CoT的效果。
阅读原论文《Graph of Thoughts: Solving Elaborate Problems with Large Language Models》，深入数学根基。

记住：图只是手段，真正的目标是让模型的思考尽可能接近人类处理复杂问题的方式——灵活、递归且高度整合。现在，你可以开始构建你的第一个思维图了。