Dify 开源平台:可视化编排 LLM 应用与知识库

FreeGuideOnline 最新 2026-06-14

Dify 是什么

Dify 是一个开源的 LLM(大语言模型)应用开发平台,它将“模型接入”“提示词编排”“知识库管理”“应用发布与监控”等环节整合成一套可视化工作流。借助 Dify,开发者甚至非技术人员都能在图形化界面中快速构建、测试和部署基于大模型的应用,无需手写复杂后端代码。

其核心目标有三点:

  • 降低 LLM 应用开发门槛,让团队专注于业务逻辑而非工程细节。
  • 提供企业级可维护性,如版本管理、API 管理与运营监控。
  • 保持开源透明,支持私有化部署,保障数据安全。

Dify 的核心能力一览

在动手之前,先理解平台提供了哪些“积木”,后续所有操作都是对这些能力的拼装。

能力模块 说明
可视化 Prompt 编排 通过拖拽式界面设计对话流程、插入变量、设置条件分支
知识库 (RAG) 上传文档自动分段、向量化,实现基于私有数据的问答
工具调用 (Tool) 让 LLM 调用 API、执行计算、搜索等外部能力
多模型支持 一站式接入 OpenAI、Claude、Llama、通义千问、文心一言等
应用发布 一键生成 AI 应用、聊天助手,或通过 API 集成到已有系统
日志与标注 记录每一次交互,支持人工标注与改进模型效果

快速上手:从零构建一个 AI 知识问答助手

下面我们以一个最常见的场景为例——基于公司内部文档构建知识问答机器人。你将直观感受到可视化编排与知识库的结合。

第一步:部署 Dify 平台

Dify 提供官方云服务(dify.ai)和私有化部署两种方式。对于学习与测试,推荐使用 Docker Compose 一键部署。

  1. 确保已安装 Docker 和 Docker Compose。
  2. 克隆项目并启动:
git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker-compose up -d
  1. 访问 http://localhost,使用默认管理员邮箱和密码登录(可在 .env 中修改)。

如需接入特定模型,在 .env 中填写对应 API Key,如 OPENAI_API_KEY

第二步:创建知识库

知识库是 RAG 应用的基石,目的是让模型“读”懂你的私有文档。

  1. 登录后,点击左侧菜单“知识库” → “创建知识库”。
  2. 填写知识库名称,如“员工手册2025”。
  3. 选择索引模式:
    • 高质量模式:使用更强大的嵌入模型,效果更佳(默认推荐)。
    • 经济模式:资源消耗更低,适合大批量文档。
  4. 点击“下一步”,上传文件。支持 PDF、TXT、Markdown、Word、CSV 等格式。
  5. 系统自动完成文档分段和向量化。你可以查看分段结果,手动调整分段策略(按字数、分隔符等)。
  6. 完成后,知识库状态变为“就绪”。

第三步:编排一个对话型应用

我们来创建一个“聊天助手”类型应用,并挂接刚才的知识库。

  1. 进入“工作室” → “从空白创建” → 选择“聊天助手”。
  2. 在编排页面的左侧“模型”区域,选择一个模型,如 GPT-4o-mini(或你自己配置的其他模型)。
  3. 提示词编辑器是核心。删除默认内容,写入定制提示词:
你是公司内部知识助手,请使用以下知识库内容回答问题。
如果知识库中没有相关信息,请如实告知用户“暂未找到相关文档”,不要编造。
请用简洁专业的语言回答,必要时可列出编号。
  1. 在右侧“上下文”面板,点击“添加” → 选择我们刚创建的“员工手册2025”知识库。
  2. 你可以调整“相似度阈值”和“召回片段数量”,控制回答的严谨度与丰富度。

此时,你已搭建了一个具备基本 RAG 能力的对话应用。

第四步:调试与发布

  1. 在右侧“预览”窗口,输入一个问题,例如:“试用期多久?”。应用会自动检索知识库片段,并将上下文送给模型生成回答。
  2. 如果效果不理想,可以返回编辑器优化:
    • 修改提示词,要求引用来源。
    • 调整分段长度,避免信息截断。
    • 在“功能”栏开启“引用与归属”,让答案附带文档片段。
  3. 满意后,点击右上角“发布”。你会获得一个独立的分享链接,以及可集成的 API 秘钥。

第五步:通过 API 集成到你的网站

生成的客服助手不仅能独立使用,还能嵌入到你的现有系统。

  1. 在“应用” → 选择发布的应用 → “API 参考”中查看接口文档。
  2. 后端通过 POST 请求调用 /chat-messages,携带 queryuser 参数。
  3. 前端可嵌入 Dify 提供的聊天组件(几行 JavaScript 即可),实现零开发集成。

示例调用(cURL):

curl -X POST 'https://your-dify-domain/v1/chat-messages' \
  -H 'Authorization: Bearer app-xxxx' \
  -H 'Content-Type: application/json' \
  --data-raw '{"inputs":{},"query":"请介绍假期政策","response_mode":"streaming","user":"employee-001"}'

进阶功能:让应用更智能

自定义工具(Tool)扩展能力

Dify 内置了 Google 搜索、Wikipedia、代码执行器等公共工具,也支持自定义 API。例如为助手添加“查询天气”工具:

  1. 在应用编排页,点击“工具” → “自定义工具”。
  2. 定义 API Schema(OpenAPI 规范),配置端点 URL 和参数。
  3. 在提示词中说明何时使用该工具,模型将自动决定调用时机。

工具与知识库结合,能让助手真正成为“能做事的智能体”。

工作流程(Workflow)编排

对于复杂任务链,可以使用“工作流程”类型应用。它以节点形式编排:

  • 开始节点:接收用户输入。
  • LLM 节点:处理分析。
  • 知识检索节点:从知识库获取上下文。
  • 条件分支:根据不同意图执行不同路径。
  • 代码节点:运行自定义脚本(Python/JavaScript)。
  • 结束节点:输出结果。

工作流适合需要多步骤处理的场景,如工单分类后自动指派、多轮信息抽取等。

日志分析与持续优化

上线后,不要忽略运营闭环。Dify 提供详细的日志面板:

  • 查看每条对话的输入、输出、检索的知识片段、耗时、费用。
  • 对回答进行“赞/踩”标注,或编辑修正后的答案。
  • 使用标注数据来微调模型或优化提示词版本。

通过持续观察和迭代,系统的回答质量会不断提升。

常见问题与避坑指南

知识库检索不到相关内容?

  • 检查文档分段是否合理,过粗或过细都影响召回。
  • 提高“相似度阈值”会过滤掉低相关性片段,也可能导致无结果。
  • 尝试使用更高质量的嵌入模型(在设置中切换)。

模型回答不够稳定?

  • 降低模型温度参数(Temperature),通常设为 0.1 ~ 0.3 会更确定。
  • 在提示词中注入示例(few-shot),引导输出格式。

私有化部署成本高吗?

Dify 本身资源消耗适中,2 核 4GB 服务器即可运行基础服务;若需要本地嵌入模型和向量数据库,建议 4 核 8GB 起步。成本远低于商业 SaaS 的按请求计费。

总结

Dify 通过可视化编排、知识库与丰富的集成能力,大幅缩短了从 LLM 原型到生产级应用的距离。无论是构建内部知识库问答、客户支持聊天机器人,还是多步骤智能体工作流,它都能提供开箱即用的组件和清晰的迭代路径。

下一步,你可以在官方文档 https://docs.dify.ai 探索更多玩法,或直接部署一个实例,亲手搭建属于你的第一个 LLM 应用。