Donut 无 OCR 文档理解
使用 Donut 模型直接从文档图像生成结构化文本,绕过传统 OCR 流程,简化文档数字化工作。
文档智能 LayoutLM
学习 LayoutLM 系列如何将文本、布局和视觉信息联合预训练,在表单理解、票据识别等任务上达到高精度。
浏览器自动化 Agent
构建能理解网页并执行点击、输入等操作的 AI Agent,使用 Playwright 等工具实现复杂的浏览器自动化。
SQLCoder 模型
学习 SQLCoder 等代码模型在 Text-to-SQL 任务上的微调与应用,实现高准确率的自然语言数据查询。
自动化数据分析 PandasAI
使用 PandasAI 通过自然语言提问对 Pandas DataFrame 进行过滤、聚合和可视化,简化数据分析流程。
代码解释器 Code Interpreter
学习 OpenAI Code Interpreter 的架构,在安全沙箱中执行 Python 代码进行数据分析和文件处理,并生成图表。
表格问答 TableQA
学习让模型在给定表格或数据库上根据自然语言问题检索信息,涵盖 Text-to-SQL 和端到端表推理。
图数据库 Neo4j 与 LLM
利用 Neo4j 图数据库存储实体关系,让大模型通过查询生成 Cypher 语句获取结构化知识,实现精准问答。
大模型 API 经济学
学习计算和优化调用大模型 API 的成本,运用缓存、提示压缩和批处理减少 Token 消耗,节省预算。
UniPELT 统一方法
将 LoRA、Adapter 和 Prefix-Tuning 等微调方法统一到一个框架,通过门控机制动态组合最优适配器。
前置微调 Prefix-Tuning
掌握 Prefix-Tuning 技术,在每一层激活前拼接可训练前缀向量,以极少参数控制模型适应生成任务。
提示微调 p-tuning
学习 P-Tuning 通过在输入嵌入层插入可学习的连续提示向量,以极低参数量实现自然语言理解任务的高效微调。
参数高效微调 PEFT 总览
综述参数高效微调技术族,对比 LoRA、Adapter、Prefix Tuning、Prompt Tuning 的原理、参数效率与任务表现。
GPTZero 检测器
了解 GPTZero 如何利用文本的困惑度和突发性指标来判断文章是否由 AI 生成,及其在教育领域的应用。