自动化数据分析 PandasAI
使用 PandasAI 通过自然语言提问对 Pandas DataFrame 进行过滤、聚合和可视化,简化数据分析流程。
代码解释器 Code Interpreter
学习 OpenAI Code Interpreter 的架构,在安全沙箱中执行 Python 代码进行数据分析和文件处理,并生成图表。
表格问答 TableQA
学习让模型在给定表格或数据库上根据自然语言问题检索信息,涵盖 Text-to-SQL 和端到端表推理。
图数据库 Neo4j 与 LLM
利用 Neo4j 图数据库存储实体关系,让大模型通过查询生成 Cypher 语句获取结构化知识,实现精准问答。
大模型 API 经济学
学习计算和优化调用大模型 API 的成本,运用缓存、提示压缩和批处理减少 Token 消耗,节省预算。
UniPELT 统一方法
将 LoRA、Adapter 和 Prefix-Tuning 等微调方法统一到一个框架,通过门控机制动态组合最优适配器。
前置微调 Prefix-Tuning
掌握 Prefix-Tuning 技术,在每一层激活前拼接可训练前缀向量,以极少参数控制模型适应生成任务。
提示微调 p-tuning
学习 P-Tuning 通过在输入嵌入层插入可学习的连续提示向量,以极低参数量实现自然语言理解任务的高效微调。
参数高效微调 PEFT 总览
综述参数高效微调技术族,对比 LoRA、Adapter、Prefix Tuning、Prompt Tuning 的原理、参数效率与任务表现。
GPTZero 检测器
了解 GPTZero 如何利用文本的困惑度和突发性指标来判断文章是否由 AI 生成,及其在教育领域的应用。
HaluEval 幻觉检测
学习 HaluEval 幻觉评估数据集,包含自动生成和人工标注的幻觉样本,用于检测和缓解模型幻觉。
幻觉评估 TruthfulQA
使用 TruthfulQA 基准测试模型回答的真实性,检测模型在面对虚假前提问题时是否产生幻觉。
SEED-Bench
了解 SEED-Bench 的多维度生成式评测,涵盖图像和视频理解,为多模态模型提供精细化能力诊断。
MMBench 评测
学习使用 MMBench 对多模态模型进行评估,其覆盖 20 个能力维度,以选择题形式衡量模型的视觉理解。
医疗大模型 HuatuoGPT
了解 HuatuoGPT 如何利用大量医学文献和对话数据进行训练,在医疗咨询和辅助诊断中表现突出。
WizardMath 数学微调
学习 WizardMath 如何利用进化式指令数据增强,提升开源模型在 GSM8k 和 MATH 等数学基准上的表现。
DeepSeek-Coder
学习 DeepSeek-Coder 系列在代码生成和补全上的能力,特别是仓库级代码理解与填充。
StarCoder 代码生成
了解 StarCoder 与 StarCoder2,学习其基于 Stack 数据集的训练过程以及多语言代码生成与填充功能。
Code Llama 实践
学习使用 Meta 开源的 Code Llama 系列,掌握其代码填充能力、多种规模选择及本地推理部署。
QLoRA 微调完整流程
从零开始实践 QLoRA 微调,涵盖 4-bit 量化加载、LoRA 配置、训练监控,以及训练后权重合并与导出。
多 GPU 微调技巧
学习利用 DeepSpeed ZeRO 和 PyTorch FSDP 将微调扩展到多卡,处理显存与通信瓶颈,训练更大模型。
Firefly 微调框架
学习 Firefly 框架,支持 QLoRA 和全量微调,专注于中文大模型的增量预训练与指令微调,资源友好。
LLaMA-Factory 微调框架
掌握 LLaMA-Factory 的使用,通过 Web 界面或命令行对上百种模型进行 LoRA、QLoRA 等微调,降低门槛。
使用 Axolotl 微调
使用 Axolotl 框架通过 YAML 配置文件轻松微调 Llama、Mistral 等模型,支持 QLoRA、全参数等多种模式。
Gemini 多模态模型
学习谷歌 Gemini 系列,理解其原生多模态设计,无缝处理文本、图像、音频和视频,与长达百万 Token 的上下文窗口。
Claude 模型使用
学习 Anthropic 的 Claude 模型,掌握其 API 使用、超长上下文能力和宪法 AI 训练带来的独特安全特性。