免费编程教程

最新
安全性评估工具

综述主流大模型安全性评估工具与基准,如 ToxiGen、RealToxicityPrompts 和自动红队框架。

2 0 0
2026-06-22
最新
HaluEval 幻觉检测

学习 HaluEval 幻觉评估数据集,包含自动生成和人工标注的幻觉样本,用于检测和缓解模型幻觉。

2 0 0
2026-06-22
最新
幻觉评估 TruthfulQA

使用 TruthfulQA 基准测试模型回答的真实性,检测模型在面对虚假前提问题时是否产生幻觉。

1 0 0
2026-06-22
最新
LLaVA-Bench

利用 GPT-4 作为裁判,在多模态对话场景下对模型输出进行相对评分,衡量视觉对话质量。

1 0 0
2026-06-22
最新
SEED-Bench

了解 SEED-Bench 的多维度生成式评测,涵盖图像和视频理解,为多模态模型提供精细化能力诊断。

3 0 0
2026-06-22
最新
MME 综合感知

学习 MME 评测,通过感知和认知两个维度、14 个子任务,使用是/否判断评价多模态模型性能。

3 0 0
2026-06-22
最新
MMBench 评测

学习使用 MMBench 对多模态模型进行评估,其覆盖 20 个能力维度,以选择题形式衡量模型的视觉理解。

1 0 0
2026-06-22
最新
多模态大模型评测

了解多模态大模型的评测体系,学习 MMBench、SEED-Bench 等基准如何衡量模型的视觉感知与推理。

2 0 0
2026-06-22
最新
医疗大模型 HuatuoGPT

了解 HuatuoGPT 如何利用大量医学文献和对话数据进行训练,在医疗咨询和辅助诊断中表现突出。

1 0 0
2026-06-22
最新
金融大模型 FinGPT

学习开源的 FinGPT 框架,利用金融新闻、财报等数据对大模型进行情感分析和市场预测的微调。

2 0 0
2026-06-22
最新
法律大模型

了解如何在法律文本上继续预训练或微调大模型,实现法律文书生成、案件分析和法条检索。

2 0 0
2026-06-22
最新
WizardMath 数学微调

学习 WizardMath 如何利用进化式指令数据增强,提升开源模型在 GSM8k 和 MATH 等数学基准上的表现。

2 0 0
2026-06-22
最新
数学推理大模型

探索专门增强数学推理能力的大模型,了解其训练数据、思维链和形式化验证等提升手段。

3 0 0
2026-06-22
最新
DeepSeek-Coder

学习 DeepSeek-Coder 系列在代码生成和补全上的能力,特别是仓库级代码理解与填充。

3 0 0
2026-06-22
最新
StarCoder 代码生成

了解 StarCoder 与 StarCoder2,学习其基于 Stack 数据集的训练过程以及多语言代码生成与填充功能。

2 0 0
2026-06-22
最新
Code Llama 实践

学习使用 Meta 开源的 Code Llama 系列,掌握其代码填充能力、多种规模选择及本地推理部署。

2 0 0
2026-06-22
最新
代码补全模型评估

使用 HumanEval、MBPP 等基准和 Pass@k 指标,评估代码生成模型的功能正确性和补全准确度。

2 0 0
2026-06-22
最新
代码大模型训练

学习如何基于代码语料预训练或微调大模型,使其具备代码生成、补全与解释的能力。

4 0 0
2026-06-22
最新
工具调用微调

为模型构建工具调用训练数据,微调使其能根据用户意图准确输出结构化函数调用参数。

3 0 0
2026-06-22
最新
多轮对话微调

使用多轮对话格式数据微调模型,学习如何保留对话历史,处理角色交替,使模型在长对话中保持一致。

3 0 0
2026-06-22
最新
指令微调样本构造

设计高质量指令微调数据集,学习指令模板设计、任务多样性保证和自动化的质量控制方法。

2 0 0
2026-06-22
最新
QLoRA 微调完整流程

从零开始实践 QLoRA 微调,涵盖 4-bit 量化加载、LoRA 配置、训练监控,以及训练后权重合并与导出。

2 0 0
2026-06-22
最新
多 GPU 微调技巧

学习利用 DeepSpeed ZeRO 和 PyTorch FSDP 将微调扩展到多卡,处理显存与通信瓶颈,训练更大模型。

7 0 0
2026-06-22
最新
Firefly 微调框架

学习 Firefly 框架,支持 QLoRA 和全量微调,专注于中文大模型的增量预训练与指令微调,资源友好。

4 0 0
2026-06-22
最新
LLaMA-Factory 微调框架

掌握 LLaMA-Factory 的使用,通过 Web 界面或命令行对上百种模型进行 LoRA、QLoRA 等微调,降低门槛。

3 0 0
2026-06-22
最新
使用 Axolotl 微调

使用 Axolotl 框架通过 YAML 配置文件轻松微调 Llama、Mistral 等模型,支持 QLoRA、全参数等多种模式。

4 0 0
2026-06-22
最新
本地模型微调实战

在本地 GPU 环境下完整复现大模型微调过程,涵盖数据收集与清洗、训练配置、损失监控与模型导出。

5 0 0
2026-06-22
最新
Gemini 多模态模型

学习谷歌 Gemini 系列,理解其原生多模态设计,无缝处理文本、图像、音频和视频,与长达百万 Token 的上下文窗口。

2 0 0
2026-06-22
最新
Claude 模型使用

学习 Anthropic 的 Claude 模型,掌握其 API 使用、超长上下文能力和宪法 AI 训练带来的独特安全特性。

2 0 0
2026-06-22
最新
混元大模型

了解腾讯混元大模型的技术架构,包括其 MoE 结构、多模态能力和在腾讯生态各产品中的落地实践。

3 0 0
2026-06-22
最新
文心一言 ERNIE

了解百度文心一言 ERNIE 模型的训练策略,包括知识增强、持续学习以及其在搜索、创作等产品中的应用。

1 0 0
2026-06-22
最新
通义千问 Qwen-VL

深入 Qwen-VL 架构,学习其如何将视觉编码与大语言模型结合,实现图像描述、问答和视觉定位等多模态能力。

4 0 0
2026-06-22
最新
面壁智能 CPM

了解面壁智能推出的 CPM 系列模型,涵盖纯语言与多模态版本,以及其在教育、办公等领域的具体应用。

3 0 0
2026-06-22
最新
Yi 系列大模型

学习零一万物的 Yi 系列模型,强调其在长上下文处理上的能力,以及面向多语言的先进架构设计。

2 0 0
2026-06-22
最新
InternLM 书生

了解 InternLM 及其后续版本的模型特点,在工具调用、推理和长上下文方面的性能,以及应用生态。

4 0 0
2026-06-22
最新
Baichuan 大模型

学习百川智能开源的 Baichuan 系列模型,了解其在中文 NLP 任务上的表现、模型架构及微调应用。

3 0 0
2026-06-22
最新
ChatGLM 模型

剖析 ChatGLM 系列的架构与训练,基于通用语言模型框架 GLM,深入支持中英双语的高效对话生成。

1 0 0
2026-06-22
最新
Qwen 模型系列

了解阿里通义千问 Qwen 系列模型,包括基础语言模型、MoE 和视觉语言版本,以及其训练特色与使用。

4 0 0
2026-06-22
最新
DeepSeek MoE 架构

学习 DeepSeek 提出的混合专家架构,结合细粒度专家和共享专家,在提升模型容量同时控制计算成本。

1 0 0
2026-06-22
最新
专家容量

通过设定专家容量,对每个专家能处理的最大 Token 数进行硬限制,避免显存溢出并强制路由平衡。

5 0 0
2026-06-22
最新
负载均衡损失

学习设计辅助损失函数,鼓励路由将 Token 均匀分配给不同专家,防止模型仅依赖少数专家。

3 0 0
2026-06-22
最新
软混合专家 Soft MoE

学习 Soft MoE 如何将 Token 以连续权重分配给所有专家,并先合并输入再分派,在完全可微分的同时更易训练。

1 0 0
2026-06-22
最新
混合专家 MoE 深入

深入 MoE 架构,解析 Top-K 路由、专家负载均衡损失和容量因子的设计,实现参数总量巨大但计算量恒定的大模型。

5 0 0
2026-06-22
最新
大海捞针测试

在长文档中随机插入特定事实,测试模型在各深度和位置上的召回准确性,成为长上下文评测标准。

3 0 0
2026-06-22
最新
上下文窗口评估

学习评估长上下文模型性能的基准和方法,包括大海捞针测试、RULER 等,检测模型在不同位置的信息提取能力。

3 0 0
2026-06-22
最新
长文本训练优化

解决超长文本训练时的显存与计算挑战,学习序列并行、选择性激活检查点和分页优化等工程技术。

5 0 0
2026-06-22
最新
YaRN 位置编码

学习 YaRN 同时调整 RoPE 的频率基数和注意力温度,仅需微量微调即可让模型在 128k 甚至更长的上下文上保持准确。

3 0 0
2026-06-22
最新
动态 NTK

在推理时根据当前序列长度动态调整 RoPE 的缩放因子,实现更灵活的上下文窗口扩展,兼具性能与外推。

3 0 0
2026-06-22
最新
NTK 感知缩放

基于神经正切核理论,NTK 感知缩放对 RoPE 的不同频率维度施以不同缩放因子,更好地保留高频细节,扩展上下文。

3 0 0
2026-06-22
最新
位置插值 PI

学习位置插值方法,直接对 RoPE 的位置索引进行线性缩放,将长距离“压缩”到原始上下文范围,实现快速扩展。

3 0 0
2026-06-22
最新
ALiBi 线性偏置

学习 ALiBi 如何直接在注意力分数上加一个随距离递减的线性偏置,无需学习复杂位置编码即可实现上下文外推。

5 0 0
2026-06-22
最新
RoPE 旋转位置编码

深入 RoPE 的数学原理,学习它如何通过旋转变换将相对位置信息融入到注意力的内积中,支持良好外推。

6 0 0
2026-06-22
最新
长上下文扩展技术

综合学习位置插值、NTK 缩放、YaRN 和稀疏注意力等方法,将预训练模型的上下文窗口扩展数倍。

6 0 0
2026-06-22
最新
FlashDecoding 加速

针对 FlashAttention 在解码阶段利用率低的问题,学习 FlashDecoding 如何并行处理长 KV 序列以加速生成。

3 0 0
2026-06-22
最新
分组查询注意力 GQA

在 MHA 和 MQA 之间折中,将 Query 头分组共享 KV,以较少质量损失换取显著推理加速,成为 Llama 2 等模型标配。

3 0 0
2026-06-22
最新
多查询注意力 MQA

学习 MQA 让所有 Query 头共享同一套 Key/Value 投影,大幅减少推理时的 KV 缓存,加速自回归生成。

3 0 0
2026-06-22
最新
滑动窗口注意力

采用滑动窗口限制每个 Query 只与相邻 Token 交互,结合层叠感受野,以线性复杂度处理超长序列。

3 0 0
2026-06-22
最新
稀疏注意力 Sparse Attn

学习通过稀疏化注意力矩阵,如局部窗口、空洞窗口和全局标记等方式,显著降低计算量并扩展模型上下文长度。

5 0 0
2026-06-21
最新
线性注意力机制

综述线性注意力机制的基本思想,通过核函数分解或关联内存设计,将标准注意力的 O(n²) 降至 O(n),应对长序列建模。

4 0 0
2026-06-21
最新
RetNet 保留网络

学习 RetNet 如何将注意力机制替代为多尺度保留机制,实现 Transformer 式的并行训练与 RNN 式的 O(1) 高效推理。

2 0 0
2026-06-21