免费编程教程大全 - FreeGuideOnline

最新

安全性评估工具

综述主流大模型安全性评估工具与基准，如 ToxiGen、RealToxicityPrompts 和自动红队框架。

人工智能安全评估红队基准

2 0 0

2026-06-22

最新

HaluEval 幻觉检测

学习 HaluEval 幻觉评估数据集，包含自动生成和人工标注的幻觉样本，用于检测和缓解模型幻觉。

人工智能 HaluEval 幻觉检测

2 0 0

2026-06-22

最新

幻觉评估 TruthfulQA

使用 TruthfulQA 基准测试模型回答的真实性，检测模型在面对虚假前提问题时是否产生幻觉。

人工智能 TruthfulQA 幻觉评测

1 0 0

2026-06-22

最新

LLaVA-Bench

利用 GPT-4 作为裁判，在多模态对话场景下对模型输出进行相对评分，衡量视觉对话质量。

人工智能 LLaVA-Bench 多模态评测对话

1 0 0

2026-06-22

最新

SEED-Bench

了解 SEED-Bench 的多维度生成式评测，涵盖图像和视频理解，为多模态模型提供精细化能力诊断。

人工智能 SEED-Bench 评测多模态

3 0 0

2026-06-22

最新

MME 综合感知

学习 MME 评测，通过感知和认知两个维度、14 个子任务，使用是/否判断评价多模态模型性能。

人工智能 MME 感知认知

3 0 0

2026-06-22

最新

MMBench 评测

学习使用 MMBench 对多模态模型进行评估，其覆盖 20 个能力维度，以选择题形式衡量模型的视觉理解。

人工智能 MMBench 多模态评测选择题

1 0 0

2026-06-22

最新

多模态大模型评测

了解多模态大模型的评测体系，学习 MMBench、SEED-Bench 等基准如何衡量模型的视觉感知与推理。

人工智能多模态评测基准视觉语言

2 0 0

2026-06-22

最新

医疗大模型 HuatuoGPT

了解 HuatuoGPT 如何利用大量医学文献和对话数据进行训练，在医疗咨询和辅助诊断中表现突出。

人工智能 HuatuoGPT 医疗问诊

1 0 0

2026-06-22

最新

金融大模型 FinGPT

学习开源的 FinGPT 框架，利用金融新闻、财报等数据对大模型进行情感分析和市场预测的微调。

人工智能 FinGPT 金融情感分析

2 0 0

2026-06-22

最新

法律大模型

了解如何在法律文本上继续预训练或微调大模型，实现法律文书生成、案件分析和法条检索。

人工智能法律大模型合同判决

2 0 0

2026-06-22

最新

WizardMath 数学微调

学习 WizardMath 如何利用进化式指令数据增强，提升开源模型在 GSM8k 和 MATH 等数学基准上的表现。

人工智能 WizardMath 数学微调 Evol-Instruct

2 0 0

2026-06-22

最新

数学推理大模型

探索专门增强数学推理能力的大模型，了解其训练数据、思维链和形式化验证等提升手段。

人工智能数学推理大模型证明

3 0 0

2026-06-22

最新

DeepSeek-Coder

学习 DeepSeek-Coder 系列在代码生成和补全上的能力，特别是仓库级代码理解与填充。

人工智能 DeepSeek-Coder 代码仓库级

3 0 0

2026-06-22

最新

StarCoder 代码生成

了解 StarCoder 与 StarCoder2，学习其基于 Stack 数据集的训练过程以及多语言代码生成与填充功能。

人工智能 StarCoder 代码生成开源

2 0 0

2026-06-22

最新

Code Llama 实践

学习使用 Meta 开源的 Code Llama 系列，掌握其代码填充能力、多种规模选择及本地推理部署。

人工智能 Code Llama 代码生成实践

2 0 0

2026-06-22

最新

代码补全模型评估

使用 HumanEval、MBPP 等基准和 Pass@k 指标，评估代码生成模型的功能正确性和补全准确度。

人工智能代码评估 HumanEval Pass@k

2 0 0

2026-06-22

最新

代码大模型训练

学习如何基于代码语料预训练或微调大模型，使其具备代码生成、补全与解释的能力。

人工智能代码大模型训练代码补全

4 0 0

2026-06-22

最新

工具调用微调

为模型构建工具调用训练数据，微调使其能根据用户意图准确输出结构化函数调用参数。

人工智能工具调用微调函数调用

3 0 0

2026-06-22

最新

多轮对话微调

使用多轮对话格式数据微调模型，学习如何保留对话历史，处理角色交替，使模型在长对话中保持一致。

人工智能多轮对话微调记忆

3 0 0

2026-06-22

最新

指令微调样本构造

设计高质量指令微调数据集，学习指令模板设计、任务多样性保证和自动化的质量控制方法。

人工智能指令微调样本质量

2 0 0

2026-06-22

最新

QLoRA 微调完整流程

从零开始实践 QLoRA 微调，涵盖 4-bit 量化加载、LoRA 配置、训练监控，以及训练后权重合并与导出。

人工智能 QLoRA 微调流程量化

2 0 0

2026-06-22

最新

多 GPU 微调技巧

学习利用 DeepSpeed ZeRO 和 PyTorch FSDP 将微调扩展到多卡，处理显存与通信瓶颈，训练更大模型。

人工智能多GPU 微调分布式

7 0 0

2026-06-22

最新

Firefly 微调框架

学习 Firefly 框架，支持 QLoRA 和全量微调，专注于中文大模型的增量预训练与指令微调，资源友好。

人工智能 Firefly 微调中文

4 0 0

2026-06-22

最新

LLaMA-Factory 微调框架

掌握 LLaMA-Factory 的使用，通过 Web 界面或命令行对上百种模型进行 LoRA、QLoRA 等微调，降低门槛。

人工智能 LLaMA-Factory 微调 LoRA

3 0 0

2026-06-22

最新

使用 Axolotl 微调

使用 Axolotl 框架通过 YAML 配置文件轻松微调 Llama、Mistral 等模型，支持 QLoRA、全参数等多种模式。

人工智能 Axolotl 微调框架

4 0 0

2026-06-22

最新

本地模型微调实战

在本地 GPU 环境下完整复现大模型微调过程，涵盖数据收集与清洗、训练配置、损失监控与模型导出。

人工智能本地微调训练部署

5 0 0

2026-06-22

最新

Gemini 多模态模型

学习谷歌 Gemini 系列，理解其原生多模态设计，无缝处理文本、图像、音频和视频，与长达百万 Token 的上下文窗口。

人工智能 Gemini 多模态谷歌

2 0 0

2026-06-22

最新

Claude 模型使用

学习 Anthropic 的 Claude 模型，掌握其 API 使用、超长上下文能力和宪法 AI 训练带来的独特安全特性。

人工智能 Claude Anthropic 安全

2 0 0

2026-06-22

最新

混元大模型

了解腾讯混元大模型的技术架构，包括其 MoE 结构、多模态能力和在腾讯生态各产品中的落地实践。

人工智能混元腾讯大模型

3 0 0

2026-06-22

最新

文心一言 ERNIE

了解百度文心一言 ERNIE 模型的训练策略，包括知识增强、持续学习以及其在搜索、创作等产品中的应用。

人工智能 ERNIE 百度知识增强

1 0 0

2026-06-22

最新

通义千问 Qwen-VL

深入 Qwen-VL 架构，学习其如何将视觉编码与大语言模型结合，实现图像描述、问答和视觉定位等多模态能力。

人工智能 Qwen-VL 多模态视觉语言

4 0 0

2026-06-22

最新

面壁智能 CPM

了解面壁智能推出的 CPM 系列模型，涵盖纯语言与多模态版本，以及其在教育、办公等领域的具体应用。

人工智能 CPM 面壁智能预训练

3 0 0

2026-06-22

最新

Yi 系列大模型

学习零一万物的 Yi 系列模型，强调其在长上下文处理上的能力，以及面向多语言的先进架构设计。

人工智能 Yi 零一万物长上下文

2 0 0

2026-06-22

最新

InternLM 书生

了解 InternLM 及其后续版本的模型特点，在工具调用、推理和长上下文方面的性能，以及应用生态。

人工智能 InternLM 书生开源

4 0 0

2026-06-22

最新

Baichuan 大模型

学习百川智能开源的 Baichuan 系列模型，了解其在中文 NLP 任务上的表现、模型架构及微调应用。

人工智能 Baichuan 开源中文

3 0 0

2026-06-22

最新

ChatGLM 模型

剖析 ChatGLM 系列的架构与训练，基于通用语言模型框架 GLM，深入支持中英双语的高效对话生成。

人工智能 ChatGLM 中文智谱

1 0 0

2026-06-22

最新

Qwen 模型系列

了解阿里通义千问 Qwen 系列模型，包括基础语言模型、MoE 和视觉语言版本，以及其训练特色与使用。

人工智能 Qwen 大模型阿里

4 0 0

2026-06-22

最新

DeepSeek MoE 架构

学习 DeepSeek 提出的混合专家架构，结合细粒度专家和共享专家，在提升模型容量同时控制计算成本。

人工智能 DeepSeek MoE 细粒度

1 0 0

2026-06-22

最新

专家容量

通过设定专家容量，对每个专家能处理的最大 Token 数进行硬限制，避免显存溢出并强制路由平衡。

人工智能专家容量 MoE 负载均衡

5 0 0

2026-06-22

最新

负载均衡损失

学习设计辅助损失函数，鼓励路由将 Token 均匀分配给不同专家，防止模型仅依赖少数专家。

人工智能负载均衡 MoE 路由

3 0 0

2026-06-22

最新

软混合专家 Soft MoE

学习 Soft MoE 如何将 Token 以连续权重分配给所有专家，并先合并输入再分派，在完全可微分的同时更易训练。

人工智能 Soft MoE 专家混合软分配

1 0 0

2026-06-22

最新

混合专家 MoE 深入

深入 MoE 架构，解析 Top-K 路由、专家负载均衡损失和容量因子的设计，实现参数总量巨大但计算量恒定的大模型。

人工智能 MoE 专家混合路由

5 0 0

2026-06-22

最新

大海捞针测试

在长文档中随机插入特定事实，测试模型在各深度和位置上的召回准确性，成为长上下文评测标准。

人工智能大海捞针评估长上下文

3 0 0

2026-06-22

最新

上下文窗口评估

学习评估长上下文模型性能的基准和方法，包括大海捞针测试、RULER 等，检测模型在不同位置的信息提取能力。

人工智能上下文评估基准长文本

3 0 0

2026-06-22

最新

长文本训练优化

解决超长文本训练时的显存与计算挑战，学习序列并行、选择性激活检查点和分页优化等工程技术。

人工智能长文本训练显存优化序列并行

5 0 0

2026-06-22

最新

YaRN 位置编码

学习 YaRN 同时调整 RoPE 的频率基数和注意力温度，仅需微量微调即可让模型在 128k 甚至更长的上下文上保持准确。

人工智能 YaRN 位置编码长上下文

3 0 0

2026-06-22

最新

动态 NTK

在推理时根据当前序列长度动态调整 RoPE 的缩放因子，实现更灵活的上下文窗口扩展，兼具性能与外推。

人工智能动态NTK RoPE 自适应

3 0 0

2026-06-22

最新

NTK 感知缩放

基于神经正切核理论，NTK 感知缩放对 RoPE 的不同频率维度施以不同缩放因子，更好地保留高频细节，扩展上下文。

人工智能 NTK RoPE 上下文扩展

3 0 0

2026-06-22

最新

位置插值 PI

学习位置插值方法，直接对 RoPE 的位置索引进行线性缩放，将长距离“压缩”到原始上下文范围，实现快速扩展。

人工智能位置插值 RoPE 上下文扩展

3 0 0

2026-06-22

最新

ALiBi 线性偏置

学习 ALiBi 如何直接在注意力分数上加一个随距离递减的线性偏置，无需学习复杂位置编码即可实现上下文外推。

人工智能 ALiBi 位置编码外推

5 0 0

2026-06-22

最新

RoPE 旋转位置编码

深入 RoPE 的数学原理，学习它如何通过旋转变换将相对位置信息融入到注意力的内积中，支持良好外推。

人工智能 RoPE 位置编码外推

6 0 0

2026-06-22

最新

长上下文扩展技术

综合学习位置插值、NTK 缩放、YaRN 和稀疏注意力等方法，将预训练模型的上下文窗口扩展数倍。

人工智能长上下文位置编码扩展

6 0 0

2026-06-22

最新

FlashDecoding 加速

针对 FlashAttention 在解码阶段利用率低的问题，学习 FlashDecoding 如何并行处理长 KV 序列以加速生成。

人工智能 FlashDecoding 解码加速长序列

3 0 0

2026-06-22

最新

分组查询注意力 GQA

在 MHA 和 MQA 之间折中，将 Query 头分组共享 KV，以较少质量损失换取显著推理加速，成为 Llama 2 等模型标配。

人工智能 GQA 注意力推理加速

3 0 0

2026-06-22

最新

多查询注意力 MQA

学习 MQA 让所有 Query 头共享同一套 Key/Value 投影，大幅减少推理时的 KV 缓存，加速自回归生成。

人工智能 MQA 推理加速 KV缓存

3 0 0

2026-06-22

最新

滑动窗口注意力

采用滑动窗口限制每个 Query 只与相邻 Token 交互，结合层叠感受野，以线性复杂度处理超长序列。

人工智能滑动窗口局部注意力长文本

3 0 0

2026-06-22

最新

稀疏注意力 Sparse Attn

学习通过稀疏化注意力矩阵，如局部窗口、空洞窗口和全局标记等方式，显著降低计算量并扩展模型上下文长度。

人工智能稀疏注意力高效长上下文

5 0 0

2026-06-21

最新

线性注意力机制

综述线性注意力机制的基本思想，通过核函数分解或关联内存设计，将标准注意力的 O(n²) 降至 O(n)，应对长序列建模。

人工智能线性注意力高效长序列

4 0 0

2026-06-21

最新

RetNet 保留网络

学习 RetNet 如何将注意力机制替代为多尺度保留机制，实现 Transformer 式的并行训练与 RNN 式的 O(1) 高效推理。

人工智能 RetNet 序列建模高效推理

2 0 0

2026-06-21