人工智能在线教程 | 从算法到应用，解锁AI潜能

最新

深度学习模型可解释性

综述深度学习可解释性方法，从特征归因、样本归因到模型蒸馏与概念分析，为模型决策提供透明度和可信度。

人工智能可解释性归因模型透明

3 0 0

2026-06-14

最新

图异常检测

探索基于图结构、节点属性和 GNN 嵌入的图异常检测方法，发现社交网络、交易图中的欺诈节点和异常子图。

人工智能图异常 GNN 欺诈检测

2 0 0

2026-06-14

最新

时序异常检测

学习针对时间序列的异常检测技术，包括 STL 残差分析、预测置信区间、变点检测和 LSTM-AE 等深度时序异常模型。

人工智能时序异常变点检测时间序列

8 0 0

2026-06-14

最新

GANomaly 异常检测

剖析 GANomaly 架构，利用生成器-判别器间的特征匹配差异在图像级与像素级定位异常，适用于工业缺陷检测等场景。

人工智能 GANomaly 异常检测生成对抗网络

5 0 0

2026-06-14

最新

自动编码器异常检测

利用正常数据训练自编码器，通过高重构误差指示异常，涵盖经典 AE、变分 AE 和融合图正则等高级变体在异常检测中的应用。

人工智能自动编码器异常检测重构误差

7 0 0

2026-06-14

最新

单类 SVM

学习仅靠正常样本训练的单类 SVM，通过寻找包含大多数数据的最小超球体并引入核技巧，实现对离群点的有效识别。

人工智能单类SVM 异常检测核方法

5 0 0

2026-06-14

最新

孤立森林 iForest

理解孤立森林如何利用随机划分树来快速孤立异常点，因其线性复杂度与良好效果成为高维数据异常检测的常用选择。

人工智能孤立森林异常检测无监督

6 0 0

2026-06-14

最新

异常检测算法深入

系统梳理异常检测算法，涵盖统计 3-sigma、LOF、单类 SVM、孤立森林和深度自编码器等方法，及其在欺诈、故障检测中的应用。

人工智能异常检测无监督学习故障检测

6 0 0

2026-06-14

最新

SMOTE 过采样

深入 SMOTE 及其变体 Borderline-SMOTE、ADASYN，理解如何在特征空间插值合成新样本，改善模型对少数类的识别能力。

人工智能 SMOTE 过采样类别不平衡

1 0 0

2026-06-14

最新

不平衡数据处理

解决分类中的样本不平衡问题，学习随机过/欠采样、SMOTE 系列及代价敏感学习，配合 Precision-Recall 等评估指标。

人工智能不平衡数据重采样分类

10 0 0

2026-06-14

最新

缺失值处理进阶

超越均值/中位数填补，学习多重插补、KNN 插补和基于预测模型的迭代填补方法，合理处理不同缺失机制下的数据缺失。

人工智能缺失值插补数据清洗

8 0 0

2026-06-14

最新

高基数特征处理

专门应对用户 ID、商品 ID 等高基数特征，学习特征哈希、基于聚类的编码和嵌入层方法，在防止过拟合下保留信息。

人工智能高基数特征编码嵌入

8 0 0

2026-06-14

最新

类别特征编码方法

对比独热、标签、频数、目标、留一法及 CatBoost 编码等类别变量处理方案，根据基数与过拟合风险选择合适的编码策略。

人工智能类别特征编码预处理

7 0 0

2026-06-14

最新

自动化特征选择

掌握方差选择、互信息过滤、RFE 包裹式选择和 L1 正则化嵌入式选择等方法，结合 SHAP 自动筛选高价值特征。

人工智能特征选择自动化降维

10 0 0

2026-06-14

最新

文本特征工程

回顾并深入文本特征提取技术，从词袋、TF-IDF 到预训练句子嵌入，以及阅读难度、情感分等统计特征，为 NLP 管道奠基。

人工智能文本特征 NLP 特征工程

11 0 0

2026-06-14

最新

图特征工程

学习从原始图数据中提取节点度、中心性、聚类系数等拓扑特征，结合 Node2Vec 等图嵌入生成用于下游 ML 任务的输入。

人工智能图特征图嵌入特征工程

11 0 0

2026-06-14

最新

时间序列特征构建

系统学习为时间序列数据构建特征，包括滞后项、滚动窗口统计、自相关和傅里叶变换分量，提升时序预测模型的效果。

人工智能时间序列特征工程窗口特征

16 0 0

2026-06-14

最新

特征工程深入

拓展特征工程视野，涵盖时间序列滑窗聚合、高阶交叉特征、基于嵌入的特征和自动化特征构建，挖掘数据深层信号。

人工智能特征工程数据挖掘特征构造

11 0 0

2026-06-14

最新

KServe 无服务器推理

掌握 KServe 的推理服务抽象，利用自动扩缩、灰度发布、输入解释等特性在 Kubernetes 上搭建弹性、生产级模型推理平台。

人工智能 KServe 无服务器推理平台

11 0 0

2026-06-14

最新

BentoML 模型打包

使用 BentoML 将任意框架模型打包为标准化 bento，并通过 BentoServer 和容器一键部署为高性能推理 API，简化工程化流程。

人工智能 BentoML 模型打包部署

7 0 0

2026-06-14

最新

模型服务框架 Seldon Core

学习在 Kubernetes 上使用 Seldon Core 编排模型推理图，支持多组件管道、金丝雀发布、漂移检测与内置解释，实现企业级模型服务。

人工智能 Seldon Core 模型服务 Kubernetes

6 0 0

2026-06-14

最新

模型压缩与部署

总结模型压缩技术栈，串联量化、剪枝、蒸馏和硬件特定优化，设计适配服务端、边缘与移动端的轻量级部署方案。

人工智能模型压缩部署推理优化

10 0 0

2026-06-14

最新

TensorBoard 可视化

掌握 TensorBoard 完整用法，可视化标量、计算图、嵌入投影和图像等，为 PyTorch 和 TensorFlow 训练提供直观调试途径。

人工智能 TensorBoard 可视化调试

11 0 0

2026-06-14

最新

模型监控 WandB

集成 Weights & Biases 到训练脚本中，实现实时指标仪表板、超参数记录、模型版本对比与团队协作报告，提升实验管理效率。

人工智能 WandB 监控实验追踪

8 0 0

2026-06-14

最新

超参数调优 Hyperopt

使用 Hyperopt 库通过 TPE 算法对学习率、层数、Dropout 等超参数进行贝叶斯搜索，自动找到最优配置，提升模型表现。

人工智能超参数调优 Hyperopt 贝叶斯优化

1 0 0

2026-06-14

最新

损失突刺与恢复

专讲损失突刺现象，学会设置监控告警、自动回滚到稳定检查点并重调学习率，构建鲁棒的持续训练流程。

人工智能损失突刺训练恢复稳定性

5 0 0

2026-06-14

最新

大模型训练稳定性

分析大模型训练中常见的损失突刺与发散问题，学习通过降低学习率、回滚检查点、修正数据等策略恢复训练并提升整体稳定性。

人工智能训练稳定性损失突刺大模型

7 0 0

2026-06-14

最新

通信优化 NCCL

理解 NVIDIA NCCL 库如何实现拓扑感知的集合通信，学习 AllReduce、AllGather 等原语及其在分布式训练中的调优，加速梯度同步。

人工智能 NCCL 通信分布式

14 0 0

2026-06-14

最新

混合精度训练 AMP

学习自动混合精度训练机制，利用 FP16 或 BF16 计算加速并省内存，通过损失缩放与动态类型转换保持训练数值稳定。

人工智能混合精度训练加速显存优化

8 0 0

2026-06-14

最新

梯度累积与检查点

掌握梯度累积以在小 GPU 上模拟大批次训练，结合激活检查点用时间换空间，突破显存限制，保障模型稳定收敛。

人工智能梯度累积检查点显存优化

9 0 0

2026-06-14

最新

FSDP 全分片数据并行

学习 PyTorch FSDP 的原理与用法，在数据并行中分片模型参数、梯度和优化器状态，并支持多种分片策略以平衡内存与通信。

人工智能 FSDP 分布式训练 PyTorch

7 0 0

2026-06-14

最新

Megatron-LM 训练框架

解读 NVIDIA Megatron-LM 如何精巧地组合张量并行、流水线并行和数据并行，实现 GPT、T5 等架构的高效万卡级训练。

人工智能 Megatron-LM 并行训练大模型

7 0 0

2026-06-14

最新

DeepSpeed 分布式训练

全栈学习微软 DeepSpeed，掌握 ZeRO 优化、通信压缩、混合精度训练和 DeepSpeed-Inference 等特性，低成本训练与部署超大模型。

人工智能 DeepSpeed 分布式训练加速

7 0 0

2026-06-14

最新

零冗余优化器 ZeRO

深入 ZeRO 三阶段，学习如何将优化器状态、梯度和模型参数分片到数据并行组，配合 CPU 卸载，近乎消除分布式训练的内存冗余。

人工智能 ZeRO 显存优化分布式训练

6 0 0

2026-06-14

最新

专家并行混合专家

了解如何将混合专家模型的不同专家分布到多卡，通过专家并行与辅助损失平衡路由，实现参数总量巨大但计算量恒定的高效分布式训练。

人工智能专家并行 MoE 分布式训练

7 0 0

2026-06-14

最新

序列并行

探索序列并行技术，将长序列沿序列维度切分到多个设备，结合 Ring Attention 等方法降低注意力计算的显存峰值，训练更长上下文。

人工智能序列并行长上下文显存优化

9 0 0

2026-06-14

最新

流水线并行

解读流水线并行的架构与调度策略，如 GPipe 与 1F1B，将模型的不同层分配到多个设备，通过微批次流水化减少计算空泡。

人工智能流水线并行分布式训练层切分

6 0 0

2026-06-14

最新

模型并行张量并行

学习张量并行的原理，如何将 Transformer 层内的权重矩阵按列或行切分到多个 GPU，减少单卡显存占用并实现更大模型训练。

人工智能张量并行分布式训练显存优化

7 0 0

2026-06-14

最新

OpenVINO LLM 推理

掌握使用 OpenVINO 工具套件在英特尔 CPU、GPU 和 NPU 上优化并部署大语言模型，实现低比特量化与高效推理的最佳实践。

人工智能 OpenVINO 推理英特尔

8 0 0

2026-06-14

最新

ONNX Runtime LLM

学习使用 ONNX Runtime 针对大语言模型的生成式 API，通过量化与硬件加速适配器，在不同硬件后端高效部署 Llama、Phi 等生成式模型。

人工智能 ONNX Runtime 生成式AI 推理优化

6 0 0

2026-06-14

最新

TensorRT-LLM

学习使用 TensorRT-LLM 将大模型编译为高度优化的推理引擎，融合算子、量化、张量并行等特性，在 NVIDIA GPU 上获得极致性能。

人工智能 TensorRT-LLM 推理优化 GPU加速

5 0 0

2026-06-14

最新

Triton 推理服务器

深入学习 NVIDIA Triton 推理服务器，配置多模型编排管道、动态批处理、集成 TensorRT 后端，构建高并发、低延迟的 AI 推理服务。

人工智能 Triton 推理服务器模型部署

6 0 0

2026-06-14

最新

模型推理引擎 TGI

使用 Hugging Face 的 TGI 部署大模型，掌握其内置的连续批处理、张量并行、量化与日志水印等企业级特性，实现高效生产服务。

人工智能 TGI 推理引擎生产部署

0 0 0

2026-06-14

最新

Ollama 本地部署 LLM

上手 Ollama 工具，在本地用一条命令下载并运行 Llama、Mistral 等模型，学习使用 Modelfile 创建自定义模型并暴露标准 API。

人工智能 Ollama 本地部署模型管理

4 0 0

2026-06-14

最新

llama.cpp CPU 推理

编译并使用 llama.cpp 在纯 CPU 或混合 Metal/CUDA 环境下高效运行量化大模型，涵盖服务器、命令行和内置 HTTP 服务等模式。

人工智能 llama.cpp CPU推理本地部署

4 0 0

2026-06-14

最新

llamafile 单文件分发

学习如何使用 llamafile 将 LLM 权重和运行时打包为单个多平台可执行文件，一键在 Windows、macOS 和 Linux 上运行大模型。

人工智能 llamafile 部署跨平台

8 0 0

2026-06-14

最新

GGML / GGUF 量化格式

了解 GGML 及后继 GGUF 文件格式的设计思想，如何将模型权重打包并支持多级量化，成为 llama.cpp 等 CPU 高效推理的基石。

人工智能 GGUF 量化格式 CPU推理

4 0 0

2026-06-14

最新

bitsandbytes 8-bit/4-bit

实践 bitsandbytes 库，通过 LLM.int8()、NF4、双重量化等量化方案在消费级 GPU 上加载并微调超大规模模型，结合 QLoRA 尤佳。

人工智能 bitsandbytes 量化 QLoRA

8 0 0

2026-06-14

最新

SmoothQuant 平滑量化

了解 SmoothQuant 如何通过数学等效变换将激活中的异常值难度转移到权重，实现无需重训练的 W8A8 量化，保持大模型精度。

人工智能 SmoothQuant INT8量化激活平滑

1 0 0

2026-06-14

最新

AWQ 激活感知量化

学习 Activation-aware Weight Quantization，通过对重要权重通道基于激活分布进行缩放保护，仅优化少量缩放因子实现 SOTA 低比特量化。

人工智能 AWQ 量化激活感知

6 0 0

2026-06-14

最新

模型量化 GPTQ

解读 GPTQ 量化算法，如何利用层-wise 的 Hessian 逆矩阵信息逐列量化权重，实现大模型在 4-bit 精度下极低的精度损失。

人工智能 GPTQ 量化大模型压缩

7 0 0

2026-06-14

最新

前瞻解码 Lookahead Decoding

学习利用雅可比迭代法并行猜测并验证多个未来 Token 的前瞻解码技术，无需草稿模型即可实现无损的生成速度飞跃。

人工智能前瞻解码并行生成推理加速

2 0 0

2026-06-14

最新

美杜莎头 Medusa 加速

深入 Medusa 架构，在模型顶部附加多个预测头同时生成多个后续 Token，结合树状注意力验证，实现并行推测解码的大幅加速。

人工智能 Medusa 推测解码并行加速

3 0 0

2026-06-14

最新

推测解码 Speculative Decoding

学习推测解码如何用小模型快速生成草稿，大模型并行验证并接受匹配 Token，在不改变输出的前提下实现数倍推理加速。

人工智能推测解码推理加速投机采样

2 0 0

2026-06-14

最新

连续批处理 Continuous Batching

掌握大模型推理中的连续批处理技术，允许新请求随时加入正在执行的批次，避免传统静态批处理的填充等待，大幅提升服务吞吐。

人工智能连续批处理吞吐优化推理服务

2 0 0

2026-06-14

最新

FlashAttention-2

了解 FlashAttention-2 在前作基础上如何优化并行策略与线程块调度，将 GPU 利用率推至更高，实现近 2 倍的训练与推理加速。

人工智能 FlashAttention-2 并行优化 GPU加速

5 0 0

2026-06-14

最新

FlashAttention 加速

解析 FlashAttention 如何通过分块计算与重计算技术，在 SRAM 中完成注意力计算，实现内存与速度的双重突破，且数学上完全等价。

人工智能 FlashAttention 注意力加速显存优化

8 0 0

2026-06-14

最新

PagedAttention 分页注意力

学习 PagedAttention 如何借鉴操作系统分页思想，将 KV 缓存划分为块进行非连续存储，近乎消除内部碎片，革命性提升服务吞吐。

人工智能 PagedAttention KV缓存内存管理

2 0 0

2026-06-14

最新

大模型推理加速 vLLM

深入 vLLM 架构，掌握其 PagedAttention 机制如何近似零浪费管理 KV 缓存，并与连续批处理结合，实现比普通推理高数十倍的吞吐量。

人工智能 vLLM 推理加速吞吐量

3 0 0

2026-06-14

最新

人类评估与自动评估

对比人类评估和基于规则、模型、统计的自动评估方法，了解二者权衡，设计既经济又能反映真实质量的大模型离线评估流程。

人工智能人类评估自动评估评价指标

4 0 0

2026-06-14

免费编程教程