免费编程教程

最新
深度学习模型可解释性

综述深度学习可解释性方法,从特征归因、样本归因到模型蒸馏与概念分析,为模型决策提供透明度和可信度。

3 0 0
2026-06-14
最新
图异常检测

探索基于图结构、节点属性和 GNN 嵌入的图异常检测方法,发现社交网络、交易图中的欺诈节点和异常子图。

2 0 0
2026-06-14
最新
时序异常检测

学习针对时间序列的异常检测技术,包括 STL 残差分析、预测置信区间、变点检测和 LSTM-AE 等深度时序异常模型。

8 0 0
2026-06-14
最新
GANomaly 异常检测

剖析 GANomaly 架构,利用生成器-判别器间的特征匹配差异在图像级与像素级定位异常,适用于工业缺陷检测等场景。

5 0 0
2026-06-14
最新
自动编码器异常检测

利用正常数据训练自编码器,通过高重构误差指示异常,涵盖经典 AE、变分 AE 和融合图正则等高级变体在异常检测中的应用。

7 0 0
2026-06-14
最新
单类 SVM

学习仅靠正常样本训练的单类 SVM,通过寻找包含大多数数据的最小超球体并引入核技巧,实现对离群点的有效识别。

5 0 0
2026-06-14
最新
孤立森林 iForest

理解孤立森林如何利用随机划分树来快速孤立异常点,因其线性复杂度与良好效果成为高维数据异常检测的常用选择。

6 0 0
2026-06-14
最新
异常检测算法深入

系统梳理异常检测算法,涵盖统计 3-sigma、LOF、单类 SVM、孤立森林和深度自编码器等方法,及其在欺诈、故障检测中的应用。

6 0 0
2026-06-14
最新
SMOTE 过采样

深入 SMOTE 及其变体 Borderline-SMOTE、ADASYN,理解如何在特征空间插值合成新样本,改善模型对少数类的识别能力。

1 0 0
2026-06-14
最新
不平衡数据处理

解决分类中的样本不平衡问题,学习随机过/欠采样、SMOTE 系列及代价敏感学习,配合 Precision-Recall 等评估指标。

10 0 0
2026-06-14
最新
缺失值处理进阶

超越均值/中位数填补,学习多重插补、KNN 插补和基于预测模型的迭代填补方法,合理处理不同缺失机制下的数据缺失。

8 0 0
2026-06-14
最新
高基数特征处理

专门应对用户 ID、商品 ID 等高基数特征,学习特征哈希、基于聚类的编码和嵌入层方法,在防止过拟合下保留信息。

8 0 0
2026-06-14
最新
类别特征编码方法

对比独热、标签、频数、目标、留一法及 CatBoost 编码等类别变量处理方案,根据基数与过拟合风险选择合适的编码策略。

7 0 0
2026-06-14
最新
自动化特征选择

掌握方差选择、互信息过滤、RFE 包裹式选择和 L1 正则化嵌入式选择等方法,结合 SHAP 自动筛选高价值特征。

10 0 0
2026-06-14
最新
文本特征工程

回顾并深入文本特征提取技术,从词袋、TF-IDF 到预训练句子嵌入,以及阅读难度、情感分等统计特征,为 NLP 管道奠基。

11 0 0
2026-06-14
最新
图特征工程

学习从原始图数据中提取节点度、中心性、聚类系数等拓扑特征,结合 Node2Vec 等图嵌入生成用于下游 ML 任务的输入。

11 0 0
2026-06-14
最新
时间序列特征构建

系统学习为时间序列数据构建特征,包括滞后项、滚动窗口统计、自相关和傅里叶变换分量,提升时序预测模型的效果。

16 0 0
2026-06-14
最新
特征工程深入

拓展特征工程视野,涵盖时间序列滑窗聚合、高阶交叉特征、基于嵌入的特征和自动化特征构建,挖掘数据深层信号。

11 0 0
2026-06-14
最新
KServe 无服务器推理

掌握 KServe 的推理服务抽象,利用自动扩缩、灰度发布、输入解释等特性在 Kubernetes 上搭建弹性、生产级模型推理平台。

11 0 0
2026-06-14
最新
BentoML 模型打包

使用 BentoML 将任意框架模型打包为标准化 bento,并通过 BentoServer 和容器一键部署为高性能推理 API,简化工程化流程。

7 0 0
2026-06-14
最新
模型服务框架 Seldon Core

学习在 Kubernetes 上使用 Seldon Core 编排模型推理图,支持多组件管道、金丝雀发布、漂移检测与内置解释,实现企业级模型服务。

6 0 0
2026-06-14
最新
模型压缩与部署

总结模型压缩技术栈,串联量化、剪枝、蒸馏和硬件特定优化,设计适配服务端、边缘与移动端的轻量级部署方案。

10 0 0
2026-06-14
最新
TensorBoard 可视化

掌握 TensorBoard 完整用法,可视化标量、计算图、嵌入投影和图像等,为 PyTorch 和 TensorFlow 训练提供直观调试途径。

11 0 0
2026-06-14
最新
模型监控 WandB

集成 Weights & Biases 到训练脚本中,实现实时指标仪表板、超参数记录、模型版本对比与团队协作报告,提升实验管理效率。

8 0 0
2026-06-14
最新
超参数调优 Hyperopt

使用 Hyperopt 库通过 TPE 算法对学习率、层数、Dropout 等超参数进行贝叶斯搜索,自动找到最优配置,提升模型表现。

1 0 0
2026-06-14
最新
损失突刺与恢复

专讲损失突刺现象,学会设置监控告警、自动回滚到稳定检查点并重调学习率,构建鲁棒的持续训练流程。

5 0 0
2026-06-14
最新
大模型训练稳定性

分析大模型训练中常见的损失突刺与发散问题,学习通过降低学习率、回滚检查点、修正数据等策略恢复训练并提升整体稳定性。

7 0 0
2026-06-14
最新
通信优化 NCCL

理解 NVIDIA NCCL 库如何实现拓扑感知的集合通信,学习 AllReduce、AllGather 等原语及其在分布式训练中的调优,加速梯度同步。

14 0 0
2026-06-14
最新
混合精度训练 AMP

学习自动混合精度训练机制,利用 FP16 或 BF16 计算加速并省内存,通过损失缩放与动态类型转换保持训练数值稳定。

8 0 0
2026-06-14
最新
梯度累积与检查点

掌握梯度累积以在小 GPU 上模拟大批次训练,结合激活检查点用时间换空间,突破显存限制,保障模型稳定收敛。

9 0 0
2026-06-14
最新
FSDP 全分片数据并行

学习 PyTorch FSDP 的原理与用法,在数据并行中分片模型参数、梯度和优化器状态,并支持多种分片策略以平衡内存与通信。

7 0 0
2026-06-14
最新
Megatron-LM 训练框架

解读 NVIDIA Megatron-LM 如何精巧地组合张量并行、流水线并行和数据并行,实现 GPT、T5 等架构的高效万卡级训练。

7 0 0
2026-06-14
最新
DeepSpeed 分布式训练

全栈学习微软 DeepSpeed,掌握 ZeRO 优化、通信压缩、混合精度训练和 DeepSpeed-Inference 等特性,低成本训练与部署超大模型。

7 0 0
2026-06-14
最新
零冗余优化器 ZeRO

深入 ZeRO 三阶段,学习如何将优化器状态、梯度和模型参数分片到数据并行组,配合 CPU 卸载,近乎消除分布式训练的内存冗余。

6 0 0
2026-06-14
最新
专家并行混合专家

了解如何将混合专家模型的不同专家分布到多卡,通过专家并行与辅助损失平衡路由,实现参数总量巨大但计算量恒定的高效分布式训练。

7 0 0
2026-06-14
最新
序列并行

探索序列并行技术,将长序列沿序列维度切分到多个设备,结合 Ring Attention 等方法降低注意力计算的显存峰值,训练更长上下文。

9 0 0
2026-06-14
最新
流水线并行

解读流水线并行的架构与调度策略,如 GPipe 与 1F1B,将模型的不同层分配到多个设备,通过微批次流水化减少计算空泡。

6 0 0
2026-06-14
最新
模型并行张量并行

学习张量并行的原理,如何将 Transformer 层内的权重矩阵按列或行切分到多个 GPU,减少单卡显存占用并实现更大模型训练。

7 0 0
2026-06-14
最新
OpenVINO LLM 推理

掌握使用 OpenVINO 工具套件在英特尔 CPU、GPU 和 NPU 上优化并部署大语言模型,实现低比特量化与高效推理的最佳实践。

8 0 0
2026-06-14
最新
ONNX Runtime LLM

学习使用 ONNX Runtime 针对大语言模型的生成式 API,通过量化与硬件加速适配器,在不同硬件后端高效部署 Llama、Phi 等生成式模型。

6 0 0
2026-06-14
最新
TensorRT-LLM

学习使用 TensorRT-LLM 将大模型编译为高度优化的推理引擎,融合算子、量化、张量并行等特性,在 NVIDIA GPU 上获得极致性能。

5 0 0
2026-06-14
最新
Triton 推理服务器

深入学习 NVIDIA Triton 推理服务器,配置多模型编排管道、动态批处理、集成 TensorRT 后端,构建高并发、低延迟的 AI 推理服务。

6 0 0
2026-06-14
最新
模型推理引擎 TGI

使用 Hugging Face 的 TGI 部署大模型,掌握其内置的连续批处理、张量并行、量化与日志水印等企业级特性,实现高效生产服务。

0 0 0
2026-06-14
最新
Ollama 本地部署 LLM

上手 Ollama 工具,在本地用一条命令下载并运行 Llama、Mistral 等模型,学习使用 Modelfile 创建自定义模型并暴露标准 API。

4 0 0
2026-06-14
最新
llama.cpp CPU 推理

编译并使用 llama.cpp 在纯 CPU 或混合 Metal/CUDA 环境下高效运行量化大模型,涵盖服务器、命令行和内置 HTTP 服务等模式。

4 0 0
2026-06-14
最新
llamafile 单文件分发

学习如何使用 llamafile 将 LLM 权重和运行时打包为单个多平台可执行文件,一键在 Windows、macOS 和 Linux 上运行大模型。

8 0 0
2026-06-14
最新
GGML / GGUF 量化格式

了解 GGML 及后继 GGUF 文件格式的设计思想,如何将模型权重打包并支持多级量化,成为 llama.cpp 等 CPU 高效推理的基石。

4 0 0
2026-06-14
最新
bitsandbytes 8-bit/4-bit

实践 bitsandbytes 库,通过 LLM.int8()、NF4、双重量化等量化方案在消费级 GPU 上加载并微调超大规模模型,结合 QLoRA 尤佳。

8 0 0
2026-06-14
最新
SmoothQuant 平滑量化

了解 SmoothQuant 如何通过数学等效变换将激活中的异常值难度转移到权重,实现无需重训练的 W8A8 量化,保持大模型精度。

1 0 0
2026-06-14
最新
AWQ 激活感知量化

学习 Activation-aware Weight Quantization,通过对重要权重通道基于激活分布进行缩放保护,仅优化少量缩放因子实现 SOTA 低比特量化。

6 0 0
2026-06-14
最新
模型量化 GPTQ

解读 GPTQ 量化算法,如何利用层-wise 的 Hessian 逆矩阵信息逐列量化权重,实现大模型在 4-bit 精度下极低的精度损失。

7 0 0
2026-06-14
最新
前瞻解码 Lookahead Decoding

学习利用雅可比迭代法并行猜测并验证多个未来 Token 的前瞻解码技术,无需草稿模型即可实现无损的生成速度飞跃。

2 0 0
2026-06-14
最新
美杜莎头 Medusa 加速

深入 Medusa 架构,在模型顶部附加多个预测头同时生成多个后续 Token,结合树状注意力验证,实现并行推测解码的大幅加速。

3 0 0
2026-06-14
最新
推测解码 Speculative Decoding

学习推测解码如何用小模型快速生成草稿,大模型并行验证并接受匹配 Token,在不改变输出的前提下实现数倍推理加速。

2 0 0
2026-06-14
最新
连续批处理 Continuous Batching

掌握大模型推理中的连续批处理技术,允许新请求随时加入正在执行的批次,避免传统静态批处理的填充等待,大幅提升服务吞吐。

2 0 0
2026-06-14
最新
FlashAttention-2

了解 FlashAttention-2 在前作基础上如何优化并行策略与线程块调度,将 GPU 利用率推至更高,实现近 2 倍的训练与推理加速。

5 0 0
2026-06-14
最新
FlashAttention 加速

解析 FlashAttention 如何通过分块计算与重计算技术,在 SRAM 中完成注意力计算,实现内存与速度的双重突破,且数学上完全等价。

8 0 0
2026-06-14
最新
PagedAttention 分页注意力

学习 PagedAttention 如何借鉴操作系统分页思想,将 KV 缓存划分为块进行非连续存储,近乎消除内部碎片,革命性提升服务吞吐。

2 0 0
2026-06-14
最新
大模型推理加速 vLLM

深入 vLLM 架构,掌握其 PagedAttention 机制如何近似零浪费管理 KV 缓存,并与连续批处理结合,实现比普通推理高数十倍的吞吐量。

3 0 0
2026-06-14
最新
人类评估与自动评估

对比人类评估和基于规则、模型、统计的自动评估方法,了解二者权衡,设计既经济又能反映真实质量的大模型离线评估流程。

4 0 0
2026-06-14