免费编程教程

最新
时序模型 Informer

学习 Informer 如何通过概率稀疏注意力机制和自注意力蒸馏,在长序列时间序列预测中大幅降低计算复杂度。

4 0 0
2026-06-21
最新
RepVGG 重参数化

学习 RepVGG 的重参数化技巧,在训练时使用多分支架构提升精度,在推理时等价合并为简单的 VGG 风格模型。

4 0 0
2026-06-21
最新
ConvNeXt 现代卷积网络

将 Transformer 的训练策略与结构设计融入卷积网络,打造 ConvNeXt,纯卷积架构达到与 Transformer 可比肩的性能。

4 0 0
2026-06-21
最新
CSWin Transformer

学习 CSWin 的十字形窗口自注意力,通过水平和垂直条纹窗口并行计算,兼顾计算效率和全局建模能力。

6 0 0
2026-06-21
最新
Twins Transformer

了解 Twins 架构如何通过空间可分离自注意力结合局部和全局信息,以更低成本实现优异的多尺度视觉表征。

9 0 0
2026-06-21
最新
PVT 金字塔 Vision Transformer

学习金字塔 Vision Transformer 如何逐渐降低序列长度并增加通道数,生成多尺度特征,适配检测分割等任务。

5 0 0
2026-06-21
最新
Swin Transformer 层级设计

深入 Swin Transformer,学习其移位窗口注意力机制和层级金字塔结构,在下游密集预测任务中展现强大性能。

7 0 0
2026-06-21
最新
视觉 Transformer ViT

学习 Vision Transformer 如何将图像切割为固定大小的 Patch,并应用 Transformer 编码器进行全局特征交互。

4 0 0
2026-06-21
最新
ShuffleNet 通道混洗

学习 ShuffleNet 如何通过通道混洗打破分组卷积间的信息隔离,在极低计算量下保持良好表征能力。

5 0 0
2026-06-21
最新
移动端模型 MobileNet

掌握 MobileNet 系列如何利用深度可分离卷积和线性瓶颈结构,实现移动和嵌入式设备上的实时视觉模型。

6 0 0
2026-06-21
最新
高效网络 EfficientNet

学习 EfficientNet 提出的复合缩放方法,同时调整网络宽度、深度和分辨率,在约束资源下获得卓越精度。

6 0 0
2026-06-21
最新
可微分架构搜索 DARTS

深入 DARTS 算法,将离散架构选择松弛为连续优化,通过双层梯度下降高效搜索网络单元结构。

4 0 0
2026-06-21
最新
神经网络架构搜索 NAS

综述神经架构搜索的主要方法,包括基于强化学习、进化算法和可微分搜索 DARTS,自动寻找最优网络结构。

5 0 0
2026-06-21
最新
自蒸馏正则化

将模型上一阶段的预测作为软目标指导当前训练,或利用 EMA 教师进行自蒸馏,起到平滑和正则化效果。

6 0 0
2026-06-21
最新
正则化 DropBlock

学习 DropBlock 如何丢弃连续区域而非独立单元,强制网络利用剩余区域学习,适合卷积层正则化。

3 0 0
2026-06-21
最新
RandAugment 自动增强

学习 RandAugment 的极简自动增强方法,仅需选择操作数量和全局强度,无需复杂搜索即可显著提升性能。

3 0 0
2026-06-21
最新
Cutmix 增强

在图像中随机剪切一块区域并替换为另一张图像的对应区域,同时按面积比混合标签,提升模型对遮挡的鲁棒性。

3 0 0
2026-06-21
最新
Mixup 数据增强

学习 Mixup 增强,通过随机线性插值混合两个样本及其标签,引导模型学习线性行为,增强泛化与鲁棒性。

4 0 0
2026-06-21
最新
标签平滑 Label Smoothing

将硬目标 one-hot 标签调整为软标签,降低模型对训练标签的信心,提升泛化与模型校准能力。

4 0 0
2026-06-21
最新
Stochastic Depth

学习在训练超深残差网络时随机丢弃整层,只在测试时使用完整深度,类似 Dropout 的层级别正则化手段。

4 0 0
2026-06-21
最新
Dropout 与变体

回顾 Dropout 原理及其变体如 DropConnect、Spatial Dropout、变分 Dropout,在训练时随机丢弃单元防止过拟合。

4 0 0
2026-06-21
最新
权重标准化 Weight Standardization

学习权重标准化技术,通过对卷积层权重施加零均值单位方差约束,结合 GroupNorm 进一步改善优化效果。

6 0 0
2026-06-21
最新
实例归一化 InstanceNorm

学习实例归一化如何对单个样本的每个通道独立标准化,剔除样本特有的对比度信息,常用于图像风格迁移。

6 0 0
2026-06-21
最新
分组归一化 GroupNorm

针对 BatchNorm 在小批次时失效的问题,学习分组归一化如何将通道分组进行标准化,在检测和分割任务中表现稳定。

9 0 0
2026-06-21
最新
层归一化 LayerNorm

学习层归一化如何在特征维度上标准化,不依赖于批次大小,成为 NLP 和 Transformer 架构的标配组件。

6 0 0
2026-06-21
最新
批归一化 BatchNorm

深入批归一化的前向与反向计算,理解其缓解内部协变量偏移、允许更大学习率的机制及其微正则化效应。

6 0 0
2026-06-21
最新
权重初始化策略

掌握常用的权重初始化方法,理解 Xavier 和 He 初始化的前向/反向方差传播原理,避免训练早期的梯度消失或爆炸。

4 0 0
2026-06-21
最新
梯度裁剪

学习基于范数和基于值的梯度裁剪方法,设置阈值防止梯度爆炸,保障循环网络等模型的训练稳定性。

10 0 0
2026-06-21
最新
分层学习率

在微调预训练模型时,对不同层使用不同大小的学习率,底层小更新保持通用特征,顶层大更新适应新任务。

6 0 0
2026-06-21
最新
循环学习率

实施循环学习率策略,让学习率在设定的范围内周期性地升降,帮助模型跳出局部最优并加速收敛。

5 0 0
2026-06-21
最新
余弦退火调度

学习余弦退火及其重启变种,通过余弦曲线平滑降低学习率,帮助模型收敛到更优的平坦极小值。

5 0 0
2026-06-21
最新
学习率预热 Warmup

理解学习率预热的必要性,实现线性、指数等预热策略,避免训练初期大幅参数更新导致的不稳定。

3 0 0
2026-06-21
最新
LAMB / LARS 大 batch 优化

学习针对大批次训练设计的 LARS 和 LAMB 优化器,利用分层自适应学习率稳定训练超大批次模型。

3 0 0
2026-06-21
最新
优化器变种 AdamW

了解 AdamW 如何将权重衰减与梯度自适应更新解耦,避免 Adam 中 L2 正则化与学习率的耦合问题,提升泛化。

3 0 0
2026-06-21
最新
Dice Loss 分割

学习 Dice 系数及其损失函数,直接优化预测分割图与真实掩码的重叠区域,处理强类不平衡分割任务。

3 0 0
2026-06-21
最新
焦点损失 Focal Loss

学习 Focal Loss 如何通过调制因子降低已正确分类样本的损失贡献,引导模型专注于困难样本。

3 0 0
2026-06-21
最新
Circle Loss

理解 Circle Loss 如何通过统一的决策边界优化类内相似度和类间差异,提升细粒度图像检索性能。

3 0 0
2026-06-21
最新
Proxy NCA 损失

学习 Proxy NCA 损失,使用可学习的代理向量近似真实样本分布,避免直接配对计算,加快收敛。

6 0 0
2026-06-21
最新
N-pair Loss

扩展三元组损失,在每个批次中使用多个负样本进行联合比较,提升嵌入空间的判别性和训练效率。

8 0 0
2026-06-21
最新
三元组损失 Triplet Loss

掌握三元组损失的原理,学习如何选取困难三元组,在人脸识别、图像检索中拉近正例、推远负例。

8 0 0
2026-06-21
最新
度量学习对比损失

学习成对对比损失和 Siamese 网络,通过优化样本对的距离实现度量空间的判别性嵌入。

4 0 0
2026-06-21
最新
自定义损失函数设计

学习在 PyTorch/TensorFlow 中编写自定义损失函数,针对非对称代价、物理约束等多目标需求设计优化目标。

3 0 0
2026-06-21
最新
损失函数大全

系统梳理监督学习中分类、回归、排序等任务的常用损失函数,理解其数学形式和适用场景。

5 0 0
2026-06-21
最新
混合精度训练细节

深入混合精度训练的工程细节,掌握 FP16/BF16 自动选择、损失缩放策略和梯度累积中的精度控制。

5 0 0
2026-06-21
最新
数值计算稳定 softmax

学习数值稳定 softmax 的原理,使用最大值减法技巧避免上溢/下溢,以及在交叉熵损失中的 LogSumExp 技巧。

5 0 0
2026-06-21
最新
MLIR 中间表示

了解 MLIR 如何提供可扩展的方言系统,统一表示从高层 ML 图到底层硬件指令,促进跨框架优化。

6 0 0
2026-06-21
最新
XLA 加速线性代数

学习 XLA 如何将计算图编译为优化的 HLO 内核,通过算子融合和内存优化加速 TensorFlow 和 JAX 中的线性代数运算。

7 0 0
2026-06-21
最新
深度学习编译器 TVM

掌握 Apache TVM 的编译流程,将模型从高级框架编译为目标硬件的高效代码,通过自动调优实现极致性能。

9 0 0
2026-06-21
最新
AI 性能分析工具

学习使用 PyTorch Profiler、NVIDIA Nsight 等工具剖析模型计算图,定位算子性能瓶颈和内存使用。

7 0 0
2026-06-21
最新
模型效率基准 MLPerf

了解 MLPerf Training 和 Inference 基准,比较不同硬件与框架的模型训练时间和推理延迟,指导平台选型。

6 0 0
2026-06-21
最新
碳足迹追踪工具

使用 CodeCarbon、MLCO2 等工具自动估算模型训练期间的电能消耗与碳排放,辅助环保决策。

6 0 0
2026-06-21
最新
环境影响与绿色 AI

探讨大模型训练和推理的能源消耗,学习通过稀疏化、量化、高效架构及碳感知调度实现绿色 AI。

5 0 0
2026-06-21
最新
算法审计

学习如何对 AI 系统进行内部或外部审计,检测歧视性行为、评估合规性并出具改进建议报告。

7 0 0
2026-06-21
最新
负责任 AI 原则

掌握负责任 AI 的核心原则,包括公平性、透明性、可解释性、隐私保护与可问责性,指导 AI 系统的伦理构建。

7 0 0
2026-06-21
最新
欧盟 AI 法案解读

详细解析欧盟 AI 法案的适用范围、风险等级分类、义务主体和关键时间节点,辅助企业进行 AI 合规。

10 0 0
2026-06-21
最新
AI 治理与法规

解读欧盟 AI 法案的分级监管框架,了解其对高风险 AI 系统的要求,以及全球 AI 治理的最新动态。

4 0 0
2026-06-21
最新
AI 供应链安全

关注 AI 软件的供应链风险,包括预训练模型来源、第三方依赖、模型卡片与签名,构建可信的模型获取渠道。

7 0 0
2026-06-21
最新
数据中毒攻击

分析攻击者如何注入恶意样本破坏模型,学习基于异常检测、鲁棒聚合等防御中毒攻击的方法。

7 0 0
2026-06-21
最新
成员推理攻击

了解攻击者如何推断某个样本是否在模型的训练集中,以及差分隐私等防御措施对成员推理的缓解。

6 0 0
2026-06-21
最新
模型窃取攻击

学习如何通过多次查询黑盒 API 来提取模型功能,以及限制查询速率、检测异常访问等防护策略。

8 0 0
2026-06-21