免费编程教程

最新
RWKV 线性注意力 RNN

学习 RWKV 如何将注意力机制改造为线性循环形式,兼具高效并行训练和 O(1) 推理复杂度的优势。

4 0 0
2026-06-21
最新
Mamba 状态空间模型

学习 Mamba 如何引入输入依赖的选择机制,使状态空间模型具备上下文感知能力,实现线性复杂度的序列建模。

8 0 0
2026-06-21
最新
长短期记忆 XLSTM

了解 XLSTM 如何在经典 LSTM 基础上引入指数门控和新记忆结构,挑战 Transformer 在序列建模中的地位。

2 0 0
2026-06-21
最新
TimesNet 时序二维变

学习 TimesNet 如何通过寻找周期将一维时序数据重塑为二维张量,再用 Inception 模块捕获时间变化和周期内变化。

2 0 0
2026-06-21
最新
PatchTST 时间序列 patch

将时间序列切分为子序列 Patch,并使用通道独立策略和自监督预训练,在长期预测中取得 SOTA 性能。

2 0 0
2026-06-21
最新
Autoformer 自相关机制

学习 Autoformer 的序列分解架构和自相关替代注意力机制,捕捉时间序列中的趋势、季节性和时延依赖。

3 0 0
2026-06-21
最新
时序模型 Informer

学习 Informer 如何通过概率稀疏注意力机制和自注意力蒸馏,在长序列时间序列预测中大幅降低计算复杂度。

2 0 0
2026-06-21
最新
RepVGG 重参数化

学习 RepVGG 的重参数化技巧,在训练时使用多分支架构提升精度,在推理时等价合并为简单的 VGG 风格模型。

2 0 0
2026-06-21
最新
ConvNeXt 现代卷积网络

将 Transformer 的训练策略与结构设计融入卷积网络,打造 ConvNeXt,纯卷积架构达到与 Transformer 可比肩的性能。

3 0 0
2026-06-21
最新
CSWin Transformer

学习 CSWin 的十字形窗口自注意力,通过水平和垂直条纹窗口并行计算,兼顾计算效率和全局建模能力。

4 0 0
2026-06-21
最新
Twins Transformer

了解 Twins 架构如何通过空间可分离自注意力结合局部和全局信息,以更低成本实现优异的多尺度视觉表征。

8 0 0
2026-06-21
最新
PVT 金字塔 Vision Transformer

学习金字塔 Vision Transformer 如何逐渐降低序列长度并增加通道数,生成多尺度特征,适配检测分割等任务。

4 0 0
2026-06-21
最新
Swin Transformer 层级设计

深入 Swin Transformer,学习其移位窗口注意力机制和层级金字塔结构,在下游密集预测任务中展现强大性能。

6 0 0
2026-06-21
最新
视觉 Transformer ViT

学习 Vision Transformer 如何将图像切割为固定大小的 Patch,并应用 Transformer 编码器进行全局特征交互。

3 0 0
2026-06-21
最新
ShuffleNet 通道混洗

学习 ShuffleNet 如何通过通道混洗打破分组卷积间的信息隔离,在极低计算量下保持良好表征能力。

3 0 0
2026-06-21
最新
移动端模型 MobileNet

掌握 MobileNet 系列如何利用深度可分离卷积和线性瓶颈结构,实现移动和嵌入式设备上的实时视觉模型。

4 0 0
2026-06-21
最新
高效网络 EfficientNet

学习 EfficientNet 提出的复合缩放方法,同时调整网络宽度、深度和分辨率,在约束资源下获得卓越精度。

5 0 0
2026-06-21
最新
可微分架构搜索 DARTS

深入 DARTS 算法,将离散架构选择松弛为连续优化,通过双层梯度下降高效搜索网络单元结构。

3 0 0
2026-06-21
最新
神经网络架构搜索 NAS

综述神经架构搜索的主要方法,包括基于强化学习、进化算法和可微分搜索 DARTS,自动寻找最优网络结构。

4 0 0
2026-06-21
最新
自蒸馏正则化

将模型上一阶段的预测作为软目标指导当前训练,或利用 EMA 教师进行自蒸馏,起到平滑和正则化效果。

5 0 0
2026-06-21
最新
正则化 DropBlock

学习 DropBlock 如何丢弃连续区域而非独立单元,强制网络利用剩余区域学习,适合卷积层正则化。

2 0 0
2026-06-21
最新
RandAugment 自动增强

学习 RandAugment 的极简自动增强方法,仅需选择操作数量和全局强度,无需复杂搜索即可显著提升性能。

2 0 0
2026-06-21
最新
Cutmix 增强

在图像中随机剪切一块区域并替换为另一张图像的对应区域,同时按面积比混合标签,提升模型对遮挡的鲁棒性。

2 0 0
2026-06-21
最新
Mixup 数据增强

学习 Mixup 增强,通过随机线性插值混合两个样本及其标签,引导模型学习线性行为,增强泛化与鲁棒性。

3 0 0
2026-06-21
最新
标签平滑 Label Smoothing

将硬目标 one-hot 标签调整为软标签,降低模型对训练标签的信心,提升泛化与模型校准能力。

3 0 0
2026-06-21
最新
Stochastic Depth

学习在训练超深残差网络时随机丢弃整层,只在测试时使用完整深度,类似 Dropout 的层级别正则化手段。

3 0 0
2026-06-21
最新
Dropout 与变体

回顾 Dropout 原理及其变体如 DropConnect、Spatial Dropout、变分 Dropout,在训练时随机丢弃单元防止过拟合。

3 0 0
2026-06-21
最新
权重标准化 Weight Standardization

学习权重标准化技术,通过对卷积层权重施加零均值单位方差约束,结合 GroupNorm 进一步改善优化效果。

5 0 0
2026-06-21
最新
实例归一化 InstanceNorm

学习实例归一化如何对单个样本的每个通道独立标准化,剔除样本特有的对比度信息,常用于图像风格迁移。

5 0 0
2026-06-21
最新
分组归一化 GroupNorm

针对 BatchNorm 在小批次时失效的问题,学习分组归一化如何将通道分组进行标准化,在检测和分割任务中表现稳定。

8 0 0
2026-06-21
最新
层归一化 LayerNorm

学习层归一化如何在特征维度上标准化,不依赖于批次大小,成为 NLP 和 Transformer 架构的标配组件。

5 0 0
2026-06-21
最新
批归一化 BatchNorm

深入批归一化的前向与反向计算,理解其缓解内部协变量偏移、允许更大学习率的机制及其微正则化效应。

5 0 0
2026-06-21
最新
权重初始化策略

掌握常用的权重初始化方法,理解 Xavier 和 He 初始化的前向/反向方差传播原理,避免训练早期的梯度消失或爆炸。

3 0 0
2026-06-21
最新
梯度裁剪

学习基于范数和基于值的梯度裁剪方法,设置阈值防止梯度爆炸,保障循环网络等模型的训练稳定性。

9 0 0
2026-06-21
最新
分层学习率

在微调预训练模型时,对不同层使用不同大小的学习率,底层小更新保持通用特征,顶层大更新适应新任务。

5 0 0
2026-06-21
最新
循环学习率

实施循环学习率策略,让学习率在设定的范围内周期性地升降,帮助模型跳出局部最优并加速收敛。

4 0 0
2026-06-21
最新
余弦退火调度

学习余弦退火及其重启变种,通过余弦曲线平滑降低学习率,帮助模型收敛到更优的平坦极小值。

4 0 0
2026-06-21
最新
学习率预热 Warmup

理解学习率预热的必要性,实现线性、指数等预热策略,避免训练初期大幅参数更新导致的不稳定。

2 0 0
2026-06-21
最新
LAMB / LARS 大 batch 优化

学习针对大批次训练设计的 LARS 和 LAMB 优化器,利用分层自适应学习率稳定训练超大批次模型。

2 0 0
2026-06-21
最新
优化器变种 AdamW

了解 AdamW 如何将权重衰减与梯度自适应更新解耦,避免 Adam 中 L2 正则化与学习率的耦合问题,提升泛化。

2 0 0
2026-06-21
最新
Dice Loss 分割

学习 Dice 系数及其损失函数,直接优化预测分割图与真实掩码的重叠区域,处理强类不平衡分割任务。

2 0 0
2026-06-21
最新
焦点损失 Focal Loss

学习 Focal Loss 如何通过调制因子降低已正确分类样本的损失贡献,引导模型专注于困难样本。

2 0 0
2026-06-21
最新
Circle Loss

理解 Circle Loss 如何通过统一的决策边界优化类内相似度和类间差异,提升细粒度图像检索性能。

2 0 0
2026-06-21
最新
Proxy NCA 损失

学习 Proxy NCA 损失,使用可学习的代理向量近似真实样本分布,避免直接配对计算,加快收敛。

5 0 0
2026-06-21
最新
N-pair Loss

扩展三元组损失,在每个批次中使用多个负样本进行联合比较,提升嵌入空间的判别性和训练效率。

7 0 0
2026-06-21
最新
三元组损失 Triplet Loss

掌握三元组损失的原理,学习如何选取困难三元组,在人脸识别、图像检索中拉近正例、推远负例。

7 0 0
2026-06-21
最新
度量学习对比损失

学习成对对比损失和 Siamese 网络,通过优化样本对的距离实现度量空间的判别性嵌入。

3 0 0
2026-06-21
最新
自定义损失函数设计

学习在 PyTorch/TensorFlow 中编写自定义损失函数,针对非对称代价、物理约束等多目标需求设计优化目标。

2 0 0
2026-06-21
最新
损失函数大全

系统梳理监督学习中分类、回归、排序等任务的常用损失函数,理解其数学形式和适用场景。

4 0 0
2026-06-21
最新
混合精度训练细节

深入混合精度训练的工程细节,掌握 FP16/BF16 自动选择、损失缩放策略和梯度累积中的精度控制。

3 0 0
2026-06-21
最新
数值计算稳定 softmax

学习数值稳定 softmax 的原理,使用最大值减法技巧避免上溢/下溢,以及在交叉熵损失中的 LogSumExp 技巧。

4 0 0
2026-06-21
最新
MLIR 中间表示

了解 MLIR 如何提供可扩展的方言系统,统一表示从高层 ML 图到底层硬件指令,促进跨框架优化。

5 0 0
2026-06-21
最新
XLA 加速线性代数

学习 XLA 如何将计算图编译为优化的 HLO 内核,通过算子融合和内存优化加速 TensorFlow 和 JAX 中的线性代数运算。

6 0 0
2026-06-21
最新
深度学习编译器 TVM

掌握 Apache TVM 的编译流程,将模型从高级框架编译为目标硬件的高效代码,通过自动调优实现极致性能。

7 0 0
2026-06-21
最新
AI 性能分析工具

学习使用 PyTorch Profiler、NVIDIA Nsight 等工具剖析模型计算图,定位算子性能瓶颈和内存使用。

6 0 0
2026-06-21
最新
模型效率基准 MLPerf

了解 MLPerf Training 和 Inference 基准,比较不同硬件与框架的模型训练时间和推理延迟,指导平台选型。

5 0 0
2026-06-21
最新
碳足迹追踪工具

使用 CodeCarbon、MLCO2 等工具自动估算模型训练期间的电能消耗与碳排放,辅助环保决策。

5 0 0
2026-06-21
最新
环境影响与绿色 AI

探讨大模型训练和推理的能源消耗,学习通过稀疏化、量化、高效架构及碳感知调度实现绿色 AI。

4 0 0
2026-06-21
最新
算法审计

学习如何对 AI 系统进行内部或外部审计,检测歧视性行为、评估合规性并出具改进建议报告。

6 0 0
2026-06-21
最新
负责任 AI 原则

掌握负责任 AI 的核心原则,包括公平性、透明性、可解释性、隐私保护与可问责性,指导 AI 系统的伦理构建。

6 0 0
2026-06-21