免费编程教程大全 - FreeGuideOnline

最新

RWKV 线性注意力 RNN

学习 RWKV 如何将注意力机制改造为线性循环形式，兼具高效并行训练和 O(1) 推理复杂度的优势。

人工智能 RWKV 线性注意力 RNN

4 0 0

2026-06-21

最新

Mamba 状态空间模型

学习 Mamba 如何引入输入依赖的选择机制，使状态空间模型具备上下文感知能力，实现线性复杂度的序列建模。

人工智能 Mamba 状态空间线性

8 0 0

2026-06-21

最新

长短期记忆 XLSTM

了解 XLSTM 如何在经典 LSTM 基础上引入指数门控和新记忆结构，挑战 Transformer 在序列建模中的地位。

人工智能 XLSTM RNN 序列建模

2 0 0

2026-06-21

最新

TimesNet 时序二维变

学习 TimesNet 如何通过寻找周期将一维时序数据重塑为二维张量，再用 Inception 模块捕获时间变化和周期内变化。

人工智能 TimesNet 二维卷积周期

2 0 0

2026-06-21

最新

PatchTST 时间序列 patch

将时间序列切分为子序列 Patch，并使用通道独立策略和自监督预训练，在长期预测中取得 SOTA 性能。

人工智能 PatchTST 时间序列 Patch

2 0 0

2026-06-21

最新

Autoformer 自相关机制

学习 Autoformer 的序列分解架构和自相关替代注意力机制，捕捉时间序列中的趋势、季节性和时延依赖。

人工智能 Autoformer 自相关时序分解

3 0 0

2026-06-21

最新

时序模型 Informer

学习 Informer 如何通过概率稀疏注意力机制和自注意力蒸馏，在长序列时间序列预测中大幅降低计算复杂度。

人工智能 Informer 时间序列长序列

2 0 0

2026-06-21

最新

RepVGG 重参数化

学习 RepVGG 的重参数化技巧，在训练时使用多分支架构提升精度，在推理时等价合并为简单的 VGG 风格模型。

人工智能 RepVGG 重参数化高效推理

2 0 0

2026-06-21

最新

ConvNeXt 现代卷积网络

将 Transformer 的训练策略与结构设计融入卷积网络，打造 ConvNeXt，纯卷积架构达到与 Transformer 可比肩的性能。

人工智能 ConvNeXt 卷积网络现代化

3 0 0

2026-06-21

最新

CSWin Transformer

学习 CSWin 的十字形窗口自注意力，通过水平和垂直条纹窗口并行计算，兼顾计算效率和全局建模能力。

人工智能 CSWin 十字形窗口自注意力

4 0 0

2026-06-21

最新

Twins Transformer

了解 Twins 架构如何通过空间可分离自注意力结合局部和全局信息，以更低成本实现优异的多尺度视觉表征。

人工智能 Twins Transformer 高效注意力

8 0 0

2026-06-21

最新

PVT 金字塔 Vision Transformer

学习金字塔 Vision Transformer 如何逐渐降低序列长度并增加通道数，生成多尺度特征，适配检测分割等任务。

人工智能 PVT 金字塔 Transformer

4 0 0

2026-06-21

最新

Swin Transformer 层级设计

深入 Swin Transformer，学习其移位窗口注意力机制和层级金字塔结构，在下游密集预测任务中展现强大性能。

人工智能 Swin Transformer 层级移动窗口

6 0 0

2026-06-21

最新

视觉 Transformer ViT

学习 Vision Transformer 如何将图像切割为固定大小的 Patch，并应用 Transformer 编码器进行全局特征交互。

人工智能 ViT 视觉Transformer Patch

3 0 0

2026-06-21

最新

ShuffleNet 通道混洗

学习 ShuffleNet 如何通过通道混洗打破分组卷积间的信息隔离，在极低计算量下保持良好表征能力。

人工智能 ShuffleNet 通道混洗轻量

3 0 0

2026-06-21

最新

移动端模型 MobileNet

掌握 MobileNet 系列如何利用深度可分离卷积和线性瓶颈结构，实现移动和嵌入式设备上的实时视觉模型。

人工智能 MobileNet 轻量移动端

4 0 0

2026-06-21

最新

高效网络 EfficientNet

学习 EfficientNet 提出的复合缩放方法，同时调整网络宽度、深度和分辨率，在约束资源下获得卓越精度。

人工智能 EfficientNet 复合缩放高效

5 0 0

2026-06-21

最新

可微分架构搜索 DARTS

深入 DARTS 算法，将离散架构选择松弛为连续优化，通过双层梯度下降高效搜索网络单元结构。

人工智能 DARTS 架构搜索可微分

3 0 0

2026-06-21

最新

神经网络架构搜索 NAS

综述神经架构搜索的主要方法，包括基于强化学习、进化算法和可微分搜索 DARTS，自动寻找最优网络结构。

人工智能 NAS 架构搜索自动化

4 0 0

2026-06-21

最新

自蒸馏正则化

将模型上一阶段的预测作为软目标指导当前训练，或利用 EMA 教师进行自蒸馏，起到平滑和正则化效果。

人工智能自蒸馏正则化知识蒸馏

5 0 0

2026-06-21

最新

正则化 DropBlock

学习 DropBlock 如何丢弃连续区域而非独立单元，强制网络利用剩余区域学习，适合卷积层正则化。

人工智能 DropBlock 正则化卷积

2 0 0

2026-06-21

最新

RandAugment 自动增强

学习 RandAugment 的极简自动增强方法，仅需选择操作数量和全局强度，无需复杂搜索即可显著提升性能。

人工智能 RandAugment 自动增强数据增强

2 0 0

2026-06-21

最新

Cutmix 增强

在图像中随机剪切一块区域并替换为另一张图像的对应区域，同时按面积比混合标签，提升模型对遮挡的鲁棒性。

人工智能 Cutmix 数据增强区域混合

2 0 0

2026-06-21

最新

Mixup 数据增强

学习 Mixup 增强，通过随机线性插值混合两个样本及其标签，引导模型学习线性行为，增强泛化与鲁棒性。

人工智能 Mixup 数据增强正则化

3 0 0

2026-06-21

最新

标签平滑 Label Smoothing

将硬目标 one-hot 标签调整为软标签，降低模型对训练标签的信心，提升泛化与模型校准能力。

人工智能标签平滑正则化校准

3 0 0

2026-06-21

最新

Stochastic Depth

学习在训练超深残差网络时随机丢弃整层，只在测试时使用完整深度，类似 Dropout 的层级别正则化手段。

人工智能 Stochastic Depth 正则化深度网络

3 0 0

2026-06-21

最新

Dropout 与变体

回顾 Dropout 原理及其变体如 DropConnect、Spatial Dropout、变分 Dropout，在训练时随机丢弃单元防止过拟合。

人工智能 Dropout 正则化过拟合

3 0 0

2026-06-21

最新

权重标准化 Weight Standardization

学习权重标准化技术，通过对卷积层权重施加零均值单位方差约束，结合 GroupNorm 进一步改善优化效果。

人工智能权重标准化优化重参数化

5 0 0

2026-06-21

最新

实例归一化 InstanceNorm

学习实例归一化如何对单个样本的每个通道独立标准化，剔除样本特有的对比度信息，常用于图像风格迁移。

人工智能 InstanceNorm 归一化风格迁移

5 0 0

2026-06-21

最新

分组归一化 GroupNorm

针对 BatchNorm 在小批次时失效的问题，学习分组归一化如何将通道分组进行标准化，在检测和分割任务中表现稳定。

人工智能 GroupNorm 归一化小批次

8 0 0

2026-06-21

最新

层归一化 LayerNorm

学习层归一化如何在特征维度上标准化，不依赖于批次大小，成为 NLP 和 Transformer 架构的标配组件。

人工智能 LayerNorm 归一化 Transformer

5 0 0

2026-06-21

最新

批归一化 BatchNorm

深入批归一化的前向与反向计算，理解其缓解内部协变量偏移、允许更大学习率的机制及其微正则化效应。

人工智能 BatchNorm 归一化训练加速

5 0 0

2026-06-21

最新

权重初始化策略

掌握常用的权重初始化方法，理解 Xavier 和 He 初始化的前向/反向方差传播原理，避免训练早期的梯度消失或爆炸。

人工智能权重初始化 Xavier He

3 0 0

2026-06-21

最新

梯度裁剪

学习基于范数和基于值的梯度裁剪方法，设置阈值防止梯度爆炸，保障循环网络等模型的训练稳定性。

人工智能梯度裁剪稳定训练梯度爆炸

9 0 0

2026-06-21

最新

分层学习率

在微调预训练模型时，对不同层使用不同大小的学习率，底层小更新保持通用特征，顶层大更新适应新任务。

人工智能分层学习率微调迁移学习

5 0 0

2026-06-21

最新

循环学习率

实施循环学习率策略，让学习率在设定的范围内周期性地升降，帮助模型跳出局部最优并加速收敛。

人工智能循环学习率调度收敛

4 0 0

2026-06-21

最新

余弦退火调度

学习余弦退火及其重启变种，通过余弦曲线平滑降低学习率，帮助模型收敛到更优的平坦极小值。

人工智能余弦退火学习率调度

4 0 0

2026-06-21

最新

学习率预热 Warmup

理解学习率预热的必要性，实现线性、指数等预热策略，避免训练初期大幅参数更新导致的不稳定。

人工智能学习率预热训练稳定 Warmup

2 0 0

2026-06-21

最新

LAMB / LARS 大 batch 优化

学习针对大批次训练设计的 LARS 和 LAMB 优化器，利用分层自适应学习率稳定训练超大批次模型。

人工智能 LAMB LARS 大batch

2 0 0

2026-06-21

最新

优化器变种 AdamW

了解 AdamW 如何将权重衰减与梯度自适应更新解耦，避免 Adam 中 L2 正则化与学习率的耦合问题，提升泛化。

人工智能 AdamW 优化器权重衰减

2 0 0

2026-06-21

最新

Dice Loss 分割

学习 Dice 系数及其损失函数，直接优化预测分割图与真实掩码的重叠区域，处理强类不平衡分割任务。

人工智能 Dice Loss 分割重叠

2 0 0

2026-06-21

最新

焦点损失 Focal Loss

学习 Focal Loss 如何通过调制因子降低已正确分类样本的损失贡献，引导模型专注于困难样本。

人工智能 Focal Loss 不平衡难例

2 0 0

2026-06-21

最新

Circle Loss

理解 Circle Loss 如何通过统一的决策边界优化类内相似度和类间差异，提升细粒度图像检索性能。

人工智能 Circle Loss 度量学习统一损失

2 0 0

2026-06-21

最新

Proxy NCA 损失

学习 Proxy NCA 损失，使用可学习的代理向量近似真实样本分布，避免直接配对计算，加快收敛。

人工智能 Proxy NCA 度量学习代理

5 0 0

2026-06-21

最新

N-pair Loss

扩展三元组损失，在每个批次中使用多个负样本进行联合比较，提升嵌入空间的判别性和训练效率。

人工智能 N-pair Loss 度量学习多负例

7 0 0

2026-06-21

最新

三元组损失 Triplet Loss

掌握三元组损失的原理，学习如何选取困难三元组，在人脸识别、图像检索中拉近正例、推远负例。

人工智能三元组损失度量学习嵌入

7 0 0

2026-06-21

最新

度量学习对比损失

学习成对对比损失和 Siamese 网络，通过优化样本对的距离实现度量空间的判别性嵌入。

人工智能度量学习对比损失嵌入

3 0 0

2026-06-21

最新

自定义损失函数设计

学习在 PyTorch/TensorFlow 中编写自定义损失函数，针对非对称代价、物理约束等多目标需求设计优化目标。

人工智能自定义损失业务梯度

2 0 0

2026-06-21

最新

损失函数大全

系统梳理监督学习中分类、回归、排序等任务的常用损失函数，理解其数学形式和适用场景。

人工智能损失函数分类回归

4 0 0

2026-06-21

最新

混合精度训练细节

深入混合精度训练的工程细节，掌握 FP16/BF16 自动选择、损失缩放策略和梯度累积中的精度控制。

人工智能混合精度训练细节

3 0 0

2026-06-21

最新

数值计算稳定 softmax

学习数值稳定 softmax 的原理，使用最大值减法技巧避免上溢/下溢，以及在交叉熵损失中的 LogSumExp 技巧。

人工智能 softmax 数值稳定技巧

4 0 0

2026-06-21

最新

MLIR 中间表示

了解 MLIR 如何提供可扩展的方言系统，统一表示从高层 ML 图到底层硬件指令，促进跨框架优化。

人工智能 MLIR 编译器方言

5 0 0

2026-06-21

最新

XLA 加速线性代数

学习 XLA 如何将计算图编译为优化的 HLO 内核，通过算子融合和内存优化加速 TensorFlow 和 JAX 中的线性代数运算。

人工智能 XLA 编译器加速

6 0 0

2026-06-21

最新

深度学习编译器 TVM

掌握 Apache TVM 的编译流程，将模型从高级框架编译为目标硬件的高效代码，通过自动调优实现极致性能。

人工智能 TVM 编译器部署

7 0 0

2026-06-21

最新

AI 性能分析工具

学习使用 PyTorch Profiler、NVIDIA Nsight 等工具剖析模型计算图，定位算子性能瓶颈和内存使用。

人工智能性能分析 Profiler 优化

6 0 0

2026-06-21

最新

模型效率基准 MLPerf

了解 MLPerf Training 和 Inference 基准，比较不同硬件与框架的模型训练时间和推理延迟，指导平台选型。

人工智能 MLPerf 基准性能

5 0 0

2026-06-21

最新

碳足迹追踪工具

使用 CodeCarbon、MLCO2 等工具自动估算模型训练期间的电能消耗与碳排放，辅助环保决策。

人工智能碳足迹工具绿色AI

5 0 0

2026-06-21

最新

环境影响与绿色 AI

探讨大模型训练和推理的能源消耗，学习通过稀疏化、量化、高效架构及碳感知调度实现绿色 AI。

人工智能绿色AI 碳足迹能效

4 0 0

2026-06-21

最新

算法审计

学习如何对 AI 系统进行内部或外部审计，检测歧视性行为、评估合规性并出具改进建议报告。

人工智能算法审计合规偏见

6 0 0

2026-06-21

最新

负责任 AI 原则

掌握负责任 AI 的核心原则，包括公平性、透明性、可解释性、隐私保护与可问责性，指导 AI 系统的伦理构建。

人工智能负责任AI 伦理公平

6 0 0

2026-06-21