免费编程教程大全 - FreeGuideOnline

最新

X 光片分类

针对胸部 X 光片进行疾病多标签分类，学习 CheXNet 等模型如何处理类不平衡、高分辨率影像并实现临床辅助筛查。

人工智能 X光片分类胸部疾病

3 0 0

2026-06-20

最新

医疗影像分析

综述深度学习在医疗影像分析中的任务与方法，包括分类、检测、分割和配准，以及多模态数据融合和临床部署挑战。

人工智能医疗影像 AI诊断图像分析

2 0 0

2026-06-20

最新

医疗图像分割 nnUNet

学习 nnUNet 如何根据数据集特性自动调整预处理、网络拓扑和后处理策略，成为多种医疗图像分割任务的首选基准。

人工智能 nnUNet 医疗图像分割

3 0 0

2026-06-20

最新

FastSAM 快速分割

学习 FastSAM 如何基于 YOLOv8-seg 架构实现接近 SAM 的分割能力，同时获得显著更快的实时推理速度。

人工智能 FastSAM 实时分割轻量

6 0 0

2026-06-20

最新

SAM 分割一切模型

深入 SAM 架构，学习其图像编码器、提示编码器和掩码解码器，如何根据点、框或网格提示对任何图像进行灵活分割。

人工智能 SAM 分割一切提示分割

3 0 0

2026-06-20

最新

RT-DETR 实时检测

学习 RT-DETR 如何设计高效的混合编码器和不确定性最小查询选择，成为首个无需后处理的实时 Transformer 检测器。

人工智能 RT-DETR 实时检测 Transformer

5 0 0

2026-06-20

最新

YOLO-NAS 目标检测

学习 YOLO-NAS 如何通过 AutoNAC 神经架构搜索和量化感知训练，在精度与延迟间取得最优平衡，并支持 INT8 量化。

人工智能 YOLO-NAS 目标检测架构搜索

4 0 0

2026-06-20

最新

YOLOv8 应用

使用 Ultralytics YOLOv8 进行目标检测、实例分割和姿态估计，学习数据配置、模型训练与导出到 ONNX 等部署格式。

人工智能 YOLOv8 目标检测部署

7 0 0

2026-06-20

最新

DINO 自监督目标检测

了解 DINO 检测模型，它结合自监督预训练、对比去噪训练和混合查询选择，刷新检测性能纪录。

人工智能 DINO 目标检测自监督

5 0 0

2026-06-20

最新

可变形 DETR

针对 DETR 收敛慢的问题，学习可变形 DETR 如何使用可变形注意力仅关注少量关键采样点，大幅提升训练和推理效率。

人工智能可变形DETR 目标检测稀疏注意力

5 0 0

2026-06-20

最新

新范式 DETR

学习 DETR 如何将目标检测转化为集合预测问题，使用 Transformer 编码器-解码器和匈牙利匹配，去除锚点与非极大抑制。

人工智能 DETR 目标检测 Transformer

5 0 0

2026-06-20

最新

弱监督语义分割

探索仅靠图像级分类标签训练语义分割模型的技术，如类激活图 CAM 的种子生成与伪标签精炼方法。

人工智能弱监督语义分割 CAM

3 0 0

2026-06-20

最新

全景分割

学习全景分割如何结合语义和实例分割，为图像中每个像素分配类别与实例 ID，了解全景 FPN 等统一架构。

人工智能全景分割语义分割实例分割

1 0 0

2026-06-20

最新

实例分割 Mask R-CNN

掌握 Mask R-CNN 如何通过添加掩码分支和 ROIAlign 实现高质量的实例分割，既定位物体又给出像素级轮廓。

人工智能 Mask R-CNN 实例分割 ROIAlign

1 0 0

2026-06-20

最新

语义分割 DeepLab

深入 DeepLab 系列，理解空洞卷积对感受野的控制、空间金字塔池化 ASPP 以及条件随机场后处理的像素级分类。

人工智能 DeepLab 语义分割空洞卷积

2 0 0

2026-06-20

最新

光流估计 RAFT

学习 RAFT 架构，使用 4D 相关体积和迭代 GRU 更新机制，实现精确的光流场估计，适用于运动分析与视频处理。

人工智能 RAFT 光流运动估计

0 0 0

2026-06-20

最新

深度估计 MiDaS

使用 MiDaS 从任意单张图像获取相对深度图，理解其多数据集混合训练与尺度不变损失的设计原理。

人工智能 MiDaS 深度估计单目

1 0 0

2026-06-20

最新

立体视觉

学习双目立体视觉原理，通过立体匹配计算视差图并转换为深度，传统算法与基于深度学习的端到端视差网络。

人工智能立体视觉视差深度估计

1 0 0

2026-06-20

最新

3D 目标检测

学习基于点云、图像或融合数据的 3D 目标检测方法，如 PointPillars、VoxelNet 和 BEV 检测范式，用于自动驾驶。

人工智能 3D目标检测点云 BEV

7 0 0

2026-06-20

最新

点云分割与分类

拓展点云任务，学习 PointNet++ 的分层局部特征聚合、基于图卷积的方法和 Transformer 点云模型，实现场景级分割。

人工智能点云分割分类局部特征

5 0 0

2026-06-20

最新

点云处理 PointNet

学习 PointNet 如何使用对称函数和空间变换网络直接处理原始点云，实现置换不变性的 3D 物体分类与分割。

人工智能 PointNet 点云 3D分类

2 0 0

2026-06-20

最新

3D Gaussian Splatting 深入

学习显式 3D 高斯点的优化与可微飞溅渲染技术，替代隐式 NeRF 实现超快速和高质量的新视图合成。

人工智能高斯飞溅实时渲染 3D重建

1 0 0

2026-06-20

最新

NeRF 神经辐射场深入

深入理解 Neural Radiance Fields，使用多层感知机隐式表示场景，通过体渲染合成任意视角的高清图像，开启 3D 重建新范式。

人工智能 NeRF 视图合成 3D重建

0 0 0

2026-06-20

最新

图像着色

学习自动为黑白图像上色的深度学习方法，包括编码-解码器架构、类别条件引导和 GAN 辅助的真实着色。

人工智能图像着色色彩化生成

4 0 0

2026-06-20

最新

图像去噪

综述图像噪声去除方法，涵盖高斯滤波、非局部均值、BM3D 和深度学习模型 DnCNN，以及扩散模型在去噪中的应用。

人工智能图像去噪降噪滤波

1 0 0

2026-06-20

最新

Real-ESRGAN 实战

使用 Real-ESRGAN 处理真实世界低质量图像，理解其高阶退化建模如何提升修复鲁棒性，实现老照片、动漫的清晰化。

人工智能 Real-ESRGAN 超分辨率真实世界

1 0 0

2026-06-20

最新

超分辨率重建 SRGAN

学习 SRGAN 如何通过感知损失和对抗训练恢复逼真的高频纹理，超越 MSE 优化带来的模糊感，生成高清细节。

人工智能 SRGAN 超分辨率感知损失

2 0 0

2026-06-20

最新

图像修复与扩展

使用扩散模型对图像缺失部分进行智能填充，或将画面向外扩展，学习区域掩码应用与提示引导技术。

人工智能图像修复扩展扩散模型

8 0 0

2026-06-20

最新

Automatic1111 WebUI

学习使用最流行的 Stable Diffusion Web 界面，掌握文生图、图生图、训练与扩展安装，极大降低 AI 绘画门槛。

人工智能 WebUI Stable Diffusion AI绘画

1 0 0

2026-06-20

最新

AI 绘画 ComfyUI 工作流

使用 ComfyUI 的节点图搭建复杂的文生图、图生图与控图工作流，灵活组合模型、提示与 ControlNet 实现高级生成管道。

人工智能 ComfyUI 工作流扩散模型

6 0 0

2026-06-20

最新

模型合并 Merge

学习通过权重平均、加性合并等技巧融合两个或多个微调后的扩散模型，创造出兼具各模型风格的新模型。

人工智能模型合并权重融合风格

1 0 0

2026-06-20

最新

LoRA 视觉风格学习

将 LoRA 技术用于扩散模型，通过训练低秩矩阵学习特定画风、角色或概念，生成高度定制化的图像且文件极小。

人工智能 LoRA 视觉风格个性化

2 0 0

2026-06-20

最新

DreamBooth 定制生成

掌握 DreamBooth 如何微调扩散模型，将特定物体或宠物绑定到唯一标识符，并利用先验保留损失防止灾难性遗忘。

人工智能 DreamBooth 微调主体驱动

4 0 0

2026-06-20

最新

文本反演 Textual Inversion

学习如何用少量样本教模型一个新“伪词”，将该词的嵌入优化到代表特定物体或风格，实现个性化文本到图像生成。

人工智能文本反演概念嵌入个性化

1 0 0

2026-06-20

最新

IP-Adapter 图像提示

学习 IP-Adapter 如何通过解耦的交叉注意力将图像特征作为提示注入扩散模型，实现图像风格或内容的条件生成。

人工智能 IP-Adapter 图像提示风格迁移

2 0 0

2026-06-20

最新

T2I-Adapter 条件控制

对比 ControlNet，学习 T2I-Adapter 如何用轻量适配器将多种条件引导特征直接注入扩散模型，降低计算开销。

人工智能 T2I-Adapter 条件注入轻量

3 0 0

2026-06-20

最新

控制网 ControlNet

学习 ControlNet 如何复制可训练副本连接到预训练扩散模型，根据姿态、深度图、线稿等条件精准控制生成内容。

人工智能 ControlNet 条件控制可插拔

2 0 0

2026-06-20

最新

SDXL 大模型

学习 SDXL 的改进，包括更大的 UNet、文本编码器融合和细化器机制，显著提升生成图像的细节和构图质量。

人工智能 SDXL 高清生成构图

1 0 0

2026-06-20

最新

稳定扩散 Stable Diffusion 深入

剖析 Stable Diffusion 架构，理解其在压缩潜在空间进行去噪的原理，以及通过交叉注意力注入文本条件实现文生图。

人工智能 Stable Diffusion 文生图潜在空间

1 0 0

2026-06-20

最新

扩散模型 DDPM

学习去噪扩散概率模型原理，理解前向加噪和逆向去噪过程，掌握训练目标与采样方法，开启扩散生成之旅。

人工智能扩散模型 DDPM 去噪

7 0 0

2026-06-20

最新

Pix2Pix 图像翻译

掌握 Pix2Pix 框架，使用 U-Net 生成器和 PatchGAN 判别器，在成对数据监督下实现草图到图像、分割图到照片等转换。

人工智能 Pix2Pix 图像翻译条件GAN

0 0 0

2026-06-20

最新

CycleGAN 域迁移

学习 CycleGAN 如何利用循环一致性损失，在没有配对样本的情况下实现照片风格转换、季节变换等图像到图像的翻译。

人工智能 CycleGAN 域迁移循环一致性

1 0 0

2026-06-19

最新

StyleGAN 系列

深入 StyleGAN 的映射网络与自适应实例归一化，理解如何控制不同层级的视觉风格，生成逼真且可编辑的高分辨率人脸等图像。

人工智能 StyleGAN 风格调制高清生成

0 0 0

2026-06-19

最新

图像生成 GAN 进阶

拓展 GAN 应用，学习条件 GAN、InfoGAN、ProGAN 等进阶架构，实现可控的图像生成与高分辨率合成。

人工智能 GAN 图像生成进阶

4 0 0

2026-06-19

最新

活体检测

学习如何判断摄像头前的人脸是真实活体还是攻击，包括基于纹理、频域、运动线索和深度学习的方法，保障人脸系统安全。

人工智能活体检测反欺骗人脸安全

1 0 0

2026-06-19

最新

ArcFace 人脸识别

深入 ArcFace 的角边距损失，通过在角度空间增加判别性约束，训练出类间更分散、类内更紧凑的人脸特征嵌入。

人工智能 ArcFace 人脸识别角边距

0 0 0

2026-06-19

最新

面部识别 FaceNet

学习 FaceNet 如何使用三元组损失将面部图像映射到欧氏距离对应相似度的嵌入空间，实现面验证、识别与聚类。

人工智能 FaceNet 面部识别三元组损失

1 0 0

2026-06-19

最新

手势识别

掌握静态手势分类和动态手势识别的方法，包括基于手部关键点、3D CNN 及 Transformer 的算法，应用于人机交互。

人工智能手势识别人机交互关键点

4 0 0

2026-06-19

最新

3D 人体姿态估计

学习从单张图像或视频恢复人体三维关节位置的方法，包括直接回归、2D 提升到 3D 及利用骨骼运动学的约束优化。

人工智能 3D姿态估计单目运动学

1 0 0

2026-06-19

最新

HRNet 高分辨率网络

学习 HRNet 如何通过并行保持高分辨率分支并进行多尺度融合，取代编-解码器，在姿态估计和语义分割中达到精准空间定位。

人工智能 HRNet 高分辨率姿态估计

1 0 0

2026-06-19

最新

姿态估计 OpenPose

深入 OpenPose 的部件置信度图与亲和力场架构，实现自底向上的实时多人人体关键点检测与骨架组装。

人工智能姿态估计 OpenPose 关键点

1 0 0

2026-06-19

最新

FairMOT 跟踪

分析 FairMOT 如何通过无锚检测与同质分支平衡检测与重识别任务，避免偏向其中一个，实现高精度的多目标跟踪。

人工智能 FairMOT 多目标跟踪公平性

3 0 0

2026-06-19

最新

JDE 一体化检测嵌入

学习 JDE 如何将目标检测和外观嵌入学习融合在一个网络中，单次前向即可同时输出检测框与特征，实现准确实时的跟踪。

人工智能 JDE 多目标跟踪联合学习

5 0 0

2026-06-19

最新

DeepSORT 多目标跟踪

在 SORT 基础上引入深度外观描述子，解决长时间遮挡下的 ID 切换问题，学习 DeepSORT 的匹配级联与度量学习模块。

人工智能 DeepSORT 多目标跟踪重识别

2 0 0

2026-06-19

最新

目标跟踪 SORT

掌握经典的 SORT 跟踪算法，将检测框通过卡尔曼滤波预测与匈牙利算法关联，实现高效的多目标在线跟踪。

人工智能目标跟踪 SORT 多目标

3 0 0

2026-06-19

最新

视频摘要生成

学习自动生成视频摘要的技术，包括关键帧提取、子镜头分割和基于兴趣度的片段选择，应用于视频预览与检索。

人工智能视频摘要关键帧无监督

2 0 0

2026-06-19

最新

视频文本检索

学习将视频和文本映射到同一语义空间进行互检索，使用对比损失与多模态编码器实现文本搜视频、视频搜文本。

人工智能视频文本检索跨模态对比学习

6 0 0

2026-06-19

最新

视频 Transformer ViViT

探索 ViViT 如何将 Transformer 直接应用于视频，利用时空注意力及其因子化变体高效提取视频特征，取代 3D CNN。

人工智能 ViViT 视频Transformer 注意力

5 0 0

2026-06-19

最新

动作识别 TSN/TSM

学习时间片段网络 TSN 的稀疏采样策略，以及时间移位模块 TSM 如何用零参数实现高效时序交互，大幅提升动作识别速度。

人工智能动作识别时间建模高效

9 0 0

2026-06-19

最新

视频分类 3D CNN

学习用 3D 卷积捕获视频片段的时间与空间维度，对比 C3D、I3D 与双流网络架构，实现动作与事件分类。

人工智能 3D CNN 视频分类时空建模

1 0 0

2026-06-19