免费编程教程大全 - FreeGuideOnline

最新

面部识别 FaceNet

学习 FaceNet 如何使用三元组损失将面部图像映射到欧氏距离对应相似度的嵌入空间，实现面验证、识别与聚类。

人工智能 FaceNet 面部识别三元组损失

2 0 0

2026-06-19

最新

手势识别

掌握静态手势分类和动态手势识别的方法，包括基于手部关键点、3D CNN 及 Transformer 的算法，应用于人机交互。

人工智能手势识别人机交互关键点

5 0 0

2026-06-19

最新

3D 人体姿态估计

学习从单张图像或视频恢复人体三维关节位置的方法，包括直接回归、2D 提升到 3D 及利用骨骼运动学的约束优化。

人工智能 3D姿态估计单目运动学

3 0 0

2026-06-19

最新

HRNet 高分辨率网络

学习 HRNet 如何通过并行保持高分辨率分支并进行多尺度融合，取代编-解码器，在姿态估计和语义分割中达到精准空间定位。

人工智能 HRNet 高分辨率姿态估计

2 0 0

2026-06-19

最新

姿态估计 OpenPose

深入 OpenPose 的部件置信度图与亲和力场架构，实现自底向上的实时多人人体关键点检测与骨架组装。

人工智能姿态估计 OpenPose 关键点

3 0 0

2026-06-19

最新

FairMOT 跟踪

分析 FairMOT 如何通过无锚检测与同质分支平衡检测与重识别任务，避免偏向其中一个，实现高精度的多目标跟踪。

人工智能 FairMOT 多目标跟踪公平性

5 0 0

2026-06-19

最新

JDE 一体化检测嵌入

学习 JDE 如何将目标检测和外观嵌入学习融合在一个网络中，单次前向即可同时输出检测框与特征，实现准确实时的跟踪。

人工智能 JDE 多目标跟踪联合学习

6 0 0

2026-06-19

最新

DeepSORT 多目标跟踪

在 SORT 基础上引入深度外观描述子，解决长时间遮挡下的 ID 切换问题，学习 DeepSORT 的匹配级联与度量学习模块。

人工智能 DeepSORT 多目标跟踪重识别

3 0 0

2026-06-19

最新

目标跟踪 SORT

掌握经典的 SORT 跟踪算法，将检测框通过卡尔曼滤波预测与匈牙利算法关联，实现高效的多目标在线跟踪。

人工智能目标跟踪 SORT 多目标

5 0 0

2026-06-19

最新

视频摘要生成

学习自动生成视频摘要的技术，包括关键帧提取、子镜头分割和基于兴趣度的片段选择，应用于视频预览与检索。

人工智能视频摘要关键帧无监督

3 0 0

2026-06-19

最新

视频文本检索

学习将视频和文本映射到同一语义空间进行互检索，使用对比损失与多模态编码器实现文本搜视频、视频搜文本。

人工智能视频文本检索跨模态对比学习

7 0 0

2026-06-19

最新

视频 Transformer ViViT

探索 ViViT 如何将 Transformer 直接应用于视频，利用时空注意力及其因子化变体高效提取视频特征，取代 3D CNN。

人工智能 ViViT 视频Transformer 注意力

6 0 0

2026-06-19

最新

动作识别 TSN/TSM

学习时间片段网络 TSN 的稀疏采样策略，以及时间移位模块 TSM 如何用零参数实现高效时序交互，大幅提升动作识别速度。

人工智能动作识别时间建模高效

11 0 0

2026-06-19

最新

视频分类 3D CNN

学习用 3D 卷积捕获视频片段的时间与空间维度，对比 C3D、I3D 与双流网络架构，实现动作与事件分类。

人工智能 3D CNN 视频分类时空建模

2 0 0

2026-06-19

最新

视频理解基础

了解视频分析的独特性，学习从 2D 图像到 3D 时空立方体的转换，以及光流、3D 卷积与 Transformer 等基础时空特征提取方法。

人工智能视频理解时空特征运动建模

5 0 0

2026-06-19

最新

视觉推理

深入需要复杂推理的视觉任务，如视觉关系检测、CLEVR 数据集分析，学习神经模块网络与组合式推理方法。

人工智能视觉推理关系建模逻辑

3 0 0

2026-06-19

最新

视觉问答 VQA

构建能根据图像内容回答自然语言问题的模型，学习特征融合、共同注意力和多模态推理等核心 VQA 技术。

人工智能视觉问答多模态推理

6 0 0

2026-06-19

最新

图像字幕 Image Captioning

掌握为图像自动生成文字描述的技术，涵盖 CNN-RNN 基础架构、注意力机制和最新的 Transformer 与多模态预训练模型。

人工智能图像字幕视觉语言生成

6 0 0

2026-06-19

最新

MiniGPT-4 多模态

学习 MiniGPT-4 如何仅通过一个线性投影层连接冻结的视觉编码器和大语言模型，实现图文理解与多轮对话，并降低多模态对齐成本。

人工智能 MiniGPT-4 多模态视觉语言模型

8 0 0

2026-06-19

最新

LLaVA 多模态对话

使用 GPT-4 生成多模态指令数据，微调大语言模型连接视觉编码器，构建能看图聊天并完成复杂指令的多模态助手。

人工智能 LLaVA 多模态对话指令微调

17 0 0

2026-06-19

最新

BLIP-2 多模态模型

学习 BLIP-2 如何用轻量 Q-Former 对齐冻结的视觉编码器和大语言模型，高效完成图像描述、问答等任务。

人工智能 BLIP-2 多模态 Q-Former

6 0 0

2026-06-19

最新

CLIP 对比语言图像预训练

深入 OpenAI CLIP 模型，学习其对偶编码器架构和对比损失，实现强大的零样本图像分类和图文检索。

人工智能 CLIP 对比学习多模态

9 0 0

2026-06-19

最新

多模态表示学习

学习将不同模态的数据映射到统一语义空间的技术，如 CLIP、VATT 等，支持跨模态检索与推理。

人工智能多模态表示学习对齐

8 0 0

2026-06-19

最新

音频事件检测

学习从连续音频流中检测和分类特定声音事件，如狗叫、汽车鸣笛等，应用于监控和智慧城市。

人工智能音频事件声音检测声场景

2 0 0

2026-06-19

最新

符号音乐生成

利用 Transformer 等模型生成 MIDI 或钢琴卷帘形式的符号音乐，学习旋律、和弦与节奏的建模。

人工智能符号音乐 MIDI 作曲

5 0 0

2026-06-19

最新

音乐生成 MusicLM

了解 Google 的 MusicLM 如何通过分层声学模型从文字描述生成长且连贯的高保真音乐片段。

人工智能音乐生成文本到音乐生成式AI

4 0 0

2026-06-19

最新

情感语音合成

在 TTS 中注入情感标签或风格嵌入，生成具有特定情感色彩和丰富表现力的合成语音。

人工智能情感TTS 表现力风格

7 0 0

2026-06-19

最新

声音克隆技术

学习使用少量目标说话人音频来克隆其声音特征，实现定制的语音合成。

人工智能声音克隆个性化TTS 零样本

2 0 0

2026-06-19

最新

声纹识别 Speaker Diarization

学习 Speaker Diarization 技术，将多人会议音频按说话人分割并聚类，解决“谁在说话”的问题。

人工智能说话人日志声纹聚类

9 0 0

2026-06-19

最新

VITS 端到端 TTS

深入 VITS 架构，融合变分自编码器、标准化流和对抗训练，直接从文本生成高质量语音波形。

人工智能 VITS 端到端TTS 语音合成

2 0 0

2026-06-19

最新

FastSpeech 快速语音合成

学习非自回归 TTS 模型 FastSpeech，通过显式音素时长预测和长度调节器并行生成梅尔谱，大幅提升合成速度。

人工智能 FastSpeech 快速TTS 非自回归

5 0 0

2026-06-19

最新

语音合成 TTS Tacotron

了解 Tacotron 如何通过编码器-注意力-解码器结构将文本直接转换为梅尔频谱，再经声码器生成波形。

人工智能 TTS 语音合成 Tacotron

2 0 0

2026-06-19

最新

Whisper 模型使用

学习 OpenAI Whisper 的多任务多语言模型，实现高精度的语音识别、语言检测和多语种语音翻译。

人工智能 Whisper 语音识别多语言

4 0 0

2026-06-19

最新

语音识别 ASR DeepSpeech

使用 Mozilla DeepSpeech 训练端到端的语音识别模型，理解其声学模型、语言模型与集束搜索解码原理。

人工智能语音识别 DeepSpeech CTC

5 0 0

2026-06-19

最新

语音助手开发

学习构建完整的语音助手系统，串联关键词唤醒、语音识别、自然语言理解、对话管理与语音合成模块。

人工智能语音助手全链路对话系统

9 0 0

2026-06-19

最新

端到端对话模型

摒弃管道式模块，直接构建输入原始对话历史、输出回复的端到端对话模型，简化系统并减少误差传播。

人工智能端到端对话模型联合学习

8 0 0

2026-06-19

最新

对话策略学习

利用强化学习优化对话系统的动作决策，学习 DQN、策略梯度等方法在对话管理中最大化任务成功率。

人工智能对话策略强化学习对话管理

11 0 0

2026-06-19

最新

对话状态追踪

学习跟踪多轮对话中用户目标状态的技术，包括基于规则和神经网络的对话状态追踪方法。

人工智能对话状态槽位任务型对话

4 0 0

2026-06-19

最新

闲聊机器人

构建开放域闲聊系统，学习检索式匹配和生成式对话模型的原理与实现，让机器人自然进行日常对话。

人工智能闲聊开放域对话系统

7 0 0

2026-06-19

最新

安全蓝队防御

提升检测和响应能力，建立安全基线和实时告警体系。

安全蓝队防御威胁狩猎

8 0 0

2026-06-19

最新

二进制漏洞利用

分析栈结构，构造恶意输入劫持程序执行流获取 Shell。

安全 PWN 溢出 ROP

9 0 0

2026-06-19

最新

Web 安全 CTF

通过 CTF 环境练习常见的 Web 漏洞利用手法。

安全 Web安全 CTF SQL注入

13 0 0

2026-06-19

最新

密码学 CTF

破解凯撒、替换、ECB 重放等密码学常见 CTF 题目。

安全密码学 CTF RSA

8 0 0

2026-06-19

最新

OverTheWire 挑战

通过 Bandit 等系列游戏式挑战掌握命令行和权限提升。

安全 OverTheWire 战争游戏 Linux

7 0 0

2026-06-19

最新

picoCTF 新手赛

从 Carnegie Mellon 大学出品的免费 CTF 比赛学习基础。

安全 picoCTF 新手挑战

4 0 0

2026-06-19

最新

CTF 夺旗赛入门

了解 CTF 主要类别，准备基础工具开启安全竞赛之旅。

安全 CTF 夺旗竞赛

7 0 0

2026-06-19

最新

HackerOne 平台

在 HackerOne 上注册项目或提交漏洞，获得安全信誉。

安全 HackerOne 漏洞白帽

4 0 0

2026-06-19

最新

Bug Bounty 入门

学习如何开始参与漏洞赏金，选择合适的平台并配置工具。

安全 Bug Bounty 挖洞平台

4 0 0

2026-06-19

最新

漏洞赏金计划

制定公开或私密的奖励计划，吸引白帽黑客协助修补漏洞。

安全漏洞赏金众包政策

4 0 0

2026-06-19

最新

渗透测试报告

编写专业渗透报告，清楚描述漏洞等级和修复方案。

安全报告漏洞修复

5 0 0

2026-06-19

最新

应急响应流程

建立 CSIRT，在安全事件发生时遵循 6 阶段流程处理。

安全应急响应事件遏制

6 0 0

2026-06-19

最新

灾难恢复演练

定期测试备份切换流程，确保 RTO/RPO 目标达成。

运维演练恢复 RTO

4 0 0

2026-06-19

最新

业务连续性计划

制定应急响应、IT 恢复和业务恢复策略以应对中断。

运维 BCP 连续性灾难

4 0 0

2026-06-19

最新

IT 审计基础

了解信息系统审计流程，评估一般控制和应用控制。

安全审计风险控制

9 0 0

2026-06-19

最新

软件供应链安全标准

遵循 NIST SSDF 框架，提升软件开发全生命周期安全。

安全供应链标准 SSDF

5 0 0

2026-06-19

最新

关键信息基础设施

识别和保护金融、能源等关基设施免受攻击和中断。

安全关基基础设施安全

9 0 0

2026-06-19

最新

数据安全法

理解企业对数据安全治理的义务和违反后的法律责任。

安全数据安全法分级跨境

4 0 0

2026-06-19

最新

等保 2.0 中国

落实信息系统定级、备案、建设整改和测评的合规要求。

安全等保2.0 合规网络安全

10 0 0

2026-06-19

最新

FedRAMP 云安全

为美国政府机构提供云服务的标准化安全评估和授权。

安全 FedRAMP 云安全政府

3 0 0

2026-06-19

最新

HIPAA 健康数据

保护患者健康信息的隐私和安全标准，适用于医疗保健 IT。

安全 HIPAA 医疗隐私

7 0 0

2026-06-19