人工智能在线教程 | 从算法到应用，解锁AI潜能

最新

BLIP-2 多模态模型

学习 BLIP-2 如何用轻量 Q-Former 对齐冻结的视觉编码器和大语言模型，高效完成图像描述、问答等任务。

人工智能 BLIP-2 多模态 Q-Former

6 0 0

2026-06-19

最新

CLIP 对比语言图像预训练

深入 OpenAI CLIP 模型，学习其对偶编码器架构和对比损失，实现强大的零样本图像分类和图文检索。

人工智能 CLIP 对比学习多模态

9 0 0

2026-06-19

最新

多模态表示学习

学习将不同模态的数据映射到统一语义空间的技术，如 CLIP、VATT 等，支持跨模态检索与推理。

人工智能多模态表示学习对齐

8 0 0

2026-06-19

最新

音频事件检测

学习从连续音频流中检测和分类特定声音事件，如狗叫、汽车鸣笛等，应用于监控和智慧城市。

人工智能音频事件声音检测声场景

2 0 0

2026-06-19

最新

符号音乐生成

利用 Transformer 等模型生成 MIDI 或钢琴卷帘形式的符号音乐，学习旋律、和弦与节奏的建模。

人工智能符号音乐 MIDI 作曲

5 0 0

2026-06-19

最新

音乐生成 MusicLM

了解 Google 的 MusicLM 如何通过分层声学模型从文字描述生成长且连贯的高保真音乐片段。

人工智能音乐生成文本到音乐生成式AI

4 0 0

2026-06-19

最新

情感语音合成

在 TTS 中注入情感标签或风格嵌入，生成具有特定情感色彩和丰富表现力的合成语音。

人工智能情感TTS 表现力风格

5 0 0

2026-06-19

最新

声音克隆技术

学习使用少量目标说话人音频来克隆其声音特征，实现定制的语音合成。

人工智能声音克隆个性化TTS 零样本

2 0 0

2026-06-19

最新

声纹识别 Speaker Diarization

学习 Speaker Diarization 技术，将多人会议音频按说话人分割并聚类，解决“谁在说话”的问题。

人工智能说话人日志声纹聚类

9 0 0

2026-06-19

最新

VITS 端到端 TTS

深入 VITS 架构，融合变分自编码器、标准化流和对抗训练，直接从文本生成高质量语音波形。

人工智能 VITS 端到端TTS 语音合成

2 0 0

2026-06-19

最新

FastSpeech 快速语音合成

学习非自回归 TTS 模型 FastSpeech，通过显式音素时长预测和长度调节器并行生成梅尔谱，大幅提升合成速度。

人工智能 FastSpeech 快速TTS 非自回归

5 0 0

2026-06-19

最新

语音合成 TTS Tacotron

了解 Tacotron 如何通过编码器-注意力-解码器结构将文本直接转换为梅尔频谱，再经声码器生成波形。

人工智能 TTS 语音合成 Tacotron

2 0 0

2026-06-19

最新

Whisper 模型使用

学习 OpenAI Whisper 的多任务多语言模型，实现高精度的语音识别、语言检测和多语种语音翻译。

人工智能 Whisper 语音识别多语言

4 0 0

2026-06-19

最新

语音识别 ASR DeepSpeech

使用 Mozilla DeepSpeech 训练端到端的语音识别模型，理解其声学模型、语言模型与集束搜索解码原理。

人工智能语音识别 DeepSpeech CTC

5 0 0

2026-06-19

最新

语音助手开发

学习构建完整的语音助手系统，串联关键词唤醒、语音识别、自然语言理解、对话管理与语音合成模块。

人工智能语音助手全链路对话系统

8 0 0

2026-06-19

最新

端到端对话模型

摒弃管道式模块，直接构建输入原始对话历史、输出回复的端到端对话模型，简化系统并减少误差传播。

人工智能端到端对话模型联合学习

8 0 0

2026-06-19

最新

对话策略学习

利用强化学习优化对话系统的动作决策，学习 DQN、策略梯度等方法在对话管理中最大化任务成功率。

人工智能对话策略强化学习对话管理

11 0 0

2026-06-19

最新

对话状态追踪

学习跟踪多轮对话中用户目标状态的技术，包括基于规则和神经网络的对话状态追踪方法。

人工智能对话状态槽位任务型对话

4 0 0

2026-06-19

最新

闲聊机器人

构建开放域闲聊系统，学习检索式匹配和生成式对话模型的原理与实现，让机器人自然进行日常对话。

人工智能闲聊开放域对话系统

6 0 0

2026-06-19

最新

AI 工程师路线

聚焦模型训练和线上服务，从 ML 基础到 MLOps。

人工智能 AI 路线图 MLOps

7 0 0

2026-06-19

最新

特征存储 Feast

使用 Feast 统一管理训练和推理所需的特征，减少数据不一致。

人工智能 Feast 特征存储 ML

9 0 0

2026-06-17

最新

Kubeflow 机器学习流水线

在 Kubernetes 上构建可重复的 ML 工作流，自动化训练、评估与部署步骤。

人工智能 Kubeflow 流水线 Kubernetes

8 0 0

2026-06-17

最新

MLflow 模型管理

使用 MLflow 记录参数、指标和模型，管理 ML 实验全生命周期。

人工智能 MLflow 实验跟踪模型

6 0 0

2026-06-17

最新

TensorRT 推理优化

使用 NVIDIA TensorRT 对模型进行低精度量化和图优化，获得极致推理速度。

人工智能 TensorRT 推理量化

8 0 0

2026-06-17

最新

ONNX 模型交换

使用 ONNX 标准格式在 PyTorch、TensorFlow 等框架间自由转换模型。

人工智能 ONNX 模型转换互操作

6 0 0

2026-06-17

最新

深度学习模型部署

将训练好的模型转换为 ONNX 并封装为 API，使用 TorchServe 或 Triton 生产上线。

人工智能模型部署 ONNX 服务化

8 0 0

2026-06-17

最新

Q-Learning 算法

实现表格型 Q-Learning 算法，解决简单的迷宫和 GridWorld 问题。

人工智能 Q-Learning 时序差分无模型

4 0 0

2026-06-17

最新

强化学习入门

了解强化学习基本概念，建立马尔可夫决策过程模型。

人工智能强化学习 MDP 入门

13 0 0

2026-06-17

最新

风格迁移

将一幅图像的艺术风格应用到另一张照片上，实现 Neural Style Transfer。

人工智能风格迁移艺术 CNN

11 0 0

2026-06-17

最新

生成对抗网络 GAN

理解 GAN 的训练过程与原理，实现简单的图像生成和风格化。

人工智能 GAN 生成对抗

11 0 0

2026-06-17

最新

图像分割 U-Net

使用 U-Net 架构执行像素级语义分割，广泛用于医学和遥感影像。

人工智能 U-Net 分割医学

5 0 0

2026-06-16

最新

目标检测 YOLO

使用 YOLO 系列算法实时检测图像中的多类目标，理解 Anchor 与损失设计。

人工智能 YOLO 目标检测实时

10 0 0

2026-06-16

最新

图像分类 ResNet

使用预训练的 ResNet 进行微调，轻松实现高精度的图像识别与分类。

人工智能 ResNet 图像分类迁移学习

12 0 0

2026-06-16

最新

计算机视觉 OpenCV

使用 OpenCV 进行图像读写、滤波、边缘检测和轮廓发现，构建视觉基础。

人工智能 OpenCV 图像处理视觉

3 0 0

2026-06-16

最新

语音识别入门

了解语音信号基础，提取 MFCC 特征并训练基于 CTC 的端到端识别模型。

人工智能语音识别 ASR CTC

5 0 0

2026-06-16

最新

FastText 文本分类

利用 FastText 的子词嵌入和分层 softmax，快速进行文本分类和表征。

人工智能 FastText 子词分类

13 0 0

2026-06-16

最新

词嵌入 Word2Vec

使用 Word2Vec 学习单词的稠密向量表示，捕捉语义和类比关系。

人工智能 Word2Vec 词嵌入语义

9 0 0

2026-06-16

最新

文本生成

训练字符或词级别语言模型，使用 Temperature 和 Top-p 控制生成多样性。

人工智能文本生成 GPT 语言模型

5 0 0

2026-06-16

最新

机器翻译 Seq2Seq

搭建基于 RNN 或 Transformer 的序列到序列模型，实现英中翻译。

人工智能机器翻译 Seq2Seq 注意力

9 0 0

2026-06-16

最新

情感分析

对用户评论、社交媒体进行积极/消极判断，甚至提取细粒度方面情感。

人工智能情感分析 NLP 观点

15 0 0

2026-06-16

最新

命名实体识别 NER

使用深度学习或规则方法识别文本中的实体，为知识图谱构建提供基础。

人工智能 NER 命名实体序列标注

6 0 0

2026-06-16

最新

文本分类 NLP

从传统方法到深度学习，实现新闻主题、情感极性等多类别文本分类。

人工智能文本分类 NLP 情感

10 0 0

2026-06-16

最新

Hugging Face 使用

快速调用数千个预训练模型，使用 Trainer API 极简微调下游任务。

人工智能 Hugging Face 模型库微调

7 0 0

2026-06-16

最新

GPT 模型原理

了解 GPT 系列的自回归生成方式，掌握 Prompt 工程与上下文学习。

人工智能 GPT 生成式自回归

7 0 0

2026-06-16

最新

BERT 预训练模型

使用 BERT 进行文本分类、问答等下游任务微调，理解 Masked LM 目标。

人工智能 BERT 预训练 NLP

11 0 0

2026-06-16

最新

Transformer 架构

剖析 Transformer 的 Self-Attention、Multi-Head 和 Positional Encoding 核心组件。

人工智能 Transformer 自注意力架构

16 0 0

2026-06-16

最新

注意力机制

理解注意力计算流程，从 Bahdanau 到 Luong，为 Transformer 打下基础。

人工智能注意力权重聚焦

6 0 0

2026-06-16

最新

LSTM 与 GRU

学习 LSTM 和 GRU 的门控结构，有效捕捉序列中的长期记忆。

人工智能 LSTM GRU 长依赖

4 0 0

2026-06-16

最新

循环神经网络 RNN

使用 RNN 建模时间序列和文本，理解 BPTT 算法和长期依赖问题。

人工智能 RNN 序列时间步

7 0 0

2026-06-16

最新

卷积神经网络 CNN

掌握卷积、池化、全连接结构，实现手写数字识别和图像分类。

人工智能 CNN 图像卷积

11 0 0

2026-06-16

最新

神经网络基础

理解人工神经元、前向传播和链式求导更新权重的核心原理。

人工智能神经网络反向传播基础

10 0 0

2026-06-16

最新

TensorFlow/Keras 教程

使用 Keras 高层 API 快速定义和训练模型，涵盖 Sequential 和 Functional 方式。

人工智能 TensorFlow Keras API

12 0 0

2026-06-16

最新

深度学习 PyTorch

使用 PyTorch 搭建神经网络，掌握 Tensor 运算、Autograd 和 nn.Module。

人工智能 PyTorch 深度学习自动求导

11 0 0

2026-06-16

最新

内容推荐算法

利用物品属性或文本特征计算相似度，构建不依赖用户行为的冷启动推荐。

人工智能内容推荐特征冷启动

8 0 0

2026-06-16

最新

关联规则 Apriori

使用 Apriori 算法挖掘频繁项集，生成关联规则进行商品推荐。

人工智能关联规则 Apriori 频繁项集

5 0 0

2026-06-16

最新

t-SNE 可视化高维

使用 t-SNE 将高维数据映射至二维或三维，直观观察聚类与模式。

人工智能 t-SNE 可视化降维

10 0 0

2026-06-16

最新

降维 PCA 主成分分析

使用 PCA 将高维数据投影到低维空间，保留主要变异信息并加速训练。

人工智能 PCA 降维主成分

11 0 0

2026-06-16

最新

DBSCAN 密度聚类

使用 DBSCAN 基于密度连通性识别聚类，有效处理噪声和异常点。

人工智能 DBSCAN 密度聚类噪声

7 0 0

2026-06-16

最新

聚类算法 K-Means

学习 K-Means 迭代过程、K 值选择方法和在客户分群等场景的应用。

人工智能 K-Means 聚类无监督

9 0 0

2026-06-16

免费编程教程