最新
BLIP-2 多模态模型
学习 BLIP-2 如何用轻量 Q-Former 对齐冻结的视觉编码器和大语言模型,高效完成图像描述、问答等任务。
6
0
0
2026-06-19
最新
CLIP 对比语言图像预训练
深入 OpenAI CLIP 模型,学习其对偶编码器架构和对比损失,实现强大的零样本图像分类和图文检索。
9
0
0
2026-06-19
最新
音乐生成 MusicLM
了解 Google 的 MusicLM 如何通过分层声学模型从文字描述生成长且连贯的高保真音乐片段。
4
0
0
2026-06-19
最新
声纹识别 Speaker Diarization
学习 Speaker Diarization 技术,将多人会议音频按说话人分割并聚类,解决“谁在说话”的问题。
9
0
0
2026-06-19
最新
最新
FastSpeech 快速语音合成
学习非自回归 TTS 模型 FastSpeech,通过显式音素时长预测和长度调节器并行生成梅尔谱,大幅提升合成速度。
5
0
0
2026-06-19
最新
语音合成 TTS Tacotron
了解 Tacotron 如何通过编码器-注意力-解码器结构将文本直接转换为梅尔频谱,再经声码器生成波形。
2
0
0
2026-06-19
最新
Whisper 模型使用
学习 OpenAI Whisper 的多任务多语言模型,实现高精度的语音识别、语言检测和多语种语音翻译。
4
0
0
2026-06-19
最新
语音识别 ASR DeepSpeech
使用 Mozilla DeepSpeech 训练端到端的语音识别模型,理解其声学模型、语言模型与集束搜索解码原理。
5
0
0
2026-06-19
最新
最新
Kubeflow 机器学习流水线
在 Kubernetes 上构建可重复的 ML 工作流,自动化训练、评估与部署步骤。
8
0
0
2026-06-17
最新
最新
最新
最新
最新
最新
最新
最新
最新
最新
最新
最新
最新
最新
Transformer 架构
剖析 Transformer 的 Self-Attention、Multi-Head 和 Positional Encoding 核心组件。
16
0
0
2026-06-16
最新
最新
最新
最新
TensorFlow/Keras 教程
使用 Keras 高层 API 快速定义和训练模型,涵盖 Sequential 和 Functional 方式。
12
0
0
2026-06-16
最新
深度学习 PyTorch
使用 PyTorch 搭建神经网络,掌握 Tensor 运算、Autograd 和 nn.Module。
11
0
0
2026-06-16
最新
最新
最新
最新
最新