免费编程教程

最新
分组查询注意力 GQA

在 MHA 和 MQA 之间折中,将 Query 头分组共享 KV,以较少质量损失换取显著推理加速,成为 Llama 2 等模型标配。

3 0 0
2026-06-22
最新
车道线检测

掌握基于深度学习的车道线检测,学习 LaneNet 的实例分割思路、基于锚点的参数化曲线预测以及 Transformer 方法。

4 0 0
2026-06-20
最新
视频 Transformer ViViT

探索 ViViT 如何将 Transformer 直接应用于视频,利用时空注意力及其因子化变体高效提取视频特征,取代 3D CNN。

5 0 0
2026-06-19
最新
机器翻译 Seq2Seq

搭建基于 RNN 或 Transformer 的序列到序列模型,实现英中翻译。

8 0 0
2026-06-16
最新
注意力机制

理解注意力计算流程,从 Bahdanau 到 Luong,为 Transformer 打下基础。

5 0 0
2026-06-16