免费编程教程

最新
FlashDecoding 加速

针对 FlashAttention 在解码阶段利用率低的问题,学习 FlashDecoding 如何并行处理长 KV 序列以加速生成。

3 0 0
2026-06-22
最新
线性注意力机制

综述线性注意力机制的基本思想,通过核函数分解或关联内存设计,将标准注意力的 O(n²) 降至 O(n),应对长序列建模。

4 0 0
2026-06-21
最新
时序模型 Informer

学习 Informer 如何通过概率稀疏注意力机制和自注意力蒸馏,在长序列时间序列预测中大幅降低计算复杂度。

2 0 0
2026-06-21