最新
RetNet 保留网络
学习 RetNet 如何将注意力机制替代为多尺度保留机制,实现 Transformer 式的并行训练与 RNN 式的 O(1) 高效推理。
2
0
0
2026-06-21