最新
RetNet 保留网络
学习 RetNet 如何将注意力机制替代为多尺度保留机制,实现 Transformer 式的并行训练与 RNN 式的 O(1) 高效推理。
2
0
0
2026-06-21
最新
长短期记忆 XLSTM
了解 XLSTM 如何在经典 LSTM 基础上引入指数门控和新记忆结构,挑战 Transformer 在序列建模中的地位。
2
0
0
2026-06-21