最新
RWKV 线性注意力 RNN
学习 RWKV 如何将注意力机制改造为线性循环形式,兼具高效并行训练和 O(1) 推理复杂度的优势。
4
0
0
2026-06-21
最新
长短期记忆 XLSTM
了解 XLSTM 如何在经典 LSTM 基础上引入指数门控和新记忆结构,挑战 Transformer 在序列建模中的地位。
2
0
0
2026-06-21
最新