最新
ALiBi 线性偏置
学习 ALiBi 如何直接在注意力分数上加一个随距离递减的线性偏置,无需学习复杂位置编码即可实现上下文外推。
5
0
0
2026-06-22
最新