免费编程教程

全部标签 Python 自动化系统设计可视化开源安全 Java Android 隐私架构性能微调

最新

YaRN 位置编码

学习 YaRN 同时调整 RoPE 的频率基数和注意力温度，仅需微量微调即可让模型在 128k 甚至更长的上下文上保持准确。

人工智能 YaRN 位置编码长上下文

3 0 0

2026-06-22

最新

ALiBi 线性偏置

学习 ALiBi 如何直接在注意力分数上加一个随距离递减的线性偏置，无需学习复杂位置编码即可实现上下文外推。

人工智能 ALiBi 位置编码外推

5 0 0

2026-06-22

最新

RoPE 旋转位置编码

深入 RoPE 的数学原理，学习它如何通过旋转变换将相对位置信息融入到注意力的内积中，支持良好外推。

人工智能 RoPE 位置编码外推

6 0 0

2026-06-22

最新

长上下文扩展技术

综合学习位置插值、NTK 缩放、YaRN 和稀疏注意力等方法，将预训练模型的上下文窗口扩展数倍。

人工智能长上下文位置编码扩展

6 0 0

2026-06-22