最新
推测解码 Speculative Decoding
学习推测解码如何用小模型快速生成草稿,大模型并行验证并接受匹配 Token,在不改变输出的前提下实现数倍推理加速。
2
0
0
2026-06-14