最新
数值计算稳定 softmax
学习数值稳定 softmax 的原理,使用最大值减法技巧避免上溢/下溢,以及在交叉熵损失中的 LogSumExp 技巧。
4
0
0
2026-06-21
最新