最新
Megatron-LM 训练框架
解读 NVIDIA Megatron-LM 如何精巧地组合张量并行、流水线并行和数据并行,实现 GPT、T5 等架构的高效万卡级训练。
7
0
0
2026-06-14