最新
FSDP 全分片数据并行
学习 PyTorch FSDP 的原理与用法,在数据并行中分片模型参数、梯度和优化器状态,并支持多种分片策略以平衡内存与通信。
7
0
0
2026-06-14