最新
Megatron-LM 训练框架
解读 NVIDIA Megatron-LM 如何精巧地组合张量并行、流水线并行和数据并行,实现 GPT、T5 等架构的高效万卡级训练。
6
0
0
2026-06-14
最新
大模型评估框架 LM-Eval-Harness
使用 EleutherAI 的开源评估框架,一站式在大量标准基准(如 MMLU, ARC, HellaSwag)上对大模型进行零样本和少样本自动化测试。
5
0
0
2026-06-14
最新
函数调用 Function Calling
深入 LLM 的 Function Calling 能力,如何定义 JSON Schema 函数描述,稳定输出结构化调用参数,将模型连接至搜索、计算等外部工具。
5
0
0
2026-06-14
最新
低秩分解 LoRA 深入
深度解析 LoRA 的数学原理:通过低秩矩阵分解近似权重更新,在冻结原模型参数的情况下实现高效的大模型微调与任务适配。
3
0
0
2026-06-13