MMBench:多模态语言模型的系统化评测基准
FreeGuideOnline
最新
2026-06-22
bash pip install vlmevalkit
确保你的模型可以正常接收图像和文本输入,并产出文本答案。VLMEvalKit 支持主流框架(HuggingFace transformers、LLaMA-Factory、LMDeploy 等)的模型加载。
### 一键评测命令
在终端执行以下命令即可启动评测(以替换成你模型的方式示意):
```bash
python run.py --data MMBench_DEV_EN --model Your_Model_Name --verbose