MMBench:多模态语言模型的系统化评测基准

FreeGuideOnline 最新 2026-06-22

bash pip install vlmevalkit


确保你的模型可以正常接收图像和文本输入,并产出文本答案。VLMEvalKit 支持主流框架(HuggingFace transformers、LLaMA-Factory、LMDeploy 等)的模型加载。

### 一键评测命令

在终端执行以下命令即可启动评测(以替换成你模型的方式示意):

```bash
python run.py --data MMBench_DEV_EN --model Your_Model_Name --verbose