MMBench：多模态语言模型的系统化评测基准

FreeGuideOnline 最新 2026-06-22

bash pip install vlmevalkit


确保你的模型可以正常接收图像和文本输入，并产出文本答案。VLMEvalKit 支持主流框架（HuggingFace transformers、LLaMA-Factory、LMDeploy 等）的模型加载。

### 一键评测命令

在终端执行以下命令即可启动评测（以替换成你模型的方式示意）：

```bash
python run.py --data MMBench_DEV_EN --model Your_Model_Name --verbose