学习如何训练和使用跨语言句子嵌入模型(如 LaBSE),将不同语言的文本映射到同一个语义空间,实现跨语言检索与零样本迁移。
对比 BGE、E5、Instructor 等主流嵌入模型,根据 MTEB 基准与业务场景选择并微调,最大化下游检索或聚类任务的语义匹配效果。