建立偏见检测流程,识别数据与模型中的性别、种族等偏差,并应用重加权、对抗去偏和阈值调整等缓解方法。
分析大模型产生幻觉的内在原因(数据偏差、解码随机性等),学习通过知识增强、检索辅助与可控解码来减少虚构内容。