研究 DAN、角色扮演、编码混淆等典型越狱攻击手法,并设计系统提示加固与输出检测等防护机制,提升大模型拒绝有害请求的能力。
理解 CSRF 攻击原理,并实施 Anti-CSRF Token、Referer 校验和 SameSite Cookie 防御。