ded - 宙飒天下网

自动红队测试：针对大型语言模型的自动越狱策略探索

该论文提出Auto-RT框架，用于自动化探索针对大语言模型的安全漏洞越狱策略。现有自动化红队测试方法多关注孤立漏洞或依赖预定义攻击模式，难以高效发现复杂漏洞及适应动态防御机制。Au...

admin /新鲜讯息 /2025-08-02 /0 评论 /218 阅读