最新自动红队测试:针对大型语言模型的自动越狱策略探索 该论文提出Auto-RT框架,用于自动化探索针对大语言模型的安全漏洞越狱策略。现有自动化红队测试方法多关注孤立漏洞或依赖预定义攻击模式,难以高效发现复杂漏洞及适应动态防御机制。Au... admin /新鲜讯息 /2025-08-02 /0 评论 /11 阅读