大模型安全领域正上演着一场惊心动魄的“达尔文式军备竞赛”。
如同自然界捕食者与猎物的协同进化,攻击技术以高频突变突破防御边界,在环境选择下优势变种快速扩散并适应性进化。防御体系则陷入“红皇后效应”——必须持续迭代才能维持现状。这种攻防动态博弈的本质,恰似基因变异与自然选择的生物演化过程,唯有洞悉其进化密码,方能构建下一代自适应安全生态的生存法则。
本届XCon2025大会中,来自vivo的两位安全工程师戎誉、凡浩将带来议题《从进化论看大模型的攻防博弈策略》,开创性的将生物进化框架引入安全领域,以“突变-选择-适应”为核心解剖攻防演化链。
从生物进化到生态博弈,本议题将为你装备大模型安全攻防的“进化预测器”与“适者生存工具箱”!
议题简介
大模型安全不是一场静态的对抗,而是一种复杂的生态博弈。攻击和防御双方不断演化,技术手段在“突变—选择—适应”的循环中持续进化,类似生物进化中的军备竞赛。本演讲以进化论的视角为线索,深入剖析大模型安全领域的典型攻防博弈模式与最新趋势。
首先,将介绍“进化”在安全攻防中的意义:攻击技术如何出现突变、被选择、并适应防御策略,推动整个生态不断变化。
接着,通过三个鲜活的攻防案例,具体展示这种“进化”如何在大模型安全中上演。
案例一:聚焦模型供应链安全的进化路径。从最初的本地模型文件篡改,到向远程模型仓库投毒,进而发展出绕过模型仓库安全审查并大规模传播恶意模型的高级手段。
案例二:与第一个同步演化,攻击重心从模型平台转向开发包仓库。攻击者利用GitHub Actions的漏洞窃取Secrets,发布带后门的恶意版本,实现供应链层级的渗透。
案例三:将展示SEO投毒向GEO(生成式引擎优化)投毒的升级。攻击者围绕关键字优化生成内容,诱导大模型在用户查询时输出带有恶意信息的响应。
最后,演讲将分享面向这类进化型威胁的防御思路和实践建议,帮助业界建立对抗持续演化攻击的“免疫系统”。本议题旨在为安全研究人员、开发者和平台管理者提供新的观察框架和策略参考,推动大模型安全生态的建设。
技术创新点
本议题的创新点在于引入“进化论”视角,系统化建模大模型安全攻防的动态博弈过程,将“突变—选择—适应”类比为攻击技术的发展路径,帮助安全研究者理解攻击手段如何持续演化并绕过防御体系。
本议题将聚焦反序列化攻击、代码库投毒与GEO投毒三个大模型攻防中的典型案例,围绕每个案例,从进化链路的视角出发,剖析其攻击技术的演化模式。
同时,议题不仅关注攻击技术本身,还提出了基于进化博弈理论的防御思路,强调协同检测、供应链SBOM和社区联动“免疫系统”建设的系统性方案,力图为大模型安全提供一种面向未来对抗不断进化威胁的新框架与策略设计思路。
演讲人介绍
戎誉——vivo大模型攻防工程师。专注于大模型安全研究,涵盖模型框架层安全、AI 产品安全等方向。曾发现多个 NVIDIA、LLaMA-Factory 等主流厂商大模型产品中的安全漏洞,并获得官方致谢。
凡浩——vivo大模型攻防工程师。主要从事大模型基础设施和大模型产品的攻防研究,发现过多个 NVIDIA 等厂商大模型产品的安全漏洞并获得厂商致谢。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...