欧盟委员会在历经数月谈判后,于法律生效期限前三周正式发布了《通用人工智能模型行为准则》最终版,旨在规范通用人工智能模型的运作方式。
欧盟委员会表示,《通用人工智能行为准则》虽属自愿性规范,但采纳该准则的企业可通过"减轻行政负担"和"增强法律确定性"双重优势,来证明其符合《欧盟人工智能法案》要求。相较于其他合规途径,遵循该准则的企业将获得更高效的监管对接机制。
这一政策承诺折射出当前欧盟数字规则体系的争议——企业界持续批评现行监管框架过度严苛,相关条款可能面临整体性修订。该准则原定于五月发布(早于法案通用AI条款八月生效的时点),但欧盟委员会仍需就"通用AI服务商"的认定标准发布补充指引。尽管科技企业及产品使用方多次呼吁推迟法案实施,欧盟执行机构已明确表示现阶段不会调整生效时间表。【1】
《通用人工智能模型行为准则(Code of Practice for General-Purpose AI Models)》(以下简称《行为准则》或该准则)的透明度章节阐述了签署方为履行《AI法案》第53(1)条(a)(b)款及附件XI、XII规定的透明度义务所承诺实施的三大措施。
因该准则是为履行落实欧盟AI法案(EU AI Act,以下简称《欧盟AI法案》或法案)而制定的。所以在后文中不免引述对照法案原文进行分析。
模型提供商的透明性原则义务及豁免
首先,让我们回顾下“什么是通用AI模型?”。
【EU AI Act 第3(66)条 通用AI模型的定义 规定:通用人工智能系统”是指基于通用人工智能模型的人工智能系统,该系统可以服务于多种目的,既可以直接使用,也可以集成到其他人工智能系统中。】
该准则的法律依据,直接对应《欧盟AI法案》第53(1)(a)(b)条,要求通用AI模型提供商履行双重文档义务:
✓ 基础文档(附件 XI第1节):所有通用AI模型必须提供
✓ 系统性风险文档(附件 XI第2节):触发该法案第52(1)条
【EU AI Act 第 53(1)(a)(b) 条 通用人工智能模型提供者的义务 规定:
1.通用人工智能模型的提供者应:
(a) 编制并不断更新该模型的技术文件,包括其培训和测试过程及其评估结果,其中至少应包含附件十一所列的要素,以便应要求向人工智能办公室和成员国主管机关提供;
(b) 编制、不断更新并向意图将通用人工智能模型纳入其人工智能系统的提供者提供信息和文件。在不影响根据欧盟和成员国法律尊重和保护知识产权和商业机密信息或商业秘密的情况下,信息和文件应:
(i) 使人工智能系统的提供者能够很好地了解通用人工智能模型的能力和局限性,并遵守本条例规定的义务;以及(ii) 至少包含附件十二所列内容;]
其中,符合第53(2)条的开源模型可豁免,除非被认定为系统性风险,作为豁免条款。
【EU AI Act 第53(2)条 开源模型豁免 规定:第 1 段(a)和(b)项规定的义务不适用于根据免费且开源许可向公众提供的人工智能模型的提供者,开源许可允许获取、使用、修改和分发模型,其参数,包括权重、模型结构信息和模型使用信息,均向公众公开。这一例外不适用于具有系统性风险的通用人工智能模型。】
【EU AI Act 第51条将通用人工智能模型归类为具有系统性风险的通用人工智能模型 规定:
1.如果一个通用人工智能模型符合以下任何一项标准,则应将其归类为具有系统性风险的通用人工智能模型:
(a) 根据适当的技术手段和方法,包括指标和基准,对其影响能力进行评估而认定其具有高
影响力;
(b) 根据欧盟委员会依职权做出的决定,或在科学小组提出有资质的警告后,考虑附件十三
设定的标准,认为通用人工智能模型具有与第(a)项相同的能力或影响。
2.根据第 1 段第(a)项,当一个通用人工智能模型用于训练的累计计算量以浮点运算计大于
1025时,应推定该模型具有高影响能力。
3. 根据不断发展的技术,如算法的改进或硬件效率的提高,欧盟委员会应当根据第 97 条通
过授权法案,修订第 1 段和第 2 段列出的阈值,以及对基准和指标进行补充,以使这些阈值
反映先进技术水平。】
披露义务的对象
签署方在将通用人工智能模型投放市场时,应通过官方网站(若无官网则采用其他适当方式)公开披露以下信息:
欧盟人工智能办公室及下游供应商的联系方式,以便其请求获取模型文档所含相关信息或其他必要资料;
根据《AI法案》第91条或第75(3)条规定,当人工智能办公室要求提供模型文档特定要素或补充信息时:
【EU AI Act 第91条 要求提供文件和信息的权力 规定:
1.欧盟委员会可要求相关通用人工智能模型的提供者提供其根据第 53 条和第 55 条起草的文件,或为评估该提供者遵守本条例的情况所需的任何补充信息。
2.在发出提供信息的请求之前,人工智能办公室可与通用人工智能模型的提供者开展有组织的对话。
3.根据科学小组提出的理由充分的请求,欧盟委员会可向通用人工智能模型的提供者发出提供信息的请求,条件是根据第 68 条第 2 段的规定,获取信息对于完成科学小组的任务是必要的和成比例的。
4.信息请求应说明请求的法律依据和目的,具体说明需要哪些信息,并规定提供信息的期限,并注明第 101 条规定的对提供不正确、不完整或误导性信息的罚款。
5. 有关通用人工智能模型的提供者或其代表应提供所要求的信息。如果是法人、公司或企
业,或如果其不具备法人资格,则由法律或其章程授权加以代表的人,应代表相关通用人工智能模型的提供者提供所要求的信息。经正式授权的律师可代表其委托人提供信息。如果提供的信息不完整、不正确或有误导性,委托人应承担全部责任。】
【EU AI Act 第75(3)条 成员国监管机构职权 规定:当一个成员国市场监督管理机关已做出一切适当努力来获得这些信息,但仍无法获得与人工智能模型有关的特定信息,从而无法完成对高风险人工智能系统的调查时,其仍可向人工智能办公室提出合理的请求,以便能够强制获得这些信息的访问权。在这种情况下,人工智能办公室应毫不拖延地向申请机关提供人工智能办公室认为与确定高风险人工智能系统是否不合规有关的任何信息。市场监督管理机关应根据第 78 条的规定对所获得的信息保密。1020/2019 号条例第 6 章规定的程序应比照适用。】
所提供信息应为最新版本
须在人工智能办公室依据第91(4)条规定的时限内完成提交
【EU AI Act 第91(4)条 规定:信息请求应说明请求的法律依据和目的,具体说明需要哪些信息,并规定提供信息的期限,并注明第 101 条规定的对提供不正确、不完整或误导性信息的罚款。】
特别说明:该要求尤其适用于评估"系统提供商与模型提供商分离"情形下基于通用AI模型的高风险AI系统合规性。
披露具体内容
根据不同的对象,披露的内容也不同。具体的差异可详见文尾的准则原文。
其中,以下几点在填写的过程中需要特别注意:
关于“数据是如何获取”这一点,描述用于获取和选择训练、测试和验证数据的方法,包括用于注释数据的方法和资源,以及用于生成合成数据的模型和方法(如适用)。对于先前从第三方获得的数据,如果尚未在根据第53(1)条第(d)点发布的训练数据公开摘要中披露,则应描述提供者如何获得数据权利。
【EU AI Act 第 53 (1)(d)条通用人工智能模型提供者的义务 规定:根据由人工智能办公室提供的模板,起草并公开有关用于通用人工智能模型训练的内容的足够详细的摘要。】
对将采集的数据转化为模型训练、测试及验证数据所涉及的数据处理过程进行总体说明,例如:清洗(如过滤掉广告等无关内容)、标准化(如分词)、增强(如反向翻译)。
若在数据采集或处理过程中实施了任何方法(如有),需说明其具体描述,用于检测不符合模型预期用途的数据源包括但不限于非法内容、儿童性虐待材料(CSAM)、非自愿亲密影像(NCII)以及可能导致其非法处理的个人数据。
其中关于“训练过程中的能耗计算方法”说明义务要求:根据《人工智能法案》第53(5)条授权,若未制定相关实施细则,则需说明具体测量与计算方法用于测算训练能耗。当模型能耗数据未知时,可根据计算资源使用情况推算能耗值。若因计算或硬件供应商未提供关键信息导致无法估算训练能耗,供应商应明确说明缺失的具体信息类型。
关于“推理过程中的能耗计算方法”说明义务要求:一般以FLOP(浮点操作数)作为单位计量。在未根据《人工智能法案》第53(5)条详细说明测量和计算方法论而通过授权行为的情况下,需提供对计算任务(例如:生成100000个Token)的描述以及用于推断计算量的测量或估算所使用的硬件(例如:64Nvidia A100s)。
————
【1】European Commission receives final version of General-Purpose AI Code of Practice,Caitlin Andrews,https://iapp.org/news/a/european-commission-receives-final-version-of-general-purpose-ai-code-of-practice/?mkt_tok=MTM4LUVaTS0wNDIAAAGbs7_wFhU6Qvxg0Y5DNm0mbi7xOAPwm2PcuqIqZQHMSiIGYAWuVipH7uFSEgwpoJwthAJEx4yvtZ7z8nvM5LNO9-K84ymBEqg7AwTyXECL0oxgMA.
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...