扫码订阅《中国信息安全》
邮发代号 2-786
征订热线:010-82341063
一、引言:数字时代的数据困境与机遇
在数字经济蓬勃发展的当下,数据已成为驱动各行业发展的关键生产要素,被誉为新时代的 “石油”“黄金”。随着信息技术的飞速发展,数字经济正以前所未有的速度改变着我们的生活和经济模式。数据作为数字经济的核心要素,其价值愈发凸显。2024 年我国数字经济规模占 GDP 比重已超过 40%,数据的流通与共享在其中发挥着关键作用。从宏观层面看,数据驱动的决策模式正在改变政府的治理方式,提升公共服务的效率和质量;从微观层面讲,企业通过对数据的深度挖掘和分析,能够实现精准营销、优化生产流程、创新产品和服务,从而在激烈的市场竞争中占据优势。
然而,数据资源的 “沉睡” 与 “孤岛化” 问题长期存在,成为制约数字经济发展的重要瓶颈。政府部门因数据合规和安全管控要求“不愿”共享,企业因技术壁垒和标准缺失难以互通,社会因监管滞后和隐私滥用风险不敢开放。这些问题如同一道无形的枷锁,禁锢了数据的流动与价值释放。数据泄露、滥用等安全事件时有发生,严重威胁企业和个人的利益。根据相关统计,近年来全球范围内的数据泄露事件呈逐年上升趋势,造成的经济损失高达数十亿美元。数据流通面临着存储管理风险、数据泄露风险、数据滥用风险、数据篡改风险等安全问题,这些风险不仅阻碍了数据要素价值的充分释放,也使得数据拥有者对数据流通心存顾虑。
在这样的背景下,构建可信数据空间成为打破数据流通困境、释放数据要素价值的关键。可信数据空间作为一种新型的数据流通利用基础设施,通过技术、规则和生态的共同作用,确保数据的安全性、可靠性和高效性,为数据要素的市场化配置提供了有力支撑。国家也高度重视可信数据空间的建设,发布了一系列政策文件,如《可信数据空间发展行动计划(2024—2028 年)》,明确提出到 2028年,我国将建成100个以上可信数据空间,形成一批数据空间解决方案和最佳实践。
二、可信数据空间:数据要素价值共创的新引擎
(一)可信数据空间的定义与内涵
可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体 。它以 “可信” 为核心,通过一系列技术、规则和机制,保障数据在流通和使用过程中的安全性、可靠性和合规性,打破数据孤岛,促进数据要素的自由流动和价值释放。
(二)可信数据空间的建设五个核心要素
可信数据空间的建设是一个复杂的系统工程,需要综合考虑多个核心要素,包括应用场景、数据资源、生态、规则机制和技术系统。
1. 应用场景:应用场景是可信数据空间建设的出发点和落脚点。只有明确了具体的应用场景,才能有针对性地整合数据资源、构建生态体系、制定规则机制和选择技术系统。应用场景可以涵盖政务、金融、医疗、教育、工业等多个领域,如医疗可信数据空间的政府决策、公卫预警、智能诊疗、智能药研、三医联动等应用场景;企业可信数据空间的供应链、碳足迹管理、物流与仓储等应用场景。
2. 数据资源:数据资源是可信数据空间的核心资产。丰富、高质量的数据资源是实现数据价值的基础。数据资源可以来自政府部门、企业、社会组织和个人等多个渠道,包括结构化数据、半结构化数据和非结构化数据等多种类型。在建设可信数据空间时,需要对数据资源进行全面治理和加工,建立数据目录和数据标准,确保数据的一致性和可用性。
3. 生态:生态是可信数据空间可持续发展的关键。一个健康的生态系统需要吸引数据提供方、数据使用方、技术服务方、运营方等多方主体参与,形成互利共赢的合作关系。通过建立开放的合作平台和激励机制,促进生态各方的协同创新和价值共创,推动可信数据空间的不断发展壮大。
4. 规则机制:规则机制是可信数据空间运行的保障。它包括数据接入规则、数据使用规则、数据安全规则、收益分配规则等,明确了生态各方的权利和义务,规范了数据的流通和使用行为。规则机制的制定需要充分考虑法律法规、行业标准和市场需求,确保其合法性、合理性和可操作性。
5. 技术系统:技术系统是可信数据空间的支撑。它包括数据接入、存储、计算、安全等多个方面的技术,为数据的流通和使用提供技术保障。在选择技术系统时,需要综合考虑技术的先进、可靠、安全、成本、可扩展等,确保其能够满足可信数据空间的业务需求。
(三)可信数据空间的整体架构
结合可信数据空间的核心要素,总结提炼出可信数据空间的设计框架,如下图所示:
1. 厘清基础:首先厘清已有基础,着重整合已有 “数据资源” 和 “生态资源”,为整个可信数据空间提供坚实的数据和生态基础。
2. 顶层设计:规划搭建 “建、治、管、服、运” 整体框架,从宏观层面指导可信数据空间的建设、治理、管理、服务和运营。它明确了可信数据空间的发展战略、目标定位、组织架构和运营模式,确保可信数据空间的建设和发展符合国家战略和市场需求。
3. 规则机制:制定可信接入规则,确保参与可信数据空间的各方主体身份可信、数据来源合法;建立安全审核规范,对数据的传输、存储和使用进行严格的安全审查;明确互联互通规范,促进不同可信数据空间之间的信息共享和业务协同;规范共享使用规范,规定数据的使用范围、方式和期限;制定服务定价机制,合理确定数据服务的价格;建立收益激励机制,激发生态各方参与可信数据空间建设和运营的积极性。
4. 生态系统:汇聚数据提供方,提供丰富的数据资源;数据加工方,对原始数据进行清洗、标注、分析等处理;数据服务方,为数据的流通和使用提供技术支持和服务;数据运营方,负责可信数据空间的日常运营和管理;数据使用方,利用数据进行业务创新和价值创造;数据监管方,对可信数据空间的运行进行监督和管理,确保其合规运营。通过各方的协同合作,形成一个完整的可信数据空间生态系统。
5. 应用场景:通过规则机制体系和生态合作伙伴一起价值共创出应用场景。根据不同行业和领域的需求,结合数据资源和技术能力,开发出具有实际应用价值的场景,如联合执法、三医联动等,实现数据的价值变现。
6. 数据服务:结合应用场景需求,利用流通设施构建可信可控安全数据流通服务能力。它提供数据共享、数据交易、数据托管、数据分析等多种服务,为应用场景的实现提供技术支持和服务保障。
7. 三大能力:结合流通设施构建可信数据空间 “可信管控能力、资源交互能力、价值共创能力” 三大能力。可信管控能力确保数据的安全性和可信性;资源交互能力实现数据的高效流通和共享;价值共创能力推动数据的创新应用和价值创造。
8. 流通设施:构建 “端到端” 全链可信的数据基础设施,包括数据存储设施、数据计算设施、数据传输设施、数据安全设施等。它为数据的流通和使用提供物理支撑,确保数据能够在可信数据空间中安全、高效地流动。
(四)国家标准与要求
国家高度重视可信数据空间的标准化建设,发布了一系列相关标准和要求,为可信数据空间的建设和发展提供了指导和规范。《国家数据基础设施建设指引》明确了可信数据空间在国家数据基础设施中的重要地位和作用,提出了可信数据空间的建设目标、原则和重点任务。《可信数据空间 技术架构》则从技术、流程、安全等多个方面,对可信数据的建设和运营提出了具体的标准和要求。
这些标准和要求强调了 “多个统一”,即统一身份、统一标识、统一目录、统一监管。统一身份确保参与可信数据空间的各方主体身份真实可信;统一标识实现数据的唯一标识和精准定位;统一目录方便数据的查询和管理;统一监管保障可信数据空间的安全和合规运行。同时,强调全国一盘棋,要求各地在建设可信数据空间时,要遵循国家统一的标准和要求,加强统筹协调和资源整合,避免重复建设和数据孤岛的形成。
(五)可信数据空间服务平台和可信接入连接器设计
绿盟科技作为在网络安全领域的领先企业,积极响应可信数据空间建设的号召,推出了可信数据空间服务平台和可信接入连接器,为可信数据空间的建设提供了有力的技术支持和解决方案。
绿盟科技可信数据空间服务平台依据国家标准设计,拥有六大核心能力,包括身份管理、接入连接器管理、目录管理、可信空间管理、数字合约管理、数据使用控制等。还扩展有供需磋商、数据加工、数据托管、数据交易、合规审查等能力。
可信接入连接器则是实现数据安全接入可信数据空间的关键设备。它采用了“芯片级”的硬件与软件融合的安全架构,另对接入的设备和用户进行严格的身份认证和权限管理,确保只有合法的设备和用户才能接入可信数据空间。连接器还具备数据加密、传输加密、访问控制等安全功能,有效防止数据泄露和篡改,保障数据在传输过程中的安全性。通过可信接入连接器,企业和机构可以将内部的数据安全地接入可信数据空间,实现数据的流通和共享,同时保护自身的数据安全。
(六)厘清可信数据空间建设的核心要素
1. 厘清五类可信空间建设的逻辑关系:
(来源:可信数据空间发展联盟《可信数据空间科普问答》)
企业可信数据空间是基础,通过企业内部的数据流通和共享,提升企业的运营效率和创新能力;行业可信数据空间是纽带,促进产业链上下游企业之间的数据协同和创新,推动行业的发展;城市可信数据空间是支撑,整合城市内的各类数据资源,提升城市的治理水平和服务质量;个人可信数据空间是补充,保护个人数据隐私的同时,实现个人数据的价值变现;跨境可信数据空间是拓展,促进国际间的数据交流和合作,推动数字经济的全球化发展。这五类可信数据空间相互关联、相互促进,共同构成了可信数据空间的整体架构。
2. 厘清规划建设的核心要素:
(1) 信任机制:信任机制是可信数据空间建设的核心。通过建立可信的身份认证、数据加密、访问控制等技术手段,以及完善的法律法规和监管体系,确保数据的安全性和可靠性,增强数据提供方和使用方之间的信任。
(2) 价值共创:实现数据驱动与价值驱动双循环。以数据为驱动,挖掘数据的潜在价值,为业务创新提供支持;以价值为驱动,根据市场需求和业务目标,引导数据的流通和应用,实现数据的价值最大化。通过双循环机制,激发各方参与可信数据空间建设的积极性和创造性。
(3) 持续运营:注重运营生态、运营价值。建立健全的运营管理体系,吸引和培育优质的生态合作伙伴,打造互利共赢的生态环境。同时,通过不断优化数据服务和应用场景,提升数据的价值和影响力,实现可信数据空间的可持续发展。
(4) 保障能力:落实 “五统一、六可信、六可控、五安全”。“五统一” 即统一身份、统一标识、统一目录、统一接入、统一监管;“六可信” 指身份可信、数据可信、行为可信、服务可信、算法可信、结果可信;“六可控” 包括访问可控、使用可控、流向可控、风险可控、审计可控、溯源可控;“五安全” 涵盖数据安全、网络安全、应用安全、平台安全、物理安全。通过这些保障能力的建设,确保可信数据空间的安全、稳定运行。
3. 厘清数据运营逻关系:
(参考:中国信息通信研究院政务服务中心 王跃, 莫莉娟, 苏娜 公共数据授权运营体系整体视图、建设策略与 部委应用研究,数据与计算发展前沿(中英文),2024,6(5))
持续开展数据授权运营工作是建设后核心工作。数据授权运营涉及组织机构众多、流程复杂、用户多样,需要升级现有的数据治理体系、管理办法、服务模式、以及数据生态。信任机制是关键,管理流需要确保数据流与价值流在双边正向激励合规有序安全运行。
(七)可信数据空间的建设路径
可信数据空间的建设是一个渐进的过程,需要遵循“试点 - 示范 - 推广”的建设路径,逐步推进。
1. 试点:选择具有代表性的行业、企业或地区开展试点工作。在试点过程中,充分结合当地的实际情况和需求,探索适合的建设模式、技术方案和运营机制。通过试点,积累经验,发现问题,为后续的示范和推广提供参考。
2. 示范:在试点成功的基础上,打造一批具有示范效应的可信数据空间案例。这些案例应在技术创新、应用创新、模式创新等方面具有突出表现,能够为其他地区和行业提供借鉴和启示。通过示范案例的宣传和推广,提高社会各界对可信数据空间的认识和认可,激发更多的主体参与可信数据空间的建设。
3. 推广:将试点和示范阶段取得的成功经验和模式进行复制和推广,在更大范围内推进可信数据空间的建设。加强政策引导和支持,鼓励各地结合自身特点,积极开展可信数据空间建设,形成全国范围内的可信数据空间网络,促进数据要素的自由流通和价值释放。
三、从 “国芯” 构建信任:关键技术与创新突破
(一)技术架构
绿盟科技基于可信根(TCMTPM TPCM)、可信执行环境(TEE)、国密算法(SM4)、统一访问使用控制、数字合约、行为审计、区块链等技术融合创新,形成了一套完善的技术架构。这套架构犹如一座坚实的“保险箱”,为可信数据空间的建设奠定了稳固的基础。
在这个架构中,可信根作为信任的源头,为整个系统提供了初始的信任锚点。可信执行环境则为数据的处理和计算提供了一个安全、隔离的空间,确保数据在运行过程中的安全性和保密性。国密算法作为我国自主研发的加密算法,为数据的加密和解密提供了强大的技术支持,保障了数据的机密性和完整性。统一访问使用控制则对用户的访问行为进行严格的管理和控制,确保只有合法的用户才能访问和使用数据。数字合约则通过智能合约的形式,实现了数据交易和使用的自动化和规范化,提高了数据流通的效率和安全性。行业审计则对数据的使用和流通进行全面的审计和监督,确保数据的使用符合法律法规和行业规范。区块链技术则通过去中心化的分布式账本,实现了行为审计数据的不可篡改和可追溯,增强了数据的可信度和安全性。
(二)国产可信环境
可信启动(TCMPCMTPCM)
基于可信根的可信启动技术是保障系统安全启动的关键。以 TCM(可信密码模块)为例,它作为可信根的一种实现方式,内置了多种安全功能,如密码运算、密钥管理、数字签名等。在系统启动时,TCM 首先对 BIOS 进行完整性度量,确保 BIOS 没有被篡改。然后,BIOS 再对操作系统内核进行度量,以此类推,形成一条信任链。只有当链上的每一个环节都通过验证,系统才能正常启动。这种层层验证的机制,就像给系统穿上了一层坚固的铠甲,有效防止了恶意软件在系统启动阶段的入侵,保障了系统的安全性和可信性。
可信执行环境(TEE)
基于可信执行环境 TEE 的可信隔离空间技术,为数据的处理提供了一个安全的 “保险箱”。在 TEE 中,数据和代码被隔离在一个与普通执行环境完全隔离的安全区域内运行。这个区域拥有独立的内存管理、处理器资源和安全机制,外界无法直接访问其中的数据和代码。例如,当进行金融交易时,交易数据可以在 TEE 中进行加密处理和验证,即使操作系统被攻击,交易数据也能得到有效保护,避免了数据泄露和篡改的风险,为数据的安全处理提供了坚实的保障。
(三)国密算法
可信环境结合 SM4 形成加密虚拟机、加密容器,构建成机密计算。SM4 作为我国自主研发的对称加密算法,具有高效、安全的特点。在加密虚拟机中,SM4 算法对虚拟机中的数据进行加密,使得即使虚拟机的镜像被窃取,攻击者也无法获取其中的明文数据。加密容器则利用 SM4 算法对容器内的数据进行加密保护,确保数据在容器间传输和存储过程中的安全性。通过这种方式,机密计算实现了数据在计算过程中的全程加密,有效保护了数据的机密性,为数据的安全计算提供了可靠的技术手段。
(四)机密计算
机密虚拟机 机密容器
在云计算环境中,机密虚拟机和机密容器为用户提供了安全的计算环境。机密虚拟机利用可信执行环境技术,将虚拟机的内核和应用程序运行在一个受保护的安全区域内,对虚拟机中的数据进行加密存储和处理。机密容器则通过容器编排技术和加密机制,实现了容器内应用程序和数据的安全隔离和加密保护。无论是大型企业的核心业务计算,还是中小企业的灵活应用部署,机密虚拟机和机密容器都能为其提供安全、高效的计算服务,保障数据在云端的安全运行。
机密存储
机密存储采用加密技术对存储的数据进行加密处理,确保数据在存储过程中的机密性和完整性。例如,使用 SM4 算法对数据进行加密后存储在硬盘或云端存储中,只有拥有正确密钥的用户才能解密读取数据。同时,通过数据冗余和备份技术,保证数据的可靠性,防止数据丢失。这种机密存储方式,为数据的长期存储和管理提供了安全保障,让数据拥有者无需担心数据在存储过程中的安全问题。
机密计算
机密计算在计算过程中对数据进行加密处理,使得计算过程中的数据始终以密文形式存在。即使计算节点被攻击,攻击者也无法获取到明文数据。通过同态加密、多方安全计算等技术,机密计算能够在不泄露数据内容的前提下进行数据的计算和分析,为数据的安全计算提供了创新的解决方案。例如,在医疗领域,通过机密计算技术可以对患者的医疗数据进行安全分析,挖掘数据中的潜在价值,同时保护患者的隐私。
(来源:中国科学院软件研究所 冯登国 机密计算:进展与展望,中国计算机学会通讯,CNCC2024特邀报告)
(五)轻量化的一体化安全能力
绿盟科技在可信数据空间服务平台、机密计算集群、可信接入连接器的技术架构中轻量化融入了主机安全、入侵检测、用户行为审计、数据脱敏、数据水印、API 安全等传统安全能力。主机安全防护软件可以保护主机系统免受恶意软件的攻击;入侵检测系统能够实时监测网络流量,及时发现并阻止入侵行为;数据脱敏技术对敏感数据进行处理,使其在不影响业务使用的前提下降低数据泄露的风险;数据水印技术则为数据添加不可见的标识,以便在数据被泄露时能够追踪溯源;API 安全则保障了数据接口的安全性,防止 API 被攻击和滥用。这些传统安全能力的轻量化融入,就像为可信数据空间增添了一道道坚固的防线,进一步提升了可信数据空间的整体安全性。
(六)隐私计算
绿盟科技的隐私计算融合了多方安全计算(MPC)、联邦学习(FL)和可信执行环境(TEE)等多种技术的综合架构。通过将多方安全计算MPC与TEE结合,可以在提升计算效率的同时,进一步增强数据的安全性。通过在TEE中运行联邦学习算法,可以确保数据在计算过程中的安全性和隐私性。例如,在医疗领域,不同医院可以通过联邦学习技术联合训练疾病诊断模型,而无需将患者的医疗数据集中存储和共享。TEE+MPC和TEE+FL融合的隐私计算技术的应用,为数据的流通和合作提供了更加安全、隐私保护的方式,促进了数据的价值挖掘和利用。
(七)区块链
区块链技术在可信数据空间中发挥着重要作用。它通过去中心化的分布式账本,实现了数据的不可篡改和可追溯。在数据流通和共享过程中,每一次数据的操作都被记录在区块链上,形成一条完整的交易记录。审计人员可以查看区块链上的记录,但无法篡改其中的数据。这种特性增强了数据的可信度和安全性,使得数据的来源和流转过程更加透明。例如,在供应链金融中,通过区块链技术可以记录货物的流转信息和资金的交易记录,确保交易的真实性和可靠性,为供应链金融的发展提供了有力的支持。
四、可信数据空间建设探索与实践经验
案例1:科学数据可信空间
科学数据可信空间致力于为科研人员提供一个安全、可信的数据共享和协作平台。通过采用可信执行环境(TEE)+联邦学习(FL)+数字合约来访问使用授权数据,可以实现“数据可用不可见,原始数据不出域”。同时,该空间还提供了数据溯源和审计功能,方便科研人员对数据的来源和使用情况进行追踪和验证,为科学研究的可靠性提供了有力保障。
案例2:医疗健康可信数据空间
医疗健康可信数据空间的建设对于提升医疗服务水平、推动医学科研发展具有重要意义。它汇聚了医疗机构、药企、医保部门等多方的数据资源,包括患者的电子病历、医疗影像、临床检验结果等。通过隐私计算技术,在保护患者隐私的前提下,实现了医疗数据的流通和共享。以卫健委为例,依托绿盟自研可信数据空间能力底座,建设医疗健康行业可信数据空间,实现医疗机构高价值数据集中汇聚开发利用,应用分布式连接隐私计算模式,实现 “敏感数据不出域,数据可用不可见”,促进数据合规高效流通使用。通过该空间,药企可以远程使用真实的临床数据,开展药物研发和临床试验;科研机构可以进行大规模的医学数据分析,探索疾病的发病机制和治疗方法;医保部门可以实现精准的医保报销和费用控制,提高医保基金的使用效率。
案例3:企业可信数据空间
企业可信数据空间是企业实现数字化转型、提升竞争力的重要支撑。它以龙头企业为核心,协同上下游企业,实现了供应链数据的高效流通和共享。以某企业为例,通过搭建企业可信数据空间,与上下游供应商、经销商等建立了紧密的数据连接。供应商可以实时了解企业授权的生产计划和零部件需求,及时调整生产和供货计划,提高供应链的响应速度和协同效率。
五、未来展望:可信数据空间的无限可能
随着数字经济的持续发展和技术的不断创新,可信数据空间的未来充满了无限可能,将在更多领域发挥重要作用,为经济社会的发展带来深远影响。
在人工智能领域,可信数据空间将成为数据驱动创新的重要支撑。人工智能的发展离不开大量高质量的数据,可信数据空间能够汇聚多方数据资源,为人工智能模型的训练提供丰富的数据来源。通过可信数据空间,科研机构和企业可以获取到来自不同领域、不同行业的海量数据,从而训练出更加智能、精准的人工智能模型。这些模型将在医疗诊断、智能驾驶、金融风险预测等领域得到广泛应用,推动各行业的智能化升级。
从 “芯” 构建信任之钥,开启可信数据空间价值共创之门,是数字时代发展的必然趋势。让我们积极拥抱这一变革,以创新为驱动,以实践为导向,共同探索可信数据空间的无限可能,开创数据价值共创的新时代,让数据这一关键生产要素在可信数据空间的舞台上绽放出更加耀眼的光芒,为经济社会的发展带来更加美好的未来。
(绿盟科技供稿,作者为绿盟科技集团解决方案销售中心总工程师李永松)
分享网络安全知识 强化网络安全意识
欢迎关注《中国信息安全》杂志官方抖音号
《中国信息安全》杂志倾力推荐
“企业成长计划”
点击下图 了解详情
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...