一、高水平算法为数据智能实践提供核心动力
智能指个体或系统通过感知、学习、推理、决策和适应环境,以实现特定目标或解决问题的综合认知能力。在数据智能的实践中,人们可以通过将智能化技术与生产生活场景充分结合,利用算法模型充分发挥数据资源价值,并以此提升生产生活中各项核心活动的执行效率。在这一过程中,高水平的人工智能(AI)算法模型在其中扮演了重要的角色。
自人工智能(AI)的概念于1956年诞生以来,人类致力于创造出具备近似或超越人类智能水平的智能计算系统,协助自身更加高效的解决问题和完成工作。对于人工智能的美好愿景,持续推动着机器学习等一系列相关学科与技术的诞生与发展,伴随着互联网、大数据等信息技术的陆续诞生与普及,通过算法对数据进行分析挖掘以支持决策的应用范式逐渐渗透至各行各业,不断提升人们的日常生活质量及生产效率。近年,生成式大语言模型的应用效果显著,进一步加快了人工智能技术渗透率的提升。
自2022年对话式语言生成模型ChatGPT发布以来,生成式大语言模型跨越式的应用效果提升再度唤醒人工智能产业的热度,以Transformer为代表的算法模型在其中起到了至关重要的作用。随后,在近两年的持续迭代中,强化学习、混合专家模型(Mixture of Experts, MoE)、蒸馏、思维链(Chain of Thought, CoT)、低秩适应(Low-Rank Adaptation, LoRA)微调、检索增强生成(Retrieval-Augmented Generation, RAG)等技术不断注入,从准确率、可解释性、推理性能、模型性价比等维度提升大模型的各方面能力,诞生出以GPT-4o、DeepSeek-R1等为代表的最新成果。
图7 以大模型为代表的人工智能技术体系概览
模型效果的持续提升,带动以大模型为代表的人工智能技术加速渗透应用至人们的日常生活以及各行各业的实际生产经营中。IDC数据显示,2024年中国生成式AI占AI市场投资总规模的18.9%,预计2028年生成式AI投资占比将达到30.6%,投资规模超300亿美元,五年复合增长率达51.5%。此外,大模型在制造业、医疗、金融等领域的渗透率将持续加深,更多的垂直行业专用模型逐步诞生。同步于行业模型,智能体(Agent)这一便于模型更加便捷的执行完成多样化任务的应用形式也成为当下一大发展方向。
当前人工智能技术产业发展正值高潮,但在模型效果、平台工具、应用形式三个层面仍分别存在待解决的相关问题。
1. 模型效果仍有提升空间
通用大模型的效果虽然还在逐步提升,但面向实际的应用需求仍存在多方面不足。总体来看,在模型算法的效果层面主要存在多模态能力有限、专业领域能力仍有不足、内容安全存在隐患三方面问题:一是多模态能力有限,虽然以GPT-4o为代表的头部大模型已具备多模态能力,但实际应用中模型在跨模态交互时仍旧存在不同程度幻觉或识别错误的情况,在涉及到众多场景实际需求的空间任务中,仍因空间推理能力不足而导致大量错误。效果不佳与训练、推理算力消耗带来的高成本相结合,综合导致当前模型多模态能力的实际适用性仍十分有限。二是专业领域能力仍有不足,在企业的实际生产经营中,仍有大量的应用场景涉及高度专业的行业或领域知识,当前通用模型难以支持。与此同时部分垂直领域专用模型的研发受领域、场景数据供给不足等问题的限制,模型效果仍旧存在缺陷,对于众多高度追求准确性的行业和业务场景来说难以将其投入生产环境。三是内容安全存在隐患,大模型迭代演进迅速,但在其效果不断提升的过程中内容安全防护手段仍有不足。当前基于规则、关键词、语义检测的过滤机制,在应对基本的输出内容审核需求之余,面对恶意提示词引导、模型价值观偏离、重要事实性错误等问题作用依旧有限。与此同时,用户问答数据等个人隐私数据,在当前部分大模型数据安全技术能力有限的情况下,仍存在外泄风险。而模型本身训练数据来源是否合规以及是否存在版权风险等问题,也将为大模型未来的持续发展带来潜在隐患。
2. 技术栈复杂带来更高技术门槛
以大模型为代表的最新人工智能算法模型,其研发应用过程通常需要一系列较为复杂的工具链支撑,高度专业化的技术工具无形中增加了其技术门槛。当前模型的研发应用过程是包含数据集的标注、预处理、特征提取,模型的设计、预训练、评估、后训练,模型部署、推理应用、监控运营等环节在内的一整套流程。为确保模型研发工作的敏捷性与迭代的便利性,研发流程中的各环节均发展出了一系列高度专业化的程序框架或工具,以便专业开发人员能够高效完成模型研发及迭代优化工作。而在大模型开始加速推广渗透的当下,更多企业试图引入相关技术工具自主进行模型研发、后训练、部署、推理应用,但繁杂琐碎的工具链为其技术选型和采购带来极高的技术门槛和学习成本。
为降低采购及应用门槛,集成化平台工具产品逐步诞生,但实际问题仍难以根除。部分产品供应商逐步推出模型即服务(Model as a Service, MaaS)平台、训推一体化平台等各类平台工具产品,意在向用户提供一套集成模型研发技术栈中复数工具能力的一站式平台化产品,但由于相关概念定义不明确、市场中各企业产品能力不统一、用户已完成部分工具建设等原因,实际项目中仍会出现产品能力缺失导致重复采购、用户存量系统并未利旧导致成本浪费、成套产品采购导致能力超需求冗余等问题。
3. 应用方式仍在探索尚未形成范式
随着通用大模型的效果提升速度逐步放缓,如何将已有的算法模型充分利用成为产业界更加关心的重要问题。从大模型的应用现状来看,当前仍存在企业端应用场景及形态零散、专业领域应用难度大、智能体应用形式仍需探索等问题:一是企业端应用场景及形态零散,产业界近年来对于大模型企业端应用的探索呈现出高度的离散化,较为突出的应用场景如知识检索、数据分析、智能编码、智能运维等场景之间相互独立,包括对话问答、嵌入式插件、无感内置等在内的应用形式形态各异。高度相异的场景特点和应用形式使得大模型企业端应用的渗透率提升难以加速。二是专业领域应用难度大,部分行业的生产经营场景高度依赖专业知识,利用大模型时需对通用基础模型进行大量后训练,形成专业领域模型,这一过程不但存在诸多前置条件以及额外成本,同时还存在训练成果弱于传统小模型的风险。此外,将某一特定专业领域模型迁移应用至其他领域的技术难度极高,对大量专业领域逐一训练专业模型的成本又令人难以接受。三是智能体应用形式仍需探索,能够依据感知及推理决策执行具体任务的智能体被视为未来大模型应用于企业端的主要形态。但当前智能体的构建多依赖于针对特定任务目标的离散化建设,单一智能体缺乏应对复杂任务和多任务的能力。与此同时,智能体实现特定任务的效果也依赖于决策模型的调用规划以及被调用任务工具的支持水平,导致不同智能体的应用效果之间存在较大差别。
1. 多模态能力持续提升助力专业领域模型发展
多数行业的实际业务场景中,都会涉及大量对于包含图像、视频、音频等在内多种模态对象的理解、推理需求,更好的跨模态推理能力也成为通用基础模型的重点发展方向。当前, 国外的OpenAI、Meta、谷歌,国内的字节、阿里、百度等等大模型头部公司均已发布各自的多模态大模型,后续也将持续提升模型的跨模态理解推理能力。实际上随着通用预训练大模型的效果难以进一步得到飞跃式提升,大模型领域的研究已进入后训练时代,在规模扩展(Scaling)、强化学习、微调(Fine-Tuning)这三类主要后训练技术的支持下,通过针对特定目标模态进行后训练,以此将通用大模型能力迁移扩展至多模态领域带来的成效,相较通用模型自身能力的优化更加显著。同时以Llama 4为代表的更多主流大模型开始采用MoE架构,多专家领域划分的网络结构使模型对多种模态的支持效率与效果能够得到进一步提升。
2. 智能中台兴起模块化解构模型研发技术栈
大模型的研发应用过程中涉及的技术栈复杂、工具链繁多,以能力建设为主导的中台理念,相较纯粹由技术平台形态牵引的产品概念,更适用于应用方完善自身模型研发应用能力。智能(AI)中台的概念源于数据中台所带动的“中台”概念扩散。智能中台可以理解为企业内部支撑算法模型研发、应用、运营所需的公共能力集合,包含了企业利用人工智能技术赋能自身智能化转型所需的主要基础支撑性能力。通过能力集合的视角,应用方可对自身数据、算法、算力各方面的支撑情况,即包含数据集管理、算力资源调度等周边支撑能力在内的算法模型加工利用全流程支持情况,进行逐一模块化对标,合理规划自身所需额外建设的能力,简化选型难度,有效进行系统利旧,避免重复建设带来的额外成本。近年来,智能中台的概念逐渐在各行业领域得到实践,中国电信、南方电网等各行业头部企业纷纷推进自身智能中台建设。
图8《智能中台能力成熟度模型》框架
3. 多任务智能体及多智能体协同有望持续突破
模型上下文协议(Model Context Protocol, MCP)逐渐普及,智能体能力上限有望得到进一步拓展。近期,MCP逐渐流行于越来越多主流大模型的最新版本中,相较于让模型通过传统Function Call形式调用外部特定功能,MCP能够通过更多标准化的预建程序让模型实现更灵活的外部功能集成调用。基于MCP的逐渐普及,未来单个智能体可以更加便利的集成更多外部功能,实现对于囊括多个子任务的复杂任务的有效支持,充分利用模型推理能力,使智能体拥有更加强大的任务规划和丰富的多任务执行能力。与此同时,多智能体协同架构的逐步完善有望弥补单一智能体难以泛化的能力瓶颈。在不断通过技术手段提升单一智能体能力的同时,多智能体协同技术方案也逐步受到关注。今年3月发布的Manus便采用了多智能体系统架构,对复杂任务能够先进行任务分解,然后由多个不同智能体协同完成各个子任务,最终实现整体任务目标。而在今年4月,谷歌发布了用于智能体间通信的开源协议Agent2Agent (A2A),在MCP的基础上进一步允许其他智能体也成为智能体调用的对象,以此加强智能体之间的互操作性和协作能力,使多智能体间协同更加灵活便捷,完成复杂任务的策略和方式更加丰富多变。
在协议层的进展之外,随着智能体的应用加深,AgentOps作为针对智能体本身的研发运营方法论也更加受到关注。随着企业内部智能体部署规模的增长,对于智能体研发、部署、监控、优化和治理等全生命周期管理的系统性需求也在同步激增。智能体研发运营(AgentOps) 是以智能体(AI Agent)为核心对象,强调将传统模型开发与智能体特有的规划、推理、执行、反馈能力相结合,形成端到端的研发运营管理闭环。未来,企业将参照这一方法论,通过构建标准化流程、自动化工具链及跨职能协作机制,提升智能体开发效率,增强智能体运营稳定性,优化多智能体协同能力,促进智能体系统同业务场景的紧密耦合,最终推动智能体的规模化落地与价值释放。
本文节选自大数据技术标准委员会于2025年6月18日在“2025数据智能大会”上发布的《数据智能研究报告(2025年)》。
报告介绍及全文下载链接如下:
未来,中国信通院将持续聚焦数据智能产业与技术发展的最新动态,深入剖析数据、算法、应用、安全等数据智能具体领域的现状问题,以期为企业未来的数据智能实践提供参考。欢迎数据智能产业各方参与。
联系人:
田稼丰
18795986568(微信同号)
中国通信标准化协会大数据技术标准推进委员会(CCSA TC601,简称:数标委/BDC),旨在凝聚产业链各个环节,识别和解决大数据发展面临的重大问题,开展大数据技术、数据资产管理、数据共享与流通、数据安全等共性基础标准研究,以标准推进工作为纽带,推动大数据与实体经济深度融合。欢迎加入我们的行列!
入会咨询:白老师 13520285502
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...