缺乏数据素养人工智能将会失败
Emma McGrattan是Actian的首席技术官。
有时数据看起来很简单,很容易让人误解,但真正理解数据,仅仅读懂图表是不够的。你需要建立直觉,了解数据想要表达什么,以及如何解读它。
为了说明这一点,我喜欢用天气预报来说明。我在爱尔兰长大,每次谈话都始于天气。一个常见的误解是,“51%的降雨概率”意味着下雨的可能性略高于不下雨的可能性——几乎是避险。但它真正的意思是,预报员100%确信会下雨,但降雨只会覆盖预报区域的51%。这说明,即使数据看起来很直观,人们也很容易误解它。
这种认知与现实之间的差距,正是企业急于采用人工智能时面临的风险。人工智能的优劣取决于其背后的数据,然而大多数企业却缺乏真正具备数据素养的员工。Gartner预测,到2026年,那些缺乏AI就绪数据实践的企业将有超过60%的人工智能项目无法兑现业务承诺,最终被放弃。这一失败率令人震惊,而其根本原因几乎都是一样的:数据基础薄弱。
数据素养的真正含义
当我们谈论语言素养时,它指的是阅读、理解和交流的能力。数据素养亦是如此——它指的是能够阅读和解读数据,然后用它讲述一个别人能理解的故事。
要具备数据素养,你无需编写Python脚本,也无需成为数据科学家或Excel高手。但你需要学会理解数据所传达的信息,发现异常并提出正确的问题。
一个真正具备数据素养的组织,其每项决策——无论是产品开发、营销支出还是招聘——都基于商业直觉和数据证据。这意味着团队能够轻松应对关键绩效指标(KPI),并能够以此衡量进度。最重要的是,这意味着员工能够质疑这些数字,而不是仅仅理解其表面含义。
速度超过准备是一个代价高昂的错误
许多高管因为“害怕错过下一个重大突破或落后于竞争对手”的心理而积极推进人工智能。董事会向领导团队施压,要求他们展示人工智能领域显而易见的进展,因为人们普遍认为,不领先就落后。问题在于,人们更看重速度而非准备充分,但就人工智能而言,胜利并非属于谁先到达,而是属于谁先做对。
在我们去年进行的一项调查中,79%的高管表示他们的数据已准备好应用于人工智能,但只有4%的数据工程师表示认同。这种脱节很能说明问题。最接近数据的人都知道真相:混乱、不完整或管理不善的数据无法支持有效的人工智能。然而,许多领导者却认为人工智能会以某种方式为他们修复不良数据。
不会。我看到的一个AI解决方案试图将其数据集中的每个日期自动分类为出生日期。合同的开始和结束日期由于不符合模型的预期而被取消。该项目不得不彻底回滚。这是一个完美的例子,说明急于使用AI修复混乱的数据只会带来更多问题。
人工智能中数据文盲的风险
当领导者和员工不了解数据时,风险就会迅速成倍增加:
•垃圾进,垃圾出:如果输入模型的数据有缺陷,那么无论人工智能多么复杂,输出的结果也必然存在缺陷。挑战在于,人工智能的幻觉往往看起来如此可信,以至于我们很容易不加质疑地接受它们。我告诉人们:信任,但要验证。
•声誉受损:2019年苹果推出信用卡时,一些知名科技企业家声称,尽管他们的妻子拥有相似甚至更好的财务状况,但他们的信用额度却大幅降低。专家声称,该模型是基于对女性存在偏见的历史数据进行训练的。此举迅速引发强烈反响,声誉受损严重。
•监管与合规失当:Rite Aid推出基于劣质数据训练的人工智能人脸识别系统,用于识别商店扒手,但该系统经常误认女性和有色人种。员工未能充分理解出错的可能性,并根据错误匹配采取行动,导致顾客当众蒙羞。联邦贸易委员会(FTC)禁止Rite Aid使用人脸识别技术五年。
•代价高昂的返工:一旦人工智能系统学习到错误的东西,就像小孩捡到脏话一样——它无法轻易忘记。你不得不放弃数月的努力,重新开始。使用有缺陷的数据训练模型,不仅浪费投资,还会浪费时间和金钱。
每位高管在投资人工智能之前都应该问的问题
在任何组织致力于人工智能之前,领导者都需要停下来思考一些基本问题。首先,数据本身是否干净、完整且得到妥善管理——因为没有这个基础,其他一切都无关紧要。其次是员工。员工是否具备发现错误、质疑结果以及何时发现问题所需的数据素养?如果期望人类始终参与其中,他们是否真的了解何时以及如何进行干预?
同样重要的是,组织是否信任其数据源,并了解这些数据是如何被收集、增强和转换的。合规性也不能事后才考虑。隐私法和行业法规必须从一开始就得到重视。最后,或许是最容易被忽视的问题:我们真正想用人工智能解决什么问题?为什么?
我经常看到公司直接实施,却没有回答任何这些问题。这就像让青少年开车出行,却从未教过他们交通规则一样。后果可能同样严重。
建立数据好奇心文化
弥合数据素养差距需要一种让员工积极参与数据并自信地使用数据的文化。首先,在每个部门或小组中任命数据领军人物——这些人已经展现出强大的数据解读能力,并能够指导同事。如果内部缺乏这样的领军人物,领导者应该从外部引进。
以引起共鸣的方式呈现数据。原始的统计数据并不能激发行动,但当它被组织成一个故事时——比如理解51%的降雨概率究竟意味着什么——它就会变得令人难忘且意义非凡。应该鼓励团队深入研究数字,质疑结果,并超越表面的产出。自然语言处理的进步使这变得更容易,员工可以提出简单的问题,并快速探索决策背后的数据。
领导力奠定基调。当高管们持续使用数据来解释他们的选择时,他们就表明证据与直觉同样重要。这种信号会在整个组织中传递。对数据的好奇心文化不会自下而上地涌现,而必须自上而下地引导。
人工智能建立在数据之上。如果没有数据素养,每一个基于人工智能的决策都如同一场赌博,而赌注就是你的业务和声誉。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...