您的企业是否为 AI 做好了数据准备?(如果没有,如何做好准备)

白皮书

首先,要有数据。 其次,才是要有高质量的数据。当涉及到人工智能(AI)时,了解其中的差异,才能改变游戏规则。

2025年1月7日12 分钟
Law digital concept

目前,AI 几乎成为每位企业领导者的首要任务:86% 的金融服务IT和业务高管表示,AI 在未来两年对其业务成功至关重要。

AI 有数十种应用场景,从实时合同分析到发票处理,再到基于历史支付信息预测逾期行为,再到监管报告。然而,尽管 AI 正在成为金融机构的必备工具,但有关  AI 成功的案例并不理想。

Gartner 报告称,49% 的企业在估计和展示 AI 项目的投资回报率(ROI)方面遇到困难。

AI 的挑战通常归结为数据完整性问题。 在 AI 领域,您得到的产品质量仅与您输入模型的数据质量直接相关, Iron Mountain 的首席信息官 Josh Langley 解释道。

然而,脱节点在于:尽管数据完整性是成功实施 AI  的关键,但只有 17% 的企业领导者认为强大的数据策略是确保  AI 投资回报的最有效方式。

为什么这份白皮书是必读的

AI 的投资回报率并不保证,但您的前期工作将为成功奠定基础。本白皮书探讨了数据质量如何影响 AI 计划、数据完整性的障碍、如何克服这些障碍以及解决数据准备的最佳实践。

感知的 AI 数据准备与现实

当被问及时,许多企业认为他们的数据已经为 AI 做好了准备,但一旦深入挖掘,您会发现一些令人担忧的领域,超过一半的企业表示他们在 AI 实施中遇到挑战,包括数据质量、数据分类、非结构化数据和数据孤岛。

例如,尽管 88% 的企业表示他们有信息管理策略,但 44% 的企业承认他们的策略缺乏基本组成部分,如数据归档和保留政策、生命周期管理解决方案,以及导致数据质量问题的策略不足。

如果没有掌握数据完整性,您就没有为 AI 做好准备。数据完整性指的是数据的准确性、一致性和可靠性,包括结构化和非结构化数据以及存在于物理文档中的数据。

“AI 的洞察力依赖于数据完整性,” Langley 指出。

 在 AI 领域,您得到的产品质量仅与您输入模型的数据质量直接相关


Josh LangleyIron Mountain 的首席信息官

解决影响AI成功的重大数据挑战

多种因素影响数据完整性,包括非结构化数据、暗数据和不断增加的数据量。

非结构化数据至少占所有数据的一半——可能更多。Forrester 发现,企业数据中平均 31% 是半结构化的,27% 是非结构化的。非结构化数据通常不会进入 AI 模型,这意味着企业基于不到一半的数据做出重要决策,从而产生业务盲点。

尽管金融机构在管理非结构化数据方面取得了进展,但他们需要做更多工作来识别、情境化并使其可访问。这类投资非常值得,因为投资于挖掘非结构化数据的金融机构比不投资的更有可能实现两位数的收入增长。

暗数据——可访问但不可知的数据——是另一个挑战。业务盲点增加,带来风险的提升,同时由于未知数据可能不符合规定,使得金融机构面临监管挑战。

64% 的金融机构管理至少 1PB 的数据,41% 的金融机构管理超过 500PB 的数据。数据量每天都在持续增加,因此推迟数据完整性问题,只会意味着当 AI 项目失败迫使您解决数据完整性问题时,您将面临更大的挑战

下载本指南以继续阅读。