数字排毒:清理 ROT 的实用方法

博客和文章

数据量的激增已成为当今信息管理者面临的首要核心问题。冗余、过时且琐碎(ROT)的数据会增加您的泄露风险,并降低您的数字资产价值。在我们近期举办的2024年教育系列研讨会中,专家们就下一次数据清理项目分享了实用建议。

Sue Trombley
Sue Trombley
2025年7月17日6  分钟
Engineer examining AI technology with reflection on eyeglasses
在 2024 年 ARMA International InfoCon 大会上,数据管理和数字排毒话题引发了热烈的讨论氛围。在这场为期三天的活动中,我有幸与两位信息管理领域的领导者坐下来,就我们 2024 年教育系列研讨会的这一重要议题展开探讨。

在“数字排毒:清理 ROT 的实用方法”这一议题的讨论中,与我共同参与的嘉宾有中国银行副总裁兼首席数据官 Chantel Johnson,以及 Iron Mountain 专业服务部客户负责人 Steve Matthews。我们探讨了从现代数据管理所涉及的风险与挑战,到有效清理和管理冗余、过时、琐碎(ROT)数据的经验证的策略等。 我们的专家就如何应对这一高风险任务分享了宝贵见解,其中包括:

  • 了解何为 ROT 数据及其风险
  • 清理 ROT 数据的流程,包括所需的工具和资源
  • 持续进行数据管理与监督的重要性

相关内容:观看完整的网络研讨会什么是 ROT 数据,为何它具有风险?

各企业正努力应对数据量的指数级增长,与纸质档案时代相比,如今它们面临着更严峻的数据量挑战、更高的存储成本以及更大的泄露风险。这些数据中,无论是结构化数据还是非结构化数据,有相当大一部分往往都是冗余、过时且琐碎的。ROT 数据因其缺乏商业价值而可被识别,它涵盖了广泛的数字冗余内容,从个人度假照片到已达到留存要求的数据应有尽有。

ROT 可能占企业数据总量的 50% 甚至更多。
Steve Matthews专业服务部客户负责人, Iron Mountain

ROT 是一个重大问题:许多企业都存有大量不必要的数据,这些数据可能对其运营构成风险。ROT 数据阻碍了高效的信息管理,导致成本增加、安全漏洞增多以及决策能力受损。

The risks of ROT

非结构化数据

毫不意外的是,在 ROT 问题中,非结构化数据是主要元凶。非结构化数据——即不像数据库中具有预定义格式的数据——因其模糊性而给企业带来问题 ”信息管理者往往“根本不清楚自己不了解哪些信息”。

非结构化数据可以包括文本文件、图像、音频文件、视频文件、社交媒体、电子邮件等各类数字文件。其中许多文件往往是副本,有时甚至是副本的副本。我们的嘉宾估计,企业的数据中,非结构化数据占比竟高达 50% 至 60%。

仅仅保留一些你根本一无所知的数据,就会带来巨大的风险和隐患。
Chantel Johnson中国银行副总裁兼首席数据官

相关内容:辞旧迎新:新年伊始清理数据的五大理由

为何你的企业需要进行数字排毒

清理 ROT 数据,能够减轻在诉讼、审计、并购及其他商业活动中管理海量数据集的工作负担。您拥有的数据越多,在这些情况下需要识别并提供的资料也就越多。通过定期管理数据并清除 ROT,您还能够:

  • 降低安全风险,更好地保护您的敏感信息
  • 优化数字存储空间,减少对环境的影响
  • 提升整个企业的生产效率
因为能在恰当的时间找到所需信息,所以用户效率得以提升。
Steve Matthews专业服务部客户负责人, Iron Mountain

数字排毒的另一大显著优势在于,它能让您的企业为 AI 等未来趋势做好准备。 在完成 ROT 清理项目后,剩余的数据更精准且对先进技术具有实用价值,因此您可以自信地为模型提供输入数据干净的数据能够产生有价值的商业和客户洞察。

The benefits of ROT cleanup

相关阅读:您的数据战略是否已为生成式 AI 做好准备?

数据清理的正确方法

虽然技术能够助力管理 ROT 数据,但配备专业人员并建立有效流程以切实解决问题同样至关重要。这通常需要开展自上而下支持的变革管理工作。普通员工往往会养成不断复制文件副本,并将数据存储在各种类型文件夹中的习惯,却从未考虑过这样做的后果。就连档案管理人员也可能不愿改变自己的数据存储习惯。

清理数以百万计的数字文件

在讨论过程中,小组讨论嘉宾、中国银行副总裁兼首席数据官 Chantel Johnson 分享了她在开展 ROT 数据清理工作时所采用的一些关键策略。

自上而下的支持

Chantel 为数据清理计划争取到了高层的支持,因为她深知尽可能多地清除 ROT 数据是何等关键。

针对性数据评估:

该企业将重点放在非结构化数据上,因为这类数据由于缺乏有序整理且存在敏感信息泄露风险,被认为风险最高。在清理过程中,法律留置和个人可识别信息(PII)是重要的考量因素。这两个因素直接影响哪些 ROT 数据可以被处置。

技术实施:

该企业利用技术和内容分类工具对其非结构化数据进行可视化处理,识别 ROT 文件,并评估合规状况。

利益相关者与 SME 的支持与认同

档案管理员、部门负责人和法律专家均参与其中,以提供专业领域知识,并确保数据分类和处置的准确性。

渐进式清理

该组织在清理过程中采用了分阶段的方法,先从低风险数据入手,然后逐步推进到更为复杂的数据集

持续维护:

该组织制定了相关流程和政策,以防止新的 ROT 数据积聚,并确保数据的持续整洁性。

ROT 清理计划并非一蹴而就之事,而是一个持续进行的过程。
Steve Matthews专业服务部客户负责人, Iron Mountain

ROT 数据清理并非一次性任务,而是一个需要定期审查和更新的持续过程。专家建议审查频率应高于每年一次,并鼓励档案管理人员考虑采用持续策略。在 ROT 清理过程中,人工参与至关重要。若没有合适的人员参与,决策过程可能会陷入停滞。技术可以提供建议,但无法做出所有关键的商业和法律决策。

Creating an effective records coordinator working group for ROT cleanup

对于当今的信息管理人员而言,减少 ROT 数据并制定持续清理策略至关重要。随着新数据不断产生,在  AI  迅猛发展的背景下,数据过载问题将持续加剧。

你不能停滞不前。

观看完整网络研讨会

数字排毒!清理冗余数据的实用方法|铁山档案管理中国访问“数字排毒!清理冗余数据的实用方法|铁山档案管理中国”,观看《数字排毒:清理 ROT 的实用法》的定制视频,并注册参加即将举行的网络研讨会。