数据质量像天气,每个人都谈论他,但很少有人为它做点什么。一般来说,造成这种情况的原因包括: 没有过失测量综合征 劣质数据的存在意味着系统中存在着错误,而没有人愿意承认自己的工作中可能存在错误,如果企业内部存在着严格的绩效考核制度的情况下更是如此。在业务流程正常运转的情况下,鲜有人愿意在自己的下属面前承认工作中存在错误。 皇帝的新装 人们一般认为高级管理岗位的人是正确的,试图查找并纠正涉及到这些岗位的数据质量问题,会冒着一定的职业风险。 推卸责任 发现问题时,人们的自然反应是推给他人,很少有人愿意承认劣质数据的产生是由于自己的失误,数据质量的皮球在各个岗位之间踢来踢去,很少能落到实处。 误解 数据清洗、数据去重或者地址标准化等都经常被等同于数据质量管理,虽然这些都是数据质量管理的一部分,但都不能被认为是持续的数据质量改进的过程。 脏活 查找并清洗数据被认为是脏活累活,严重缺乏成感,参与数据质量改进工作被认为是浪费青春。 缺乏认可 基于上面的认识,数据的管理者和使用者认为数据本来应该是正确的,因而数据质量的改进不被认可为重要的工作任务。 因为以上的原因,公司高层必须达成一个综合的数据质量解决方案能给公司带来巨大价值的共识。在此基础上,通过有计划的步骤来进行企业内部的数据质量提升。第一步开展知识管理和数据质量的相关培训,在公司范围内达成广泛共识;然后建立企业内部的职责和数据质量策略,并建立劣质数据的经济影响和高质量数据价值的评估体系。