《附表传统数据质量与大数据质量研究比较》
纵观现有研究,虽积累了大量优秀成果,但随着技术的发展以及经济社会对数据资源管理和利用需求的不断变化,现有研究仍存在以下不足:(1)数据质量内涵大多还局限于传统意义上的概念界定,大数据环境下的数据质量内涵及评价标准有待进一步探讨。(2)数据质量评价指标大多以定性的方式定义,具体的度量方法和工具有待完善,加强实践可操作性。(3)非结构化、大规模数据集的质量测量与评估面临挑战。(4)对于大数据集中非结构化数据质量的全面管理和长效控制引发关注,在方法和策略方面还有待探讨。在今后的研究中,建议着重考虑以下几个方面:(1)大数据环境下,结合数据科学的前沿理论展开新视角下的数据质量的内涵及评价标准研究,如数据资产视角下数据质量的内涵及其评价标准等。(2)注重数据质量评价的理论研究和实践应用相结合,进一步明确和细化质量指标的测度标准,提升数据质量研究成果的实践价值。(3)加强数据质量自动化评估、自动化清洗研究。(4)如何从语义层面认识数据质量问题等。(5)基于宏观视角的国家层面、战略层面的大数据质量管理研究。
图表编号 | XD0091776000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.05 |
作者 | 孙俐丽、袁勤俭 |
绘制单位 | 南京工业大学、南京大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |