数据科学视角下数据溯源研究与实践进展
2019-09-27分类号:G203;TP311.13
【部门】南开大学商学院信息资源管理系
【摘要】真实性和可靠性是当前各领域对数据的根本要求,基于数据溯源实现数据的质量控制与可信管理具有重要的研究价值和实践意义。数据溯源不仅是一个技术问题,同时也是一个管理问题,在数据科学范式下应当受到信息资源管理研究的关注和重视。鉴于此,本文结合相关领域的最新研究进展,系统阐述了数据溯源的概念发展与内涵;梳理了面向数据溯源管理的信息描述模型、通用表达模型、领域应用模型、安全管理模型与区块链溯源管理模型;描述了关系数据库、科学工作流、大数据平台、云计算和区块链等典型应用环境下的数据溯源计算方法。此外,本文还重点分析了数据溯源在数字图书馆、档案信息管理、网络信息资源管理、科学数据共享管理及电子商务信息系统等信息资源管理研究领域中的应用价值与相关实践,并对数据溯源技术方法、标准规范、信息安全、区块链融合以及模型扩展验证等方面的发展进行了展望,以期为数据管理和数据科学领域的研究人员提供参考。参考文献136。
【关键词】数据科学 数据溯源 区块链 数据质量 大数据平台
【基金】国家社会科学基金重大项目“我国网络社会治理研究”(编号:14ZDA063);; 提升政府治理能力大数据应用技术国家工程实验室开放基金重点支持项目“基于NLP和深度学习的大规模政府公文智能处理技术研究”的研究成果之一~~
【所属期刊栏目】中国图书馆学报
文献传递