标题
  • 标题
  • 作者
  • 关键词

科技情报智慧数据治理技术体系研究与应用实践

2023-09-22分类号:TP311.13;G350;G250.7

【作者】常志军   张智雄   钱力   许丽媛   丁洁兰
【部门】中国科学院文献情报中心数据资源部  中国科学院大学经济与管理学院图书情报与档案管理系  国家新闻出版署学术期刊新型出版与知识服务重点实验室  
【摘要】[目的/意义]科技情报的智能化发展给数据治理带来了新的挑战,研究数据治理中数据建设内容不成体系、数据建设和业务缺少协同纽带、数据质量差等关键问题,推进数智驱动情报分析新模式的形成。[方法/过程]基于智慧数据内容层级结构,设计了基础治理与协同治理相辅相成的整体架构,分别面向通用化数据处理和定制化数据处理。结合协同主体和协同机制,探索交互式、低代码协同治理平台的建设路径,并以质量指标为牵引制定数据治理全链条的质量控制模块,最终形成科技情报业务牵引的智慧数据治理技术体系。[结果/结论]该体系指导了中国科学院文献情报中心智慧数据治理工作,设计研发了6套治理工具集,实现了对142项数据资产管理以及约4.6亿篇文献数据的内容治理,并支撑了多个知识服务系统的运行。[局限]该治理体系未研究对图片、音频、视频等多模态数据的治理方案。
【关键词】科技情报智慧数据  数据治理  协同治理  大数据技术  数据质量  人工智能
【基金】国家社会科学基金项目“面向循证医学的领域文献实体关系识别方法研究”(项目编号:21BTQ106);; 中国科学院文献情报能力建设专项“建设科技文献智慧数据中心”(项目编号:2022000391);中国科学院文献情报能力建设专项“面向重大科技问题场景的智慧数据建设”(项目编号:E2290215))的成果之一
【所属期刊栏目】情报理论与实践
文献传递