标题
  • 标题
  • 作者
  • 关键词

基于DataCite的科学数据现状特征研究

2019-05-10分类号:G353.1

【作者】罗鹏程  崔海媛  赵静茹  
【部门】北京大学图书馆  
【摘要】[目的/意义]分析世界范围内海量科学数据特征,为科学数据的有效利用和管理提供参考。[研究设计/方法]采集DataCite中14,835,029条科学数据元数据,基于统计分析、社会网络分析、文本分析等方法,从时间、空间、主题、作者、版本、使用等维度对科学数据的现状特征进行分析。[结论/发现]科学数据呈指数增长态势;理工科数据占据主体,人文社科数据异军突起;数据中心两极分化严重;欧美国家占据开放数据优势;我国数据中心建设滞后于学者需求;不同学科作者合作差异显著;数据集版本数量遵从幂律分布;数据开放共享助力提升学者影响力。[创新/价值]从多个视角对现有海量科学数据全貌特征深入挖掘,总结优秀数据中心实践经验,探讨我国科学数据管理发展路径。
【关键词】科学数据  现状特征  科学数据管理  DataCite
【基金】
【所属期刊栏目】图书情报知识
文献传递