计算领域的论文数据共享与可重复性问题分析
2024-09-05分类号:G353.1
【部门】中国科学院文献情报中心 中国科学院大学经济与管理学院信息资源管理系 国家新闻出版署学术期刊新型出版与知识服务重点实验室 国际关系学院图书馆 中国科学院过程工程研究所
【摘要】[目的/意义]计算可重复是可靠和可信研究的基石,对计算领域的论文数据共享政策、数据可用性和可重复性方法进行调查分析,为促进数据共享及解决计算可重复问题提供参考。[方法/过程]采用网站调研法和内容分析法,分析期刊、会议的数据共享政策;采用网络爬虫法,获取期刊论文数据的可用性声明,对数据可用性进行分析;并梳理和总结计算可重复的方法。[结果/结论 ]计算领域大多数期刊、超半数会议有数据共享政策,但数据共享态度的强度还有待提升。越是高水平的期刊或会议,越可能有数据共享政策。相较于期刊关注数据共享问题,会议更关注计算可重复问题。数据可用性声明促进了数据共享,但数据共享实践与数据共享政策要求还存在差距。计算可重复方法包括鼓励或要求数据共享、专家审查、设置奖励、设置论文提交清单、征集可重复性论文等。
【关键词】期刊论文 会议论文 数据共享 计算可重复
【基金】中国科学院文献情报中心青年骨干人才项目“面向科技文献内容挖掘的通用实体语料库建设研究”(项目编号:E3550201)研究成果之一~~
【所属期刊栏目】图书情报工作
文献传递