中国替代计量数据集构建方法研究
2024-03-29分类号:G353.1;TP18;TP391.1
【部门】中山大学信息管理学院
【摘要】[目的/意义]探索我国替代计量数据集构建方法,为实现面向国内社会需求的替代计量分析提供数据基础。[方法/过程]从作为提及主体的数据源角度提出基于实体识别的数据集构建方法,从作为提及客体的学术成果角度提出基于术语检索的数据集构建方法,并针对所提出的方法进行实证检验与对比分析。[结果/结论]实证结果表明,所提出的基于实体识别和基于术语检索的中国替代计量数据集构建方法均具有可行性;在知乎替代计量数据集构建中,实际采集7.2万条帖子,基于正则表达式和深度学习方法识别所提及的学术论文,F值在80%以上;在微信替代计量数据集构建中,基于术语检索获取了6.55万篇CSSCI期刊论文的17余万条微信提及,微信提及相对覆盖率近70%;对两种构建方法的多角度比较分析可知,这两种构建中国替代计量数据集的基本方法相互补充,适用于不同的替代分析数据需求。
【关键词】替代计量学 替代计量数据 学术成果识别 实体识别 术语检索
【基金】国家自然科学基金面上项目“中国替代计量的数据识别机制与关键分析方法研究”(项目编号:72274227);; 教育部人文社会科学研究规划基金项目“融合替代计量分析的高校科研社会影响力评价研究”(项目编号:22YJA870016)的成果
【所属期刊栏目】情报理论与实践
文献传递