基于引文的科技文献主题抽取研究
2017-06-08分类号:G353.1
【部门】华中师范大学信息管理学院
【摘要】[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词
【关键词】科技文献 引文 主题抽取 关键词
【基金】国家社会科学基金项目“基于语义理解的多模态信息融合与集成服务研究”(项目编号:11CTQ017);; 中央高校基本科研业务费专项资金项目“社交化问答平台信息质量感知模型及推荐算法研究”(项目编号:CCNU16A02035)的成果
【所属期刊栏目】情报理论与实践
文献传递