科技文摘创新点语义识别与分类方法研究
2019-03-24分类号:G353.1
【部门】西安建筑科技大学信息与控制工程学院
【摘要】公开出版的科技文摘提供了科学研究活动中的问题、方法、结果的可靠语义事实数据,为创新点的传播与跨学科新知识发现奠定了坚实的基础。如何将其准确地的识别和分离出来将是利用人工智能技术实现创新点事实知识问答系统的关键问题。本文提出了一种创新点语义识别与分类方法。该方法先将科技文摘按照句法和语义功能进行6分类算法处理,然后对6分类算法结果进行了类与句子位置的数量分布统计分析、句子类型和句子语义位置结构特征的深入分析,检验了文摘句的语义语序特征,最后在此基础上进行二次分类和合并,实现了对科技文摘创新点的问题、方法、结果的分类实验,分类的准确率达到99%。人工检验验证了语义识别和分类算法的有效性。实验结果表明,这种方法具有算法简便、分类精度高、普适性好的优点。
【关键词】科技文摘 创新点 语义识别 智能分类
【基金】国家自然科学基金面上项目“文摘创新点挖掘的语义识别与关联发现方法研究”(71673213)
【所属期刊栏目】情报学报
文献传递