中文专利术语层次关系解析研究
2017-04-24分类号:G254;TP391.1
【部门】南京大学信息管理学院 南京大学江苏省数据工程与知识服务重点实验室
【摘要】对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体。着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法。本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础。
【关键词】中文专利术语 位置加权 PCA降维 类目标签抽取 术语层次关系 本体学习
【基金】江苏省自然科学基金项目“面向专利预警的中文本体学习研究”(BK20130587);; 江苏省“333”工程项目“面向知识服务的中文本体学习研究”(BRA2015401);; 国家社科重大招标项目“面向突发事件应急决策的快速响应情报体系研究”(13&ZD174)
【所属期刊栏目】情报学报
文献传递