标题
  • 标题
  • 作者
  • 关键词

一种面向中文网络百科非结构化信息的知识获取方法

2016-07-05分类号:TP391.1

【作者】王汀  冀付军  徐天晟  
【部门】首都经济贸易大学信息学院  
【摘要】[目的 /意义]在进行大规模知识库构建时,基于手工方式的构建模式效率较低并且可行性较差,因此,从网络百科中自动地获取海量知识已经被越来越多的学者所关注。目前的研究主要关注于从英文网络百科数据源进行海量知识的抽取,而面向中文百科数据源进行的知识抽取研究工作尚处于起步阶段。[方法 /过程]为解决中文大规模知识库的构建问题,提出一种新的基于中文网络百科架构的大规模知识库的自动化构建方法:在第一阶段,对知识三元组中的主语和宾语之间的语义关系进行自扩展学习;在第二阶段,基于条件随机场和支持向量机协同分类器,对标注出的属性和属性值实体之间的语义关系进行预测。[结果 /结论]实验评测结果表明,该方法较前人工...
【关键词】中文知识库  网络开放百科  新词发现  条件随机场  支持向量机
【基金】首都经济贸易大学科研项目“中文链接数据构建关键技术研究”(项目编号:00791654490223); 北京市社会科学基金项目“微媒体对北京大学生行为模式变化影响的研究”(项目编号:15ZHB011)研究成果之一
【所属期刊栏目】图书情报工作
文献传递