标题
  • 标题
  • 作者
  • 关键词

融合词嵌入表示特征的实体关系抽取方法研究

2017-09-25分类号:TP391.1

【作者】张琴  郭红梅  张智雄  
【部门】中国科学院文献情报中心  中国科学院大学  中国科学院武汉文献情报中心  
【摘要】【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
【关键词】关系抽取  词嵌入表示  Word2Vec
【基金】ISTIC-EBSCO文献大数据发现服务联合实验室基金项目“基于clique子团聚类的文本主题识别方法研究”的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递