融合词嵌入表示特征的实体关系抽取方法研究
2017-09-25分类号:TP391.1
【部门】中国科学院文献情报中心 中国科学院大学 中国科学院武汉文献情报中心
【摘要】【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
【关键词】关系抽取 词嵌入表示 Word2Vec
【基金】ISTIC-EBSCO文献大数据发现服务联合实验室基金项目“基于clique子团聚类的文本主题识别方法研究”的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递