标题
  • 标题
  • 作者
  • 关键词

基于N-gram复合分词的领域概念自动获取方法研究

2014-02-28分类号:TP391.1

【作者】颜端武  李兰彬  曲美娟  
【部门】南京理工大学经济管理学院信息管理系  
【摘要】文章提出一种基于N-gram复合分词的领域概念自动获取方法,在中文分词的基础上进行N元复合切分,通过建立一系列过滤规则,提取候选领域概念;然后以改进的TF-IDF作为衡量领域相关性的统计特征值,计算候选概念的领域相关性;最后进行人工辅助判断与筛选。以航空发动机领域语料为样本进行了实践探索,实验结果表明该方法能有效抽取专业领域概念,具有较强的实用性。
【关键词】概念  概念抽取  复合分词  领域相关性
【基金】国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(项目编号:11&ZD152); 总装技术基础研究课题“领域知识获取方法及应用研究”(项目编号:G20121QB05)的成果
【所属期刊栏目】情报理论与实践
文献传递