标题
  • 标题
  • 作者
  • 关键词

面向信息检索的汉语同义词自动识别和挖掘(英文)

2006-07-30分类号:G354

【作者】陆勇  侯汉清  
【部门】南京农业大学信息管理系  南京农业大学信息管理系 江苏210095  南京信息工程大学校办江苏210044  江苏210095
【摘要】为了提高同义词自动挖掘的效率,本文提出了从词典释义中自动识别和挖掘同义词的方法,使用超链接分析算法和模式匹配算法,从不同的角度提取同义词:第一部分是把词汇之间注释与被注释的关系看成是一种链接关系,对给定的词汇进行分析,把与给定词汇具有链接关系的所有相关词汇构造一个词汇图,图中的每一个节点代表相关词,每条弧代表了词汇之间注释与被注释的关系。利用超链接分析方法并结合PageRank算法,计算词汇的PageRank值,把PageRank值看成是体现词汇之间语义相似性的衡量指标,最后为每一个词汇生成候选同义词集,并通过一定的筛选原则和方法,推荐出最佳的同义词。第二部分是利用词汇定义模式,对词汇的释义方...
【关键词】汉语同义词  自动识别  自动挖掘  模式匹配  PageRank算法
【基金】
【所属期刊栏目】情报理论与实践
文献传递