标题
  • 标题
  • 作者
  • 关键词

基于条件随机场的自动标引模型研究

2008-09-15分类号:G354

【作者】章成志  苏新宁  
【部门】南京理工大学信息管理系  南京大学信息管理系  
【摘要】条件随机场(Conditional Random Fields,CRF)模型是一种概率图模型。为了有效利用标引对象的特征,并考虑到抽词标引可以转换为序列标注问题,本文提出基于条件随机场的自动抽词标引模型。实验结果表明,该模型在改善抽词标引的性能方面,要优于支持向量机、多元线性回归模型等其他机器学习方法,是到目前为止解决序列标注问题的最好方法。但是,该模型本身还不能解决由于样本中存在同义词和相近词带来的问题,需要进一步对训练集和标引过程中存在的词汇语义情况进行考虑,提高标引的质量。
【关键词】抽词标引  条件随机场  自动标引
【基金】
【所属期刊栏目】中国图书馆学报
文献传递