产品命名实体特征选择与识别研究
2012-05-10分类号:G203
【部门】武汉大学信息资源研究中心
【摘要】随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
【关键词】产品命名实体识别 CRF模型 交叉验证 最大熵模型
【基金】武汉大学“70后”学者学术发展计划项目“跨语言环境下的细粒度信息检索与可视化研究”; 国家自科基金项目“基于语言模型的通用实体检索建模及框架实现研究”(71173164/G031401)的成果之一
【所属期刊栏目】图书情报知识
文献传递