标题
  • 标题
  • 作者
  • 关键词

基于清华汉语树库的时间表达式抽取模型构建研究

2012-09-20分类号:TP391.1

【作者】沈思  苏新宁  谢靖  王东波  
【部门】南京大学信息管理学院信息技术开发研究所  
【摘要】基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。
【关键词】清华汉语树库  时间表达式  条件随机场  特征模板
【基金】国家“863”计划项目“科技文献服务为主的搜索引擎研制”(项目编号:2011AA01A206); 江苏省2012年度普通高校研究生科研创新计划项目“基于异构社会网络数据的信息集成与检索研究”(项目编号:CXZZ12_0073)研究成果之一
【所属期刊栏目】图书情报工作
文献传递