基于清华汉语树库的时间表达式抽取模型构建研究
2012-09-20分类号:TP391.1
【部门】南京大学信息管理学院信息技术开发研究所
【摘要】基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。
【关键词】清华汉语树库 时间表达式 条件随机场 特征模板
【基金】国家“863”计划项目“科技文献服务为主的搜索引擎研制”(项目编号:2011AA01A206); 江苏省2012年度普通高校研究生科研创新计划项目“基于异构社会网络数据的信息集成与检索研究”(项目编号:CXZZ12_0073)研究成果之一
【所属期刊栏目】图书情报工作
文献传递