语法规则和改进关联规则的中文文本非等级关系提取研究
2013-11-20分类号:G350
【部门】武汉大学质量发展战略研究院 武汉大学信息管理学院
【摘要】针对目前适用于中文文本非等级关系提取方法偏少以及关联规则筛选方法忽略了集中出现在部分文本集中的领域词汇关系的问题,通过对中文文本的统计分析,尝试定义一套中文非等级关系提取的规则,同时提出一种加入平均值变量的改进的关联规则。实践证明,基于自定义的语法规则提取方法能够有效地从中文文本中提取出主、谓、宾语,进而提取出非等级关系,改进的关联规则方法能够提取出集中出现在部分文本集中的领域词汇非等级关系。
【关键词】非等级关系提取 语法规则 关联规则 中文文本
【基金】国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(项目编号:11&ZD152);国家社会科学基金重大项目“我国质量安全评价与网络预警方法研究”(项目编号:11&ZD158)研究成果之一
【所属期刊栏目】图书情报工作
文献传递