基于改进相似度算法的文本等级关系提取方法研究
2014-05-09分类号:TP391.3
【部门】武汉大学质量发展战略研究院 武汉大学信息管理学院
【摘要】针对目前文本等级关系提取结果与本体层次模型的标准不符的现状,利用《测绘学叙词表》构建初始本体层次模型,利用绝对词频和GF/GL值对相邻词汇的领域相关度筛选,利用余弦算法计算相似度,利用平均值方法计算等级关系筛选阈值。结果表明改进的相似度算法能够提高文本等级关系提取的有效性,提取的等级关系能够应用到本体层次模型的构建中。
【关键词】本体 等级关系提取 叙词表 相似度
【基金】国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(项目编号:11&ZD152),国家社会科学基金重大项目“我国质量安全评价与网络预警方法研究”(项目编号:11&ZD158); 科技部质检公益性行业科研专项“质量监管技术及安全风险信息系统支撑研究”(项目编号:201210117); 中央高校基本科研业务费专项资金“基于资源本体的语义信息检索研究”(项目编号:2013104010201)的成果
【所属期刊栏目】情报理论与实践
文献传递