基于语义图的医学多文档摘要提取模型构建
2017-04-20分类号:TP391.1
【部门】中国医科大学医学信息学院
【摘要】[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。
【关键词】clique 语义图 多文档自动摘要 主题识别
【基金】教育部人文社会科学研究青年基金项目“基于语义述谓网络属性的多文档自动摘要:以生物医学为例”(项目编号:13YJC870030)研究成果之一
【所属期刊栏目】图书情报工作
文献传递