基于领域本体的政府网站网页专题知识库构建——以“新冠疫苗科普”专题为例
2022-09-14分类号:D63;G250.74
【部门】吉林大学商学与管理学院
【摘要】[目的/意义]从知识管理的视角,以定题采集获取的大量孤立分散的政府网站网页为知识源构建相应的专题知识库,帮助务公众从海量网络存档资源中快速高效地获取所需的关键信息和精准知识。[方法/过程]基于网页定题采集、自然语言处理、领域本体、知识推理等技术,提出包含专题知识源、知识获取、知识表示、知识推理、知识服务等流程的“新冠疫苗科普”专题知识库构建方法。首先,设计网络爬虫获取专题型网页文本数据,利用混合方法从中抽取领域概念知识。其次,通过定义本体类及类间层次结构、对象属性、数据属性以及添加实例来建构领域本体并对其中的知识规则进行形式化处理,从而完成专题知识库构建。最后,利用Protégé软件及其插件、知识推理等方法实现“新冠疫苗科普”专题知识库的语义知识检索、本体可视化查询与知识问答服务。[结果/结论]研究结果表明,所构建的专题知识库具有较好的推理分析功能,可以有效实现新冠疫苗科普知识的精准获取,其应用对提高新冠疫苗科普效果具有重要的现实意义。
【关键词】领域本体 专题知识库 新冠疫苗科普 网络信息资源采集
【基金】国家社会科学基金青年项目“基于云计算的政府网站网页在线归档与开发利用研究”(项目编号:18CTQ040)研究成果之一
【所属期刊栏目】图书情报工作
文献传递