标题
  • 标题
  • 作者
  • 关键词

中文在线医疗社区问答内容知识图谱构建研究

2024-02-20分类号:R-05;TP391.1

【作者】席运江   李曼   邓雨珊   廖晓   邝云英
【部门】华南理工大学工商管理学院  广州城市理工学院管理学院  广东金融学院互联网金融与信息工程学院  广州科技职业技术大学信息工程学院  
【摘要】[目的/意义]为有效抽取在线医疗社区问答文本中包含的医疗知识,综合利用多种深度学习方法,有针对性地设计一套知识图谱构建方法,以应对其口语化、噪声多、规范性差的文本特性给知识抽取带来的巨大挑战。[方法/过程]以寻医问药网糖尿病相关问答文本为数据源,结合对社区用户健康需求的分析,定义适合社区文本的实体和关系类型。使用BERT-wwm进行词嵌入以解决一词多义问题,通过BiLSTM-CRF模型进行实体识别。在关系标注时,设计一种实体遮蔽(entity mask)方式以解决关系重叠问题,而后使用CNN-Attention模型进行关系抽取。最后综合使用词典匹配和实体名称相似度进行实体对齐,并使用Neo4j图数据库存储和可视化得到的糖尿病知识图谱。[结果/结论]实验结果显示上述方法能够大幅提升对在线医疗社区问答文本的知识抽取效果,有效将非结构化的社区医疗问答文本转化为结构化的数据,对于社区知识发现、在线智能健康服务等方面具有推动作用。
【关键词】在线医疗社区  知识图谱  BERT  注意力机制  深度学习
【基金】国家自然科学基金项目“虚拟健康社区信息可信度评价模型及智能推荐研究”(项目编号:72171090);; 广东省基础与应用基础研究基金自然科学基金项目“基于超网络建模的用户创新社区知识价值评价模型及方法研究”(项目编号:2023A1515011551)研究成果之一~~
【所属期刊栏目】图书情报工作
文献传递