融合知识图谱和大语言模型的虚假健康信息识别方法研究
2024-09-29分类号:R-05;TP391.1
【部门】武汉纺织大学管理学院
【摘要】[目的/意义]构建一种基于大语言模型和知识图谱的健康信息识别模型,旨在提升健康信息识别的准确性和信度。[方法/过程]首先,采用在权威平台上发布的公开健康信息数据集来构建知识图谱,作为领域知识;然后,设计5组实验,包括决策树、支持向量机、逻辑回归模型、GPT和KG-LLM;最后,采用552条来自权威辟谣平台的已标注辟谣信息作为验证样本进行试验,并对5组实验的结果进行比较分析。[结果/结论]所构建的KG-LLM虚假健康信息识别模型在准确性方面表现卓越,其准确率达到98.35%,这一结果相较于决策树、支持向量机、逻辑回归模型分别提升了14.78%、3.24%和12.33%。与GPT模型相比,其准确率也提升了4.80%。此外,在其他的评估指标上,KG-LLM模型相较于GPT模型也显示出了优势。这一结果充分证明了知识图谱作为领域知识,有助于消除LLM中存在的幻觉。[创新/局限]主要创新之处在于将大语言模型与知识图谱相结合,用于提高健康信息识别的准确性。研究存在的局限性主要体现在数据量不足上。尽管通过知识图谱对大语言模型进行了优化,增强了信息检索的准确性,但模型的性能仍然在一定程度上依赖于大语言模型。
【关键词】虚假健康信息 ChatGPT KG-LLM 机器学习 知识图谱
【基金】国家自然科学基金项目“医疗众筹中的信息机制:众筹信息的内容、表达及扩散研究”(项目编号:71974152);国家自然科学基金项目“基于专利新颖性分析的纺织产业突破性技术识别研究”(项目编号:221078029);; 2020年度湖北省社科基金前期资助项目(项目编号:20ZD053)的成果
【所属期刊栏目】情报理论与实践
文献传递