标题
  • 标题
  • 作者
  • 关键词

应用自然语言处理估计回顾性真实世界数据缺失指标:基于卒中量表评分的证据

2022-04-05分类号:R743.3

【作者】付露阳  肖菲菲  刘明月  郑霖  赵昕锐  彭茨克  曹海俊  刘国恩  
【部门】天津开心生活科技有限公司  北京大学中国卫生经济研究中心北京大学国家发展研究院  
【摘要】目的:美国国立卫生研究院卒中量表(NIHSS)是评估卒中严重程度的常用量表。评估自然语言处理辅助NIHSS评分算法与电子病历的评分一致性,为未来开展基于真实世界回顾性数据的卒中患者研究提供估计的技术方法。方法:收集国内5家医院中急性缺血性脑卒中的患者病历和NIHSS评分记录。通过阅读电子病历与专家访谈,制定人工评分规则,并建立NIHSS评分特征词列表,缺失的检查评分按照正常进行评分。利用自然语言处理算法,对电子病历记录进行全扫描,自动识别并提取所有相关特征词到结构化电子病历报告表中。由两位研究者对电子病历报告表审查后,基于人工评分规则进行回顾性评分。采用组内相关系数、Bland-Altman图示法、Kendall协同系数及线性回归拟合评估自然语言处理算法辅助的和电子病历中记录的评分的一致性。结果:共纳入235例患者的电子病历记录中NIHSS评分,同时采用自然语言处理算法辅助系统进行回顾性评分。自然语言处理辅助评分与电子病历中实际评分具有高度一致性(R~2=0.78,P<0.001)。结论:通过自然语言处理辅助的回顾性评分算法,能够可靠地估计缺血性脑卒中患者的初始评分,为基于回顾性真实世界数据获取脑卒中患者治疗效果数据提供了的创新方法。
【关键词】自然语言处理  美国国立卫生研究院卒中量表评分  真实世界数据
【基金】
【所属期刊栏目】中国卫生经济
文献传递