医疗信息文本中的个人隐私数据识别与计量研究
2024-08-24分类号:TP309;TP391.1;R-05
【部门】郑州大学信息管理学院 郑州市数据科学研究中心
【摘要】基于现行医疗数据行业标准中的数据分级结果模糊,且缺乏对分级要素定量测度的现状。本研究通过挖掘医疗信息文本,从客观认知视角进行医疗数据隐私计量,为验证与改进现行医疗数据分级结果提供参考。医疗数据行业标准、法律法规、学术论文和泄露案例构成医疗敏感数据识别来源,敏感名词(数据项)、敏感动词和敏感程度词等敏感词汇组成的敏感数据单元构成隐私数据识别模型,敏感词汇的敏感性、语义强度和文本力度等指标构成隐私计量模型。研究结果表明,医疗应用数据(医疗检验数据、治疗过程数据、医疗记录数据)和健康状况数据(主诉与既往病史、现病史与生活方式、体格检查数据)的隐私性最强,医疗支付数据(医疗费用数据、支付方式数据、医疗保险数据)的隐私性其次,个人属性数据(个人身份数据、个人统计数据、个人联系方式数据)的隐私性最低。
【关键词】医疗信息文本 个人隐私 隐私数据识别 隐私计量
【基金】国家社会科学基金重大项目“政府数据的隐私风险计量与保护机制创新研究”(21&ZD338)
【所属期刊栏目】情报学报
文献传递