基于频繁语义模式的主题标注——以肿瘤靶向治疗技术为例
2022-04-07分类号:TP391.1;R730.5
【部门】沈阳药科大学
【摘要】[目的/意义]为提高主题建模结果的可读性,解决主题标注过程中主观性强、可解释性弱的问题,引入本体和关联规则构建频繁语义模式。[方法/过程]以肿瘤靶向治疗专利数据为研究对象,首先构建LDA2vec模型挖掘主题;然后考虑主题词的语义与共现,将UMLS本体与FP-growth关联规则相结合,得到频繁语义模式的主题标注;最后将结果与Canopy方法对比评估。[结果/结论]实证结果显示,基于频繁语义模式的标注能够从统计和语义的角度概括主题含义,在主题标注工作中效果更佳。
【关键词】主题标注 频繁语义模式 本体 关联规则
【基金】沈阳药科大学工商管理学院学科建设课题“基于专利数据的制造产业技术情报分析”的研究成果,项目编号:2021-sygsxk-01
【所属期刊栏目】情报理论与实践
文献传递