标题
  • 标题
  • 作者
  • 关键词

专利技术主题分析:基于SAO结构的LDA主题模型方法

2017-05-22分类号:G254

【作者】杨超  朱东华  汪雪锋  朱福进  衡晓帆  
【部门】北京理工大学管理与经济学院  悉尼科技大学量子计算与智能系统研究中心  
【摘要】[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的"问题"与相应"解决方案"等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别"问题和解决方案"(P&S)模式,基于"bagofP&S"假设,构建基于"主语-行为-宾语"(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势
【关键词】SAO结构  技术主题分析  LDA模型  P&S模式  石墨烯
【基金】国家自然科学基金面上项目“基于语义TRIZ的新兴技术创新路径预测研究”(项目编号:71373019);; 国家高技术研究发展计划“面向政府管理的大数据智能服务系统及应用示范”(项目编号:2014AA015105)研究成果之一
【所属期刊栏目】图书情报工作
文献传递