基于LDA-WO混合模型的微博话题有序特征抽取研究
2017-07-04分类号:TP391.1
【部门】南京航空航天大学经济与管理学院
【摘要】【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
【关键词】WO-LDA模型 微博话题 有序特征抽取 词序
【基金】国家自然科学基金面上项目(71373123);; 江苏高校哲学社会科学研究重点项目(2015ZDIXM007);; 江苏省普通高校研究生科研创新计划项目(KYZZ15_0104);; 中央高校基本科研业务费专项资金资助
【所属期刊栏目】情报科学
文献传递