标题
  • 标题
  • 作者
  • 关键词

融合多元特征的中文网页关键词提取方法研究

2020-01-15分类号:TP391.1

【作者】张孝飞  
【部门】西藏民族大学图书馆  
【摘要】文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
【关键词】提取  多元特征  同义词  组合词
【基金】2019年度教育部人文社会科学研究规划基金西藏项目“智慧校园环境下西藏高校图书馆用户画像及其应用研究”(项目编号:19XZJA870001);; 2017年西藏自治区社科专项资金重点项目“西藏网络舆情分析研判与社会治理问题研究”(项目编号:17AXW001);; 2017年度西藏自治区高等学校人文社会科学研究项目“基于藏文网络媒体舆情分析的热点话题发现方法研究”(项目编号:SK2017-13)的阶段性成果之一
【所属期刊栏目】图书馆
文献传递