标题
  • 标题
  • 作者
  • 关键词

基于大数据岗位需求的文本聚类研究

2017-12-25分类号:TP391.1

【作者】刘睿伦  叶文豪  高瑞卿  唐梦嘉  王东波  
【部门】南京农业大学信息科学技术学院  
【摘要】【目的】对大数据工作岗位需求文本进行挖掘,帮助大数据企业更精准地定位所需人才。【方法】抽取招聘网站上2017年第一季度关于"大数据"的工作岗位信息,使用TF-IDF并结合Word2Vec和K-means实现基于语义的聚类,并利用轮廓系数方法获取最佳聚类效果。【结果】利用抽取获得的实体对文本向量进行表达能够达到良好的聚类效果,最终将岗位需求文本分为工作能力要求、学历要求以及工作经验要求三类。【局限】各网站信息发布的格式不统一,数据清洗不够全面,对聚类效果产生影响;挖掘获取的招聘信息数据量不充足,使Word2
【关键词】大数据岗位  Word2Vec  K-means  轮廓系数
【基金】江苏省社会科学基金项目“大数据环境下汉英短语级平行语料标注及知识挖掘研究”(项目编号:13XWC017)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递