基于深度学习的数据科学招聘实体自动抽取及分析研究
2018-07-05分类号:G203
【部门】南京农业大学信息科学技术学院 南京大学信息管理学院 南京大学计算机科学与技术系
【摘要】[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
【关键词】数据科学 条件随机场 深度学习 Bi-LSTM-CRF
【基金】国家社会科学基金重大项目“情报学学科建设与情报工作未来发展路径研究”(项目编号:17ZDA291);; 江苏省普通高校学术学位研究生科研创新计划项目“引用内容分析--引文语义信息的自动挖掘(KYZZ16_0033)”研究成果之一
【所属期刊栏目】图书情报工作
文献传递