标题
  • 标题
  • 作者
  • 关键词

机器学习在社会调查职业编码中的应用

2019-09-17分类号:F249.2;TP181

【作者】吴琼  戴利红  张婧申  
【部门】北京大学中国社会科学调查中心  
【摘要】问卷调查一般通过开放文本题采集职业信息。这种题型虽能提供丰富信息,但数据管理复杂,需要将原始数据进行编码。传统的人工编码法耗时耗力。本文首次尝试将机器学习中两个常见分类器"朴素贝叶斯"和"支持向量机"运用在中文职业文本编码上。结果显示,它们在职业大类编码上的表现令人满意,但在职业细类上性能不足,而且在不同职业类别间性能差异很大,其中"农林牧渔水利业生产人员"和"不便分类的其他人员"的分类效果较好。
【关键词】职业编码  问卷调查  机器学习  朴素贝叶斯  支持向量机
【基金】
【所属期刊栏目】调研世界
文献传递