标题
  • 标题
  • 作者
  • 关键词

中文问答社区答案质量的评价研究:以知乎为例

2017-12-01分类号:G201

【作者】王伟  冀宇强  王洪伟  郑丽娟  
【部门】华侨大学工商管理学院  同济大学经济与管理学院  聊城大学商学院  
【摘要】[目的/意义]在线问答社区成为互联网用户获取高质量知识的重要途径,探索中文问答社区答案质量对知识传播具有重要意义。[方法/过程]以规模最大的中文问答社区之一"知乎"为研究对象,采用数据挖掘和机器学习方法,选取逻辑回归、支持向量机和随机森林三种分类模型,进行三层递进式训练和检验。从结构化特征、文本特征以及用户社交属性三个维度构建答案质量的特征体系。[结果/结论]实验结果显示,随着特征体系的不断丰富,三种分类模型的性能逐步提升;而随机森林作为一种组合分类模型,在全量特征的情况下,取得出色的分类性能。对特征组合
【关键词】答案质量  质量评价  机器学习  文本挖掘  知乎
【基金】国家自然科学基金项目“文本语言特征对众筹项目融资效果的影响:基于文本挖掘的方法”(项目编号:71601082)和国家自然科学基金项目“基于在线评论文本挖掘的线上线下服务补救:以网络零售为例”(项目编号:71701085)研究成果之一
【所属期刊栏目】图书情报工作
文献传递