文本作者身份识别研究综述
2015-08-20分类号:TP391.1;G254
【部门】大连外国语大学计算机教研部 大连外国语大学英语学院 中国大连高级经理学院
【摘要】[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。
【关键词】身份识别 文体特征 作者身份 建模性能 评价指标
【基金】国家社会科学基金一般项目“典籍英译国外读者网上评论观点挖掘研究”(项目编号:15BYY028); 教育部人文社会科学研究规划青年基金项目“基于多层面特征分析的在线信息作者身份识别研究”(项目编号:11YJCZH131)研究成果之一
【所属期刊栏目】图书情报工作
文献传递