标题
  • 标题
  • 作者
  • 关键词

基于柯南·道尔作品的文本聚类应用与探究

2019-09-22分类号:I561.074

【作者】朱枫怡  岳天泽  王可  刘笑  田茂再  
【部门】新疆财经大学统计与信息学院  中国人民大学应用统计科学研究中心  中国人民大学统计学院  兰州财经大学统计学院  
【摘要】风靡世界的侦探小说《福尔摩斯探案集》的写作几乎贯穿作者柯南·道尔爵士的一生,但其写作风格并非一成不变。本文从《福尔摩斯探案集》本身出发,以57篇侦探故事为研究对象,构建词频、词长、单词数、标点出现频率等语言要素指标,利用文本聚类技术对柯南·道尔写作风格进行研究,从统计语言学的角度揭示了不同时期柯南·道尔写作风格的变化。研究结果表明,根据写作风格的不同,柯南·道尔的创作生涯大致可分为两个阶段,且风格的转变与其私人生活的变故、宗教信仰的转变等密切相关。社会大环境的变迁以及作家个人坎坷的人生路程,都是其写作风格发生变化的重要原因。在分析文学作品时,应该紧密联系作者当时所处的社会环境和个人经历,才能对作者有更深刻的理解。通过柯南·道尔作品的文本聚类后,我们对柯南·道尔的生平进行梳理,不难发现1893、1901、1907以及1926年这几个特殊时点可能是与道尔的人生轨迹由第一阶段转变到第二阶段有紧密联系的。
【关键词】文本聚类  K-means算法  层次聚类算法  柯南·道尔
【基金】国家自然科学基金(11861042);; 中国人民大学科学研究基金项目成果(18XNL012);; 全国统计科研计划项目重大项目(2016LD03);; 新疆维吾尔自治区普通高等学校人文社会科学基地基金资助
【所属期刊栏目】数理统计与管理
文献传递