学术文献的文体特征及其检索意义——计算机科学文献与相关新闻报道文体的比较研究
2013-12-12分类号:G354
【部门】中山大学资讯管理学院 中山大学软件学院
【摘要】计算机科学学术文献具有独特的文体特征,且部分特征能够用于计算机科学网络中文学术文献的自动识别与检索,提高计算机科学学术文献的相对检准率。本文通过建立计算机学术文献语料库与IT新闻语料库,对计算机科学学术文献和IT新闻在特有表述、平均句长、中西文比例三方面的文体特征进行提取与加权,应用于基于百度的网络中文学术检索系统(NSIRS)中。结果显示,本研究提取并设定的文体特征能有效提高NSIRS对计算机科学学术文献的检索效率,从而证明发掘并应用特定学科文献独特的文体特征的意义。图2。表4。参考文献14。
【关键词】文体特征 计算机科学 学术文献 IT 新闻 NSIRS 系统
【基金】国家社会科学基金项目“网络中文学术文献的自动识别与检索研究——基于学术文献文体;链接及图文相关度的研究与系统开发”(编号:10BTQ049)的研究成果之一
【所属期刊栏目】中国图书馆学报
文献传递