基于汉英词性组合的短语级平行语料类别知识挖掘研究
2013-06-05分类号:TP391.1
【部门】南京农业大学信息科学技术学院 南京邮电大学经济与管理学院 南京大学信息管理学院
【摘要】基于通过具体实验确定的Bisecting K-means聚类和Lemmatization形态变换算法,在汉英短语级人文社会科学平行语料基础上,尝试进行类别知识挖掘的实验。在中文社会科学引文索引(CSSCI)的类别和标题知识基础上,完成对汉英语料的预处理,并分析名词、动词和形容词的分布状况。在名词、动词和形容词等词性的组合基础上,对比不同词性组合的效果并确定最优的词性组合类别知识挖掘模型。
【关键词】词性组合 Bisecting K-means 汉英平行语料库 类别知识
【基金】国家自然科学基金面上项目“面向知识服务的知识组织模式与应用研究”(项目编号:71273126); 国家社会科学基金重点项目“人文社会科学汉英动态术语数据库的构建研究”(项目编号:11AYY002)研究成果之一
【所属期刊栏目】图书情报工作
文献传递