基于EM算法的汉语自动分词方法
2002-06-24分类号:G254.1
【部门】解放军理工大学通信工程学院 解放军理工大学理学院 南京210016 南京210016
【摘要】汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
【关键词】分词 汉语 EM算法 语料库 HMM
【基金】国家自然科学基金项目 (编号 6 9975 0 2 4); 国家自然科学基金重点项目 (编号 6 9931040 )资助
【所属期刊栏目】情报学报
文献传递