基于模糊匹配与音字转换的维吾尔语人名识别
2017-02-15分类号:TP391.1
【部门】新疆大学信息科学与工程学院 中国科学院自动化研究所模式识别国家重点实验室
【摘要】维吾尔语是属于阿尔泰语系的黏着性语言,构词特点比较复杂,尤其是维吾尔语中的人名,由于来源差别巨大,识别难度很高,到目前为止,还未出现成熟的维吾尔语人名识别工具。大量维吾尔语文本中的人名统计发现,维吾尔族人名和汉族人名共占据了约83%,因此该文分别针对维吾尔语文本中出现的维吾尔族人名和汉族人名提出相应的识别方法。针对维吾尔族人名,提出基于字母的模糊匹配识别方法;针对汉族人名,借助机器翻译思想提出基于音字转换的识别方法。实验结果表明:所提方法识别维吾尔族人名F1值能够达到91.84%,识别汉族人名F1值能够达
【关键词】维吾尔语 人名识别 模糊匹配 音字转换
【基金】新疆大学优秀博士生创新项目(XJUBSCX-2012010);; 国家自然科学基金项目(61562081;61163033);; 新疆维吾尔自治区高新技术发展研究计划项目(201312103)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递