改进的中文字串多模式匹配算法
2002-02-24分类号:TP301.6
【部门】上海交通大学电子信息学院 上海交通大学电子信息学院 上海交通大学电子信息学院 上海200030 上海200030 上海200030
【摘要】针对中文字串匹配问题 ,提出了一种改进的多模式匹配算法。该算法采用新型组合状态自动机 ,解决了对大字符集语言构建字符完全Hash表时可能遇到的存储空间膨胀问题。此外 ,算法还充分利用中文大字符集语言的优势 ,将QS算法的思想融入到多模式匹配应用中 ,取得了良好的效果。实验结果显示 ,本算法明显优于DFSA算法 ,在平均情况下所花费时间仅为DFSA算法的 70 33%。
【关键词】匹配 字符串 有限状态自动机 多模式匹配
【基金】8 6 3计划资助项目 (合同号 :86 3 30 6 ZD0 3 0 4 1)
【所属期刊栏目】情报学报
文献传递