因特网经济学未登录词计算机辅助挖掘试验
2005-09-30分类号:G354
【部门】南京农业大学工学院 南京农业大学信息管理系 江苏210031 江苏210095
【摘要】近年来随着社会经济科技和因特网的迅速发展,文献中不断涌现出大量未登录词。未登录词的存在严重影响了汉语自动分词与自动标引的准确率和速率。本文对1000篇经济类网页的关键部位———题名、摘要、关键词、首段进行未登录词挖掘试验,侧重对未登录词挖掘步骤设计和处理方法的讨论。
【关键词】经济学 数据挖掘 自动标引/关键词词典 未登录词
【基金】
【所属期刊栏目】情报理论与实践
文献传递

