基于网页的知识元挖掘
2010-06-15分类号:G350
【部门】西安电子科技大学经济管理学院
【摘要】随着信息技术的快速发展和网络的普及,以网页形式表示的信息越来越多,基于网页的知识元挖掘就是从浩瀚的网页信息中发现潜在的有价值知识。网页知识元挖掘要处理大量的非结构化的文档信息和复杂的语义关系,采用全新的数据挖掘方法直接对非结构化数据进行挖掘,其基本流程包括:文件格式转换、分词与词性标注、文本知识元挖掘、知识元聚类以及推理与知识发现。
【关键词】知识元挖掘 文件格式转换 词性标注 知识元聚类 知识发现
【基金】
【所属期刊栏目】图书情报工作
文献传递