文本局部特征的向量表示研究
2009-04-30分类号:G354
【部门】广东商学院电子商务市场应用技术重点实验室
【摘要】文本的特征表示是文本信息组织和检索的关键。经典的向量空间模型是最重要的一种技术,但它也有一些缺陷,如不能表示特征词在文本中的空间分布信息。为了提高文本描述的精度及检索能力,笔者给出了权重计算的修正方法。该方法在考虑特征项全局信息的基础上增加了其局部特征,它保留了传统VSM方法的特点,同时有效地将局部信息集成到一起,最后给出了一个具体的方案与相应算法。
【关键词】文本表示 向量空间模型 局部特征 文本向量
【基金】广东商学院博士启动项目;校级项目资助的研究成果之一,项目编号:06BS87001
【所属期刊栏目】情报理论与实践
文献传递