标题
  • 标题
  • 作者
  • 关键词

文本局部特征的向量表示研究

2009-04-30分类号:G354

【作者】杨峰  
【部门】广东商学院电子商务市场应用技术重点实验室  
【摘要】文本的特征表示是文本信息组织和检索的关键。经典的向量空间模型是最重要的一种技术,但它也有一些缺陷,如不能表示特征词在文本中的空间分布信息。为了提高文本描述的精度及检索能力,笔者给出了权重计算的修正方法。该方法在考虑特征项全局信息的基础上增加了其局部特征,它保留了传统VSM方法的特点,同时有效地将局部信息集成到一起,最后给出了一个具体的方案与相应算法。
【关键词】文本表示  向量空间模型  局部特征  文本向量
【基金】广东商学院博士启动项目;校级项目资助的研究成果之一,项目编号:06BS87001
【所属期刊栏目】情报理论与实践
文献传递