《表1 文本集VSM表示:向量空间模型的文本分类研究进展与应用》

《表1 文本集VSM表示:向量空间模型的文本分类研究进展与应用》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《向量空间模型的文本分类研究进展与应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

向量空间模型(Vector Space Model,VSM)于20世纪70年代被提出并广泛用于文本检索系统,其主要思想为:将文本集中的每篇文本使用空间向量的形式进行向量表示,文本的每个特征词对应文本向量的每一维,特征词所对应的值为该特征在整个文档集中所占的权重值。数学表述如下:文本集为D={d1,d2,…,di,…,dm},特征集为T={t1,t2,t3,…,tn},每篇文本di用一个特征向量进行表示V(di)={t1,wi1;t2,wi2;t3,wi3,…,tn,win;},win表示第i篇文本中第n个特征项的权重值,整个文本集VSM表示如表1所示。