《表1 文本集VSM表示:向量空间模型的文本分类研究进展与应用》
向量空间模型(Vector Space Model,VSM)于20世纪70年代被提出并广泛用于文本检索系统,其主要思想为:将文本集中的每篇文本使用空间向量的形式进行向量表示,文本的每个特征词对应文本向量的每一维,特征词所对应的值为该特征在整个文档集中所占的权重值。数学表述如下:文本集为D={d1,d2,…,di,…,dm},特征集为T={t1,t2,t3,…,tn},每篇文本di用一个特征向量进行表示V(di)={t1,wi1;t2,wi2;t3,wi3,…,tn,win;},win表示第i篇文本中第n个特征项的权重值,整个文本集VSM表示如表1所示。
图表编号 | XD00138398800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.15 |
作者 | 吴龙峰、于瓅、王峰 |
绘制单位 | 安徽理工大学计算机科学与工程学院、安徽理工大学计算机科学与工程学院、阜阳师范学院计算机与信息学院 |
更多格式 | 高清、无水印(增值服务) |