《表2 特征词、类别的二维矩阵》

《表2 特征词、类别的二维矩阵》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《文本分类中一种特征选择方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

其基本思想是:构造一个特征词、类别的二维矩阵。假设该二维矩阵为4×3的矩阵,如表2所示。矩阵中的元素代表特征词tk在Ci类别出现的文本数DF(tk,Ci)。将特征词tk所在行的各个DF(tk,Ci)相加即为DF(tk),表示特征词tk在训练集所有类别中出现的文本数总和;对特征词tk所在行使用,即为计算特征词tk在Ci类的类间集中度。将第Ci列的各个DF(tk,Ci)相加即为DF(t,Ci),表示类别Ci中所有特征词出现的文本数的总和;对特征词tk所在列使用,即为计算特征词tk在Ci类的类内分散度。