《表1 算法中所用到的符号说明》

《表1 算法中所用到的符号说明》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《AM-CNN:一种基于注意力的卷积神经网络文本分类模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

算法1描述了关键词抽取的算法(图1).算法首先采用结巴分词器对每篇文本进行分词(第2行).分词后利用w ord2vec生成词向量(第3行).第4-5行是使用tf-idf方法得到每个类别文章的高频词,再通过交叉熵将这个类别的高频词与其他类别的高频词作对比,判断这个类别的高频词是否在其他类别中出现频率高.第6行得到关于这个类别的个关键词,最后这前个关键词拼接成类别特征向量(第7行).