《表1 算法中所用到的符号说明》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《AM-CNN:一种基于注意力的卷积神经网络文本分类模型》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

算法1描述了关键词抽取的算法（图1）.算法首先采用结巴分词器对每篇文本进行分词（第2行）.分词后利用w ord2vec生成词向量（第3行）.第4-5行是使用tf-idf方法得到每个类别文章的高频词，再通过交叉熵将这个类别的高频词与其他类别的高频词作对比，判断这个类别的高频词是否在其他类别中出现频率高.第6行得到关于这个类别的个关键词，最后这前个关键词拼接成类别特征向量（第7行）.

图表编号	XD0045019900 严禁用于非法目的
绘制时间	2019.04.01
作者	王吉俐、彭敦陆、陈章、刘丛
绘制单位	上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院
更多格式	高清、无水印（增值服务）