《表1 算法中所用到的符号说明》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《AM-CNN:一种基于注意力的卷积神经网络文本分类模型》
算法1描述了关键词抽取的算法(图1).算法首先采用结巴分词器对每篇文本进行分词(第2行).分词后利用w ord2vec生成词向量(第3行).第4-5行是使用tf-idf方法得到每个类别文章的高频词,再通过交叉熵将这个类别的高频词与其他类别的高频词作对比,判断这个类别的高频词是否在其他类别中出现频率高.第6行得到关于这个类别的个关键词,最后这前个关键词拼接成类别特征向量(第7行).
图表编号 | XD0045019900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.01 |
作者 | 王吉俐、彭敦陆、陈章、刘丛 |
绘制单位 | 上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院 |
更多格式 | 高清、无水印(增值服务) |