《表2 标签共现频次信息：基于动态采样和迁移学习的疾病预测模型》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于动态采样和迁移学习的疾病预测模型》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在迁移学习中为了选取更好的预训练模型，本文统计了不同疾病标签共现频次，对于标签组合（ci，cj），采用算法1步骤（1.a）统计标签共现频次，得到了表2所示的标签共现频次信息.Single CNN首先将输入文本分词后得到词序列，利用skip-gram模型训练得到的词语高维连续稠密词向量，进而将词序列转化为词向量矩阵，从而得到输入文本的语义特征表示，在卷积、池化、全连接后进行疾病的分类预测.本文用于对比的基于传统机器学习的模型有:逻辑回归（Logistic Regression，LR）、支持向量机（Support Vector Machine，SVM）、决策树（Decision Tree，DT）、朴素贝叶斯模型（Naive Bayes，NB）、迭代提升欠采样模型（Under Sampling with Iteratively Boosting，USIB）[12].

图表编号	XD00102901100 严禁用于非法目的
绘制时间	2019.10.01
作者	胡满满、陈旭、孙毓忠、沈曦、王晓青、余天洋、梅御东、肖立、程伟、杨杰、杨焱
绘制单位	中国科学院计算技术研究所、中国科学院大学、中国科学院计算技术研究所、中国科学院大学、中国科学院计算技术研究所、中国科学院计算技术研究所、首都医科大学附属北京朝阳医院、南昌大学、中国科学院计算技术研究所、中国科学院大学、中国科学院计算技术研究所、中国中医科学院西苑医院、中国中医科学院中医药数据中心、中国人民解放军联勤保障部队第九八三医院信息科
更多格式	高清、无水印（增值服务）