《表2 标签共现频次信息:基于动态采样和迁移学习的疾病预测模型》
在迁移学习中为了选取更好的预训练模型,本文统计了不同疾病标签共现频次,对于标签组合(ci,cj),采用算法1步骤(1.a)统计标签共现频次,得到了表2所示的标签共现频次信息.Single CNN首先将输入文本分词后得到词序列,利用skip-gram模型训练得到的词语高维连续稠密词向量,进而将词序列转化为词向量矩阵,从而得到输入文本的语义特征表示,在卷积、池化、全连接后进行疾病的分类预测.本文用于对比的基于传统机器学习的模型有:逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,SVM)、决策树(Decision Tree,DT)、朴素贝叶斯模型(Naive Bayes,NB)、迭代提升欠采样模型(Under Sampling with Iteratively Boosting,USIB)[12].
图表编号 | XD00102901100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 胡满满、陈旭、孙毓忠、沈曦、王晓青、余天洋、梅御东、肖立、程伟、杨杰、杨焱 |
绘制单位 | 中国科学院计算技术研究所、中国科学院大学、中国科学院计算技术研究所、中国科学院大学、中国科学院计算技术研究所、中国科学院计算技术研究所、首都医科大学附属北京朝阳医院、南昌大学、中国科学院计算技术研究所、中国科学院大学、中国科学院计算技术研究所、中国中医科学院西苑医院、中国中医科学院中医药数据中心、中国人民解放军联勤保障部队第九八三医院信息科 |
更多格式 | 高清、无水印(增值服务) |