《表2 主题标签共现情况:基于混合采样与迁移学习的患者评论识别模型》
除此之外,引入不均衡率(Imbalance Ratio,IR)表征数据集标签的不均衡程度[29],IR值为实验数据集中大类样本标签与小类样本标签的比值。以此为依据,设定态度、能力、措施、效果主题标签所在数据集为大类数据集,环境、费用主题标签所在数据集为小类数据集。小类数据集中主题标签与大类数据集中标签的共现频次如表2所示,其中环境与态度、费用与措施的共现频次分别在各自组中最高。以此为依据,选择态度主题数据集训练的模型为环境主题迁移学习的原始模型,措施主题数据集训练的模型为费用主题迁移学习的原始模型。
图表编号 | XD00139941500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.25 |
作者 | 向菲、谢耀谈 |
绘制单位 | 华中科技大学同济医学院医药卫生管理学院、华中科技大学同济医学院医药卫生管理学院 |
更多格式 | 高清、无水印(增值服务) |