《表1 中文公众医疗健康问句数据库》
实验所用数据集为中文公众医疗健康问句数据集[15-17],包含5 000条标注后的中文公众医疗健康问句,共有7 101个标签。该数据集由8位标注员根据一个含有29个类别的两层分类体系标注而成。笔者主要对诊断、治疗、择医、流行病学、健康生活方式这5大类进行分类。数据分布如表1所示。
图表编号 | XD00139889300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.20 |
作者 | 张志昌、张治满、张珍文 |
绘制单位 | 西北师范大学计算机科学与工程学院、西北师范大学计算机科学与工程学院、西北师范大学计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |