《表1 不同科室的经典问答示例》
为避免科室差异所导致的误差,分别爬取13个科室经典问答中患者的第一个问题,并为其标上对应科室名称的标签。不同科室的示例如表1所示。数据预处理部分,通过导入自定义医学词典,使用Python的Jieba分词对患者的提问文本进行自动分词,并去掉“的”、“了”等无意义的停用词。以“科室”为分层依据,抽取每个科室75%的数据作为训练集,25%作为测试集。
图表编号 | XD00107791600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 王若佳、张璐、王继民 |
绘制单位 | 北京大学信息管理系、北京大学海洋研究院、北京大学信息管理系、北京大学信息管理系 |
更多格式 | 高清、无水印(增值服务) |