《表2 实验文本长度分布及例句》
从全国知识图谱与语义计算会议(CCKS)的电子病历语料中随机抽取文本长度分别为15、41和91个字符的3份病史相关文本,分别使用EMR-1、EMR-2和EMR-3指代;从“人民日报2014”语料中,随机抽取了长度分别为15、43和97个字符的3份新闻文本,分别使用News-1、News-2和News-3指代,并以15个字符长度的句子作为例句(表2)。对两组实验文本的字数分布做t检验,P>0.05(P=0.939),无统计学差异。
图表编号 | XD00126687500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 杨飞洪、李姣 |
绘制单位 | 中国医学科学院、北京协和医学院医学信息研究所、中国医学科学院、北京协和医学院医学信息研究所 |
更多格式 | 高清、无水印(增值服务) |