《表2 中医专业教材高频词语覆盖率统计》

《表2 中医专业教材高频词语覆盖率统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中医汉语词汇大纲研制及三种词汇大纲在中医汉语教学中的比较研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表1可以看出,来华留学生中医专业第一个学期的教学内容主要为四门课程,四本教材的字数分别为57.1万、50.4万、59.9万、38万。笔者对上述四本教材进行了扫描,通过软件自动识别文字,并经过人工校对后,得到四本中医教材的电子文本。接着采用Python语言编写代码,利用包含12842116个词的词库对其进行分词和词频统计[5]。我们使用的分词软件由北京汉语国际推广中心和北京师范大学中文信息处理研究所共同研发。在去除标点符号和英文字符后,获得所有中文的词频统计结果,将其汇总后就得到中医教材分析材料。上述四本教材总字数共为205.4万字,共收词16873个。其中,单音节词3539个,双音节词11089个,三音节词1709个,四音节及以上共500个。四本教材中的高频词语覆盖率如表2所示: