《表4 易混拼音分组:面向中文敏感词变形体的识别方法研究》

《表4 易混拼音分组:面向中文敏感词变形体的识别方法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向中文敏感词变形体的识别方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

易混拼音主要分为三种:平舌音与翘舌音、边音与鼻音、前鼻音与后鼻音。表5是易混拼音分组的部分数据,该表的拼音分组以及相似性因子参考了文献[12]。每组相似性因子代表同组拼音被替换成同一组中的另一个拼音需要付出的“代价”,若两个拼音相同,则它们的“代价”就是0,若两个拼音不相同,并且也没有在同一个组里面,那么它们的“代价”是1。通过对汉语拼音的研究,部分分组情况如表4所示。