《表1 拼音声母编码:基于改进音形码的中文敏感词检测算法》

《表1 拼音声母编码:基于改进音形码的中文敏感词检测算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于改进音形码的中文敏感词检测算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

首先第一部分表示声母,拼音声母一共有23个,所以至少需要五个二进制位.声母按照发音习惯可以分为七组,分别是bpmf,dtnl,gkh,jqx,zhchsh,zcsr,yw.为了使发音相近的声母尽可能在距离上相近,这里采用格雷码的方式,因为格雷码的任意两个相邻的编码只有一位二进制数不同,可以使每一组中相邻的声母编码差异最小.同时考虑到后期方便计算,舍弃平翘舌音的区别,即认为z和zh,c和ch,s和sh的编码形式相同.拼音的声母编码见表1.