《表2 拼音韵母编码:基于改进音形码的中文敏感词检测算法》
第二部分表示韵母.拼音中一共有24种韵母,因此也至少需要五个二进制位,按照主韵母aoeiuü将韵母分为六组,同样使用格雷码的形式使读音相近的韵母在编码距离上最小.考虑到后期方便计算,舍弃前后鼻音的区别,即认为an和ang,in和ing,en和eng的编码形式相同.拼音的韵母编码见表2.
图表编号 | XD00136563300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.30 |
作者 | 周昊、沈庆宏 |
绘制单位 | 南京大学电子科学与工程学院、江苏金晓电子信息股份有限公司、南京大学电子科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |