《表1 汉字拆分表:基于决策树的敏感词变形体识别算法研究及应用》

《表1 汉字拆分表:基于决策树的敏感词变形体识别算法研究及应用》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于决策树的敏感词变形体识别算法研究及应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

3)词的拆分模式根据汉字的构成单位可把汉字分为独体字、合体字两类。独体字(日、月等)由笔画构成,合体字(休、取等)则由偏旁构成。汉字空间上的关系有相交、相离、相接[11],汉字方位上的关系有上下、左右、内外、框架、独体。区位码是一个四位的十进制数,每个区位码都对应着一个唯一的汉字或符号。根据以上汉字特征对敏感词列表中的汉字进行人工拆分,并采用区位码进行编码形成汉字拆分表,如表1所示。