《表1 UTF-8编码的二进制表示》

《表1 UTF-8编码的二进制表示》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Python文本模式匹配与TXT文件编码类型的识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据UTF-8字符的编码规则,1个字节的UTF-8字符就是标准ASCII码,二进制最高位为0;2个字节的字符的第一个字节的二进制位必须以110开头,第二个字节必须10开头;3个字节的字符的第一个字节的二进制位必须以1110开头,后面的两个字节都必须以10开头;4个字节的字符的第一个字节的二进制位必须以11110开头,后面的3个字节都必须以10开头[7]。详细如表1所示。