n×0.13 n=265

前一篇文章说到字库制作以及字庫提取接下来会发现很多时候需要做转码要求,譬如网页属性是utf-8,那么web输入下去的数据就是UTF-8的编码那么就要求UTF-8需要转unicode,如果web是GB2312,那么也需偠GB2312转unicode接下来就来讲一讲转码。


  现在明白了Unicode那么UTF-8又是什么呢?又为什么会出现UTF-8呢
  ASCII转换成UCS-2,只是在编码前插入一个0x0用这些编碼,会包括一些控制符比如 '' 或 '/',这在UNIX和一些C函数中将会产生严重错误。因此可以肯定UCS-2不适合作为Unicode的外部编码。
  因此才诞生了UTF-8。那么UTF-8是如何编码的又是如何解决UCS-2的问题呢?
这是“你”字的UTF-8编码
这是“你”的Unicode编码
把除了x之外的数字拼接在一起就变成“你”的Unicode编碼了。
注意UTF-8的最前面3个1表示整个UTF-8串是由3个字节构成的。
经过UTF-8编码之后再也不会出现敏感字符了,因为最高位始终为1

以下是Unicode和UTF-8之間的转换关系表:

所以,可以看到unicode编码和utf-8编码有线性转换关系,而unicode编码和gb2312编码不存在线性转换关系,所以我们必须使用对照表来进行unicode和gb2312编码的互換,就像阳历和农历转换算法一样,不能作线性计算[luther.gliethttp]

* pOutput 指向输出的用于存储UTF8编码值的缓冲区的指针 * 返回转换后的字符的UTF8编码所占的字节数, 如果出錯则返回 0 . * 在Intel处理器中采用小端法表示, 在此采用小端法表示. (低地址存低位) * Unic 指向输出缓冲区, 其保存的数据即是Unicode编码值, * 成功则返回该字符的UTF8编码所占用的字节数; 失败则返回0. * 在Intel处理器中采用小端法表示, 在此采用小端法表示. (低地址存低位) /*脳陋禄禄Unicde脳脰路没麓庐碌陆GB脗毛拢卢路碌禄脴潞潞脳脰脢媒*/
}

我要回帖

更多关于 13n 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信