ivy-jie

progress ...

C++博客

9 Posts :: 41 Stories :: 6 Comments :: 0 Trackbacks

汉字的GBK编码也是把一个汉字用两个字节来表示，其首字节对应0x81-0xFE(即129-224)，尾字节对应除掉(0x7F)的0x40-oxFE(即64-126和128-224)

我们一般判断一个字是否是汉字都是根据其首字节来判断，我们来看汉字的GBK编码首字节的起始编码0x81，其二进制即为0000 1000 0000 0000，可见若一个字符的二进制逻辑与0x81之后为0时，该字符一定小于0x81，此时该字符必定不是汉字，反之，该字符应该是一个汉字的首字节。

结合以上原理就不难理解一个中英文混合字符串的截取的常用代码：

posted on 2009-05-21 23:31 ivy-jie 阅读(686) 评论(0) 编辑收藏引用所属分类: arithmetic

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！

相关文章: 转:把十六进制字符串转成数字的函数-类似atoi(char *) 200511 重叠区间大小关于汉字gbk编码 200813 传输规划 200812 圆内五角星低频词的过滤字符串替换

网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理