大龙的博客

常用链接

统计

随笔 - 864
文章 - 2
评论 - 378
引用 - 0

setlocale同mbstowcs函数的关系 --- 转

程序中，如果要将ASCII码字符串转换为宽字符（Unicode），可以利用标准C的mbstowcs函数。

微软在MSDN中有示例，如下：

然而，这段代码在处理含有汉字的字符串时就会出现问题。比如将：

wchar_t *pwchello = L"Hi"; 替换为wchar_t *pwchello = L"你好";

查看运行结果就会发现，mbstowcs函数将汉字视作两个ASCII字符，这样一个汉字就变成了两个wchar_t。原因是mbstowcs需要我们明确的告诉他要转换的字符语言。这里需要使用setlocale函数。在网上发现不少人遇到这个问题，微软的MSDN也是，为什么这里就不说明一下呢？

只要在调用前，使用setlocale(LC_ALL, "chs")设置，结果就正常了。

我测试在英文Vista操作系统内，Visual Studio 2008下setlocale(LC_ALL, "chs")可以执行成功。

但是在Borland C++Builder 6、CodeGear RAD Studio 2009下执行都失败，BCB提供的帮助文件内也未找到，反复测试使用setlocale(LC_ALL, "Chinese (Simplified)_People's Republic of China")可以奏效（这么大一个长串，BCB对搞中文编码的程序员也够狠）。

更讽刺的是，在BCB内使用setlocale(LC_ALL, "jpn")，或"cht"都可以成功。唯独就不支持"chs"，对BCB的做法彻底无语了。我相信在大多数unix或linux上也还是支持"chs"的。如果有时间，我再搞一个MinGW试试看。

另外如果程序运行在非中文操作系统内，使用setlocale修改运行时字符集环境，会影响当前应用程序的编码方式，因此使用前需要保留一下老的编码，使用后再恢复。

for 在linux上coding的兄弟们，locale别名表大概在 /usr/lib/X11/locale/locale.alias

posted on 2010-05-25 14:29 大龙阅读(2780) 评论(1) 编辑收藏引用

# re: setlocale同mbstowcs函数的关系 --- 转 2011-04-09 19:23 pointma

太谢谢老大了！！！
星期六不用加班加到通宵就是因为老大的这篇文章！！！

叩头！！！
老大是好人！！
（好人你妹啊！！！谁收你的好人卡啊！！）

回复更多评论

刷新评论列表

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

# re: setlocale同mbstowcs函数的关系 --- 转 2011-04-09 19:23 pointma

大龙的博客

导航

留言簿(43)

收藏夹

随笔档案

文章档案

阅读排行榜

评论排行榜

常用链接

统计

最新评论

setlocale同mbstowcs函数的关系 --- 转

评论