UNICODE 处理（转）

原文：http://www.vckbase.com/bbs/prime/viewprime.asp?id=125
这是一个许多人（包括我自己）曾经或至今仍疑惑的问题（这里我们只讨论UTF-16，即双字节版本）。

1.关于UNICODE
首先，UNICODE主要使用的字符类型是WCHAR，定义是unsigned short。从定义我们可以看出这是一个双字节的类型，就是每一个字符占2个字节。这样的话，可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间，而汉字（包括big5）分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节，可以参看以下网页
http://www.unicode.org/unicode/standard/translations/s-chinese.html

2.为什么要使用UNICODE
1）COM：在COM规范中，明确指定了必须使用UNICODE类型，这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR（WCHAR*）类型
2）WIN2000和WINNT：在这两个平台中，默认的字符处理方式是UNICODE。即使你写了一个非UNICODE（multibyte)的程序，系统在执行的时候仍然会对你的字符进行一次转换，这样无疑浪费了CPU时间，使用UNICODE可以有效的提高程序的运行效率（仅使用于这两个平台）。当然将来的XP也会如此。
3）通用性：使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼（都是2个字节）。

3.如何使用UNICODE
1）首先推荐的类型是TCHAR（通用字符类型）。当你定义了_UNICODE宏的时候，TCHAR就是WCHAR，当你没有定义这个宏的时候，TCHAR就是char，很不可思议吧，我们可以来看一下TCHAR的定义：

#ifdef  UNICODE                     // r_winnt
typedef WCHAR TCHAR, *PTCHAR;
#else   /* UNICODE */               // r_winnt
typedef char TCHAR, *PTCHAR;
#endif /* !_TCHAR_DEFINED */

上面的代码来自WINNT.H我剔除了一些无关的部分。现在一切都显而易见了。
通过TCHAR，我们只需要这样一段代码：
TCHAR tStr[] = _T("t code");
MessageBox(tStr);
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。

2）关于其他的处理
首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法：

CString *pFileName = new CString("c:\\tmpfile.txt");

#ifdef _UNICODE

   m_hFile = CreateFile(pFileName->AllocSysString(),
                        GENERIC_READ | GENERIC_WRITE,
                        FILE_SHARE_READ,
                        NULL,
                        OPEN_EXISTING,
                        FILE_ATTRIBUTE_NORMAL,
                        NULL);
#else
   m_hFile = CreateFile(pFileName->GetBuffer(pFileName->GetLength()),
                        GENERIC_READ | GENERIC_WRITE,
                        FILE_SHARE_READ,
                        NULL,
                        OPEN_EXISTING,
                        FILE_ATTRIBUTE_NORMAL,
                        NULL);
#endif

另外，VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。

posted on 2012-02-20 17:52 帅哥帅阅读(452) 评论(0) 编辑收藏引用所属分类: c++

UNICODE 处理（转）

导航

统计

常用链接

留言簿

随笔分类

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜