清风竹林

ぷ雪飘绛梅映残红
   ぷ花舞霜飞映苍松
     ----- Do more,suffer less

char, wchar_t与STL的字符串格式化format


   最近一直在写序列化类,希望把一些游戏过程中的场景数据信息存储到硬盘。因为需要处理的数据很多,所以我写了一个工具类,其中包括字符串的序列化,问题来了:
   公司原先的代码参差不齐,有使用AString的(使用ANSI char作为字符单元,相当于std::string),也有考虑到unicode问题而采用AWString的(使用wchar_t作为字符单元,相当于std::wstring),同时考虑到根据编译环境自动视别的问题,也定义有一个宏ACString,即:如果定义有UNICODE环境变量,则自动替换为AWString,否则使用AString。好吧,自作聪明的我使用了ACString来写工具函数,测试时没有任何问题,但一旦加入到真正的运行环境中就会出现“把const char*转化为bool,性能警告”的错误,几经检查,发现在游戏环境下,传入的参数是AString类型,而我用的ACString则被自动转化成了AWString,找不到参数匹配的,所以只有默认转化了。
   看来,解决办法只能是同时提供AString与AWString两种类型的工具函数,因为你不知道你的客户传给你的将是哪一种,除非大家都铁了心的一致使用ACString,然而在现实的编码中,这却是不切实际的。
   这让我想起前两天为STL写的格式化函数(STL没有,只好自己写了-_-),当时我也想自作聪明的把std::string与std::wstring合二为一,现在想来恐怕是庸人自扰罢了,于是早上起来把原来的代码作下修改,如下:
#include <stdarg.h>
#include 
<string>
#include 
<vector>
#include 
<cassert>

#ifndef __STR_STR_HPP_INCLUDED_
#define __STR_STR_HPP_INCLUDED_
namespace str
{
    
//字符串格式化函数
    std::string format(const char *fmt, 
    { 
        std::
string strResult="";
        
if (NULL != fmt)
        {
            va_list marker 
= NULL;            
            va_start(marker, fmt);                            
//初始化变量参数 
            size_t nLength = _vscprintf(fmt, marker) + 1;    //获取格式化字符串长度
            std::vector<char> vBuffer(nLength, '\0');        //创建用于存储格式化字符串的字符数组
            int nWritten = _vsnprintf_s(&vBuffer[0], vBuffer.size(), nLength, fmt, marker);
            
if (nWritten>0)
            {
                strResult 
= &vBuffer[0];
            }            
            va_end(marker);                                    
//重置变量参数
        }
        
return strResult; 
    }
    
//字符串格式化函数
    std::wstring format(const wchar_t *fmt, 
    { 
        std::wstring strResult
=L"";
        
if (NULL != fmt)
        {
            va_list marker 
= NULL;            
            va_start(marker, fmt);                            
//初始化变量参数
            size_t nLength = _vscwprintf(fmt, marker) + 1;    //获取格式化字符串长度
            std::vector<wchar_t> vBuffer(nLength, L'\0');    //创建用于存储格式化字符串的字符数组
            int nWritten = _vsnwprintf_s(&vBuffer[0], vBuffer.size(), nLength, fmt, marker); 
            
if (nWritten > 0)
            {
                strResult 
= &vBuffer[0];
            }
            va_end(marker);                                    
//重置变量参数
        }
        
return strResult; 
    } 
}
#endif
测试全码(其中str.hpp就是上面代码的文件名了):
#include <iostream>
#include 
<cassert>
#include 
"str.hpp"
int main(int argc, char* argv[])
{
    
const double PI=3.1415926;
    std::
string s=str::format("ANSI%s---字符:%c;整数:%d;双精度:%f""测试",'a'38, PI);
    std::cout
<<s<<std::endl;

    std::wstring ws
=str::format(L"UNICODE%s---字符:%c;整数:%d;双精度:%f", L"测试",'u'83, PI);
    std::wcout
<<ws<<std::endl;

    system(
"pause");
    
return 0;
}
输出结果:

   问题一:前面的format函数只能在vs2005下通过编译,在vc6.0下就不可以,原因是用于“获取格式化字符串长度”的_vscprintf和_vscwprintf在vc6.0中找不到替代品;
   问题二:相信大家已经看到了,ANSI字符串的测试没有任何问题,但UNICODE字符串在输出时中断了,确切的说是在输出到中文时中断了,我用断点查看过,ws的构造没有问题,即wchar_t版的format函数没有问题,那么问题就应该出在std::wcout上面,但问题在哪呢?
   诸位看官,欢迎提供任何指导意见。





posted on 2008-09-02 10:23 李现民 阅读(10733) 评论(2)  编辑 收藏 引用 所属分类: 语法试炼

评论

# re: char, wchar_t与STL的字符串格式化format 2008-09-02 16:40 Herb

UNICODE和ANSI字符的单位长度不一样,尤其是有汉字时.在转换字符串时要注意它的长度.  回复  更多评论   

# re: char, wchar_t与STL的字符串格式化format 2008-09-02 17:06 李现民

@Herb
ws已经正常构造了,因此std::wcout无法输出汉字的长度一点关系也没有  回复  更多评论   


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理