金庆的专栏

  C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  423 随笔 :: 0 文章 :: 454 评论 :: 0 Trackbacks
log4cxx-0.10.0日志中文乱码

(金庆的专栏)

log4cxx升级到0.10.0后, 发现中文输出为乱码.
其实应该是中文变成了问号, 不是乱码.

问号在logcxx中表示编解码过程中的字符丢失.
    enum { LOSSCHAR = 0x3F };
如果中文按ASCII解码, 因为字符大于0x80, 都会被变成问号.

修改办法,进入log4cxx-0.10.0目录,
./configure --with-charset=utf-8 --with-logchar=utf-8
then
make
sudo make install
(参考: http://cooling.ape-tech.com/bbs/thread-2084-1-1.html)

log4cxx中有两个宏定义分别对应这两个选项:
LOG4CXX_LOGCHAR_IS_UTF8 表示logcxx的LogString内码是UTF-8.
内码还可能是WCHAR_T或UTF-16.
LOG4CXX_CHARSET_UTF8 表示字符集为UTF-8.
如果这两个都是utf8, 那么就不需要编解码.

另一办法是修正Transcoder::encodeCharsetName()中的一个错误.
其中ASCII表中可显示字符的偏移是0x20, 而不是0x30.
这个错误会造成所有APRCharsetDecoder和APRCharsetEncoder失败.
在代码主干上, 该错误已被修正.

可能还需要在应用程序中设置locale:
    setlocale(LC_ALL, "zh_CN.GB2312");
在我的机器上, 不知为什么, nl_langinfo(CODESET)默认返回ANSI_X3.4-1968,
所以必须手工setlocale(), 不然log4cxx会把中文日志按ANSI_X3.4-1968解码,
结果就会变成一串问号.

如果需要指定输出的字符编码, 可以:
    appender->setEncoding("GB2312");
   
posted on 2011-06-16 10:35 金庆 阅读(2129) 评论(0)  编辑 收藏 引用 所属分类: 1. C/C++

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理