log4cxx-0.10.0日志中文乱码
(金庆的专栏)
log4cxx升级到0.10.0后, 发现中文输出为乱码.
其实应该是中文变成了问号, 不是乱码.
问号在logcxx中表示编解码过程中的字符丢失.
enum { LOSSCHAR = 0x3F };
如果中文按ASCII解码, 因为字符大于0x80, 都会被变成问号.
修改办法,进入log4cxx-0.10.0目录,
./configure --with-charset=utf-8 --with-logchar=utf-8
then
make
sudo make install
(参考: http://cooling.ape-tech.com/bbs/thread-2084-1-1.html)
log4cxx中有两个宏定义分别对应这两个选项:
LOG4CXX_LOGCHAR_IS_UTF8 表示logcxx的LogString内码是UTF-8.
内码还可能是WCHAR_T或UTF-16.
LOG4CXX_CHARSET_UTF8 表示字符集为UTF-8.
如果这两个都是utf8, 那么就不需要编解码.
另一办法是修正Transcoder::encodeCharsetName()中的一个错误.
其中ASCII表中可显示字符的偏移是0x20, 而不是0x30.
这个错误会造成所有APRCharsetDecoder和APRCharsetEncoder失败.
在代码主干上, 该错误已被修正.
可能还需要在应用程序中设置locale:
setlocale(LC_ALL, "zh_CN.GB2312");
在我的机器上, 不知为什么, nl_langinfo(CODESET)默认返回ANSI_X3.4-1968,
所以必须手工setlocale(), 不然log4cxx会把中文日志按ANSI_X3.4-1968解码,
结果就会变成一串问号.
如果需要指定输出的字符编码, 可以:
appender->setEncoding("GB2312");