【原创】boost.compressed_pair源码剖析

boost.compressed_pair源码剖析

意义

当compressed_pair的某一个模板参数为一个空类的时候将对其进行“空基类优化”，这样可以使得compressed_pair占用的空间比std::pair的更小。

参考如下代码：

#include <iostream>

using namespace std;

#include <boost/compressed_pair.hpp>

class A{};

class B{};

int main()

{

cout<< sizeof( std::pair< A, B > ) << endl;

cout<< sizeof( boost::compressed_pair< A, B > ) << endl;

return 0;

}

在我的机器上，VC2008 SP1输出2和1。

std::pair参考

std::pair被实现为一个结构体，其中VC2008 SP1的pair被实现为如下：

template<class _Ty1, class _Ty2>

struct pair

{ // store a pair of values

typedef pair<_Ty1, _Ty2> _Myt;

typedef _Ty1 first_type;

typedef _Ty2 second_type;

pair()

: first(_Ty1()), second(_Ty2())

{ // construct from defaults

}

pair(const _Ty1& _Val1, const _Ty2& _Val2)

: first(_Val1), second(_Val2)

{ // construct from specified values

}

template<class _Other1,

class _Other2>

pair(const pair<_Other1, _Other2>& _Right)

: first(_Right.first), second(_Right.second)

{ // construct from compatible pair

}

// 删除了一些不重要的代码

_Ty1 first; // the first stored value

_Ty2 second; // the second stored value

};

通过直接访问first和second对数据进行访问。

boost.compressed_pair参考

boost.compressed_pair大概的实现如下：

class compressed_pair

{

public:

typedef T first_type;

typedef T second_type;

typedef typename call_traits<first_type>::param_type first_param_type;

typedef typename call_traits<second_type>::param_type second_param_type;

typedef typename call_traits<first_type>::reference first_reference;

typedef typename call_traits<second_type>::reference second_reference;

typedef typename call_traits<first_type>::const_reference first_const_reference;

typedef typename call_traits<second_type>::const_reference second_const_reference;

first_reference first() {return base::first();}

first_const_reference first() const {return base::first();}

second_reference second() {return base::second();}

second_const_reference second() const {return base::second();}

void swap(::boost::compressed_pair<T,T>& y) { base::swap(y); }

};

注意这不是完整的代码，它只是对其实现的一个简单描述。从中我们可以看出boost.compressed_pair使用成员函数来访问数据而不是如std::pair一样直接访问first和second。

boost.compressed_pair剖析

boost.compressed_pair的实现依赖于boost.type_traits和boost.call_traits。boost.type_traits是boost提供的一个特征类库，这是一个强大的库，可以应用于很多地方。boost的大量组件都依赖于它。boost.call_traits也是一个类似于type_traits的库，它主要提供的是一些类型调整，通过编译器演绎我们可以在编译时得到最好的type，它可以使我们的传递的参数等等相关内容总是以最恰当（根据经验）的方式来进行调用，而且还能在新的C++标准发布之前绕过“引用的引用”问题。

接下来我将剖析支持偏特化版本的compressed_pair的实现，它位于boost\detail\compressed_pair.hpp。

compressed_pair_switch

这是一个开关工具，用于在后面对各种情况进行开关控制，它的基本实现如下：

template <class T1, class T2, bool IsSame, bool FirstEmpty, bool SecondEmpty>

struct compressed_pair_switch;

注意，它只是定义而非实现，因此我们无法构造未特化过的compressed_pair_switch。通过查看它的模板参数可以知道后面三个bool代表了三个概念：

l pair的两个模板参数是否是相同类型。（去掉cv限定符之后）。

l 第一个模板参数是空的吗？

l 第二个模板参数是空的吗？

因此对这三个bool进行有限组合可以得到6种组合，也就出现了接下来我们所看到的6个特化（偏特化）。

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, false, false>

{static const int value = 0;};

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, true, true>

{static const int value = 3;};

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, true, false>

{static const int value = 1;};

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, false, true>

{static const int value = 2;};

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, true, true, true>

{static const int value = 4;};

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, true, false, false>

{static const int value = 5;};

现在我们已经偏特化了6个不同的开关，它们将在最终实现compressed_pair的过程中发挥巨大的作用。注意每个类中的value，这个常量值代表了它的版本。

compressed_pair_imp

它作为最终compressed_pair的基类存在，它的声明如下：

template <class T1, class T2, int Version> class compressed_pair_imp;

注意第三个参数Version，在最终的实现中它将被以compressed_pair_switch::value来具现化。

接下来按照compressed_pair_switch的6种版本所说明的6中组合情况分别实现其对应的compressed_pair_imp。在文章最开始的时候我们的简单程序发现std::pair由于直接采用组合T1、T2而无法使之成功的应用“空基类优化”，使得其占用空间的大小是2.如果compressed_pair_imp也直接按照这种组合来实现的话，那么所谓“压缩”便不会有任何意义。所以compressed_pair_imp对应不同组合情况有不同的实现，比如说对于版本1：

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, true, false>

{static const int value = 1;};

这种情况便是指T1和T2在去cv限定符之后为不同类型，且第一种类型为空，第二种不为空，那么这时候在实现compressed_pair_imp的时候便取消了T1的数据，源码如下：

template <class T1, class T2>

class compressed_pair_imp<T1, T2, 1>

: protected ::boost::remove_cv<T1>::type

{

public:

typedef T1 first_type;

typedef T2 second_type;

typedef typename call_traits<first_type>::param_type first_param_type;

typedef typename call_traits<second_type>::param_type second_param_type;

typedef typename call_traits<first_type>::reference first_reference;

typedef typename call_traits<second_type>::reference second_reference;

typedef typename call_traits<first_type>::const_reference first_const_reference;

typedef typename call_traits<second_type>::const_reference second_const_reference;

compressed_pair_imp() {}

compressed_pair_imp(first_param_type x, second_param_type y)

: first_type(x), second_(y) {}

compressed_pair_imp(first_param_type x)

: first_type(x) {}

compressed_pair_imp(second_param_type y)

: second_(y) {}

first_reference first() {return *this;}

first_const_reference first() const {return *this;}

second_reference second() {return second_;}

second_const_reference second() const {return second_;}

private:

second_type second_;

};

现在回过头去，对于版本0：

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, false, false>

{static const int value = 0;};

由于T1和t2为不同类型，同时都不为空，因此这种情况下compressed_pair与std::pair是一样的。

对于版本2：

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, false, true>

{static const int value = 2;};

T1和T2不相同，且T1不为空，T2为空，那么这和版本1的差别就在于t2的数据成员被取消，T1的数据成员存在。

template <class T1, class T2>

class compressed_pair_imp<T1, T2, 2>

: protected ::boost::remove_cv<T2>::type

{

first_reference first() {return first_;}

first_const_reference first() const {return first_;}

second_reference second() {return *this;}

second_const_reference second() const {return *this;}

private:

first_type first_;

}; // 删除了某系无关紧要的代码

版本3：

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, true, true>

{static const int value = 3;};

T1和t2不相同，且两者均为空。这种时候compressd_pair_imp不再需要任何数据成员，因此其精简版的定义如下:

template <class T1, class T2>

class compressed_pair_imp<T1, T2, 3>

: protected ::boost::remove_cv<T1>::type,

protected ::boost::remove_cv<T2>::type

{

first_reference first() {return *this;}

first_const_reference first() const {return *this;}

second_reference second() {return *this;}

second_const_reference second() const {return *this;}

// no need to swap empty bases:

void swap(::boost::compressed_pair<T1,T2>&) {}

};

在这里面我们可以看到它的交换动作根本什么也没做。而且也没有数据成员，但是其占用空间大小依然是1.

版本4定义了T1和T2相同，且均为空的特殊情况：

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, true, true, true>

{static const int value = 4;};

template <class T1, class T2>

class compressed_pair_imp<T1, T2, 4>

: protected ::boost::remove_cv<T1>::type

{

first_reference first() {return *this;}

first_const_reference first() const {return *this;}

second_reference second() {return m_second;}

second_const_reference second() const {return m_second;}

void swap(::boost::compressed_pair<T1,T2>&) {}

private:

T2 m_second;

};

既然T1和T2均为空，那么为何还要保存一个T2的数据呢？这是为了防止first()和second()所返回的对象的地址相同，这是很郁闷的一件事情。

版本5定义了T1和T2相同，且均不为空的情况：

template <class T1, class T2>

class compressed_pair_imp<T1, T2, 5>

{

first_reference first() {return first_;}

first_const_reference first() const {return first_;}

second_reference second() {return second_;}

second_const_reference second() const {return second_;}

void swap(::boost::compressed_pair<T1, T2>& y)

{

cp_swap(first_, y.first());

cp_swap(second_, y.second());

}

private:

first_type first_;

second_type second_;

};

这个版本并没有什么特殊之处。

compressed_pair

最终的实现通过继承compressed_pair_imp来实现，而上述的compressed_pair_imp都有一个Version模板参数，通过编译时推断出的compressed_pair_switch的数据value则可得到与其对应的基类。

template <class T1, class T2>

class compressed_pair

: private ::boost::details::compressed_pair_imp<T1, T2,

::boost::details::compressed_pair_switch<

T1,

T2,

::boost::is_same<typename remove_cv<T1>::type, typename remove_cv<T2>::type>::value,

::boost::is_empty<T1>::value,

::boost::is_empty<T2>::value>::value>

template <class T>

class compressed_pair<T, T>

: private details::compressed_pair_imp<T, T,

::boost::details::compressed_pair_switch<

::boost::is_same<typename remove_cv<T>::type, typename remove_cv<T>::type>::value,

::boost::is_empty<T>::value,

::boost::is_empty<T>::value>::value>

这是按照T1和T2是否相同所不同的实现。它们的区别主要在构造函数的实现上：

explicit compressed_pair(first_param_type x) : base(x) {}

explicit compressed_pair(second_param_type y) : base(y) {}

对于T1和T2相同的情况，上面的这段代码不是合法的重载。

::boost::is_same将对T1和T2去cv限定符之后的类型进行比较，结果value是一个bool值常量，对应于compressed_pair_switch第三个模板参数。::boost::is_empty可以判断类型是否是空类型，其值value也是一个bool值常量。这样便可推断出该继承哪一个版本的compressed_pair_imp。

其它重点

这里将继续探讨一些有意义的技巧。

继承

在这里我们将聚焦compressed_pair_imp的实现，其中除了第0版本和第5版本之外，其它的实现均不同程度的使用了继承，比如第1版：

template <class T1, class T2>

class compressed_pair_imp<T1, T2, 1>

: protected ::boost::remove_cv<T1>::type

这个版本是：

template <class T1, class T2>

struct compressed_pair_switch<T1, T2, false, true, false>

{static const int value = 1;};

即T1和T2不同，且只有T1为空，那么它继承去cv限定符之后的T1类型。它的意义何在呢？

参考第1版本的compressed_pair_imp的实现可以看到：

first_reference first() {return *this;}

first_const_reference first() const {return *this;}

当需求要T1的类型对象的时候，直接返回的是compressed_pair_imp对象自己，如果不继承的话这个动作将是非法的。这就是为什么有这样一个继承的原因。

对于版本3：

template <class T1, class T2>

class compressed_pair_imp<T1, T2, 3>

: protected ::boost::remove_cv<T1>::type,

protected ::boost::remove_cv<T2>::type

还可以看到：

first_reference first() {return *this;}

first_const_reference first() const {return *this;}

second_reference second() {return *this;}

second_const_reference second() const {return *this;}

实际上道理是一样的。同时它还解决了构造函数中的这个问题：

compressed_pair_imp(first_param_type x, second_param_type y)

: first_type(x), second_type(y) {}

因为first_type、second_type为其基类，这样的调用才合法。

还有一个猜想就是如果T1是内置类型的话，比如说int，那么继承int会是合法的代码吗？实际上我们并不需要担心这个，因为int不会通过::boost::is_empty测试。boost::is_empty<int>::value将得到false，因此不会被编译器演绎到这一步。

[本文原创]相关连接：

1. 本文的Word工整版：http://ishare.iask.sina.com.cn/f/5144299.html

2. 关于空基类优化：http://user.qzone.qq.com/84638372/blog/1242484131

posted on 2009-05-18 11:09 董波阅读(1212) 评论(0) 编辑收藏引用

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

旷野的呼声

导航

留言簿(2)

随笔档案

阅读排行榜

评论排行榜

常用链接

统计

最新评论

【原创】boost.compressed_pair源码剖析

boost.compressed_pair源码剖析

意义

std::pair参考

boost.compressed_pair参考

boost.compressed_pair剖析

compressed_pair_switch

compressed_pair_imp

compressed_pair

其它重点

继承