【原创】技术系列之线程（一）

作者：CppExplore 网址：http://www.cppblog.com/CppExplore/
废话不多说，详细介绍使用线程的优点好处请参考baidu、google。
一、线程使用场景。使用线程的方式大致有两种：
（1）流水线方式。根据业务特点，将一个流程的处理分割成多个线程，形成流水线的处理方式。产生的结果:延长单一流程的处理时间，提高系统整体的吞吐能力。
（2）线程池方式。针对处理时间比较长且没有内蕴状态的线程，使用线程池方式分流消息，加快对线程消息的处理，避免其成为系统瓶颈。
线程使用的关键是线程消息队列、线程锁、智能指针的使用。其中以线程消息队列最为重要。

二、线程消息队列描述。所谓线程消息队列，就是一个普通的循环队列（其它数据结构也未尝不可，具体内容请参考数据结构课本）加上“多生产者－单（多）消费者的PV操作”（详细内容请参考操作系统课本）。流水线方式中的线程是单消费者，线程池方式中的线程是多消费者。
为了后文更好的描述问题，作如下说明：
（1）假定循环队列CircleQueue中,存放的消息指针类型是MyMSG *,入队操作EnQueue,出队操作DeQueue，判断队满IsQueueFull，判断队空IsQueueEmpty。
（2）生产者消费者：生产者线程生产消息(MyMSG *)，放在一个空缓冲区(CircleQueue)中，供消费者线程消费，生产者生产消息(EnQueue)，如果缓冲区满(IsQueueFull)，则被阻塞，消费者消费消息(DeQueue)，如果缓冲区空(IsQueueEmpty)，则被阻塞。线程消息队列就是生产者消费者问题中的缓冲区，而它的生产者是不限定的，任何线程都可以作为生产者向其中进行EnQueue操作，消费线程则可能是一个，也可能是多个。因此对循环队列的任何操作都要加锁，以保证线程安全。
PV操作和锁机制的基础都是信号量。下面列出posix标准中给出的有关信号量的操作:

#include <semaphore.h>

int sem_init(sem_t *sem, int pshared, unsigned int value);

int sem_wait(sem_t * sem);

int sem_trywait(sem_t * sem);

int sem_post(sem_t * sem);

int sem_getvalue(sem_t * sem, int * sval);

int sem_destroy(sem_t * sem);

各个函数的详细用法，请在linux/unix上查看man。
三、线程消息队列实现。基于以上讨论，下面给出线程消息队列的实现(仅为了说明问题，非标准可运行代码)。

class ThreadQueue

{

CircleQueue * queue;

int nFull;

int nEmpty;

sem_t lock;

sem_t fullCond;

sem_t emptyCond

};

void createThreadQueue()

{

createCircleQueue(queue);

nFull=0;

nEmpty=0;

sem_ini(&lock,0,1);

sem_init(&fullCond,0,0);

sem_init(&emptyCond,0,0);

}

void putq(MyMSG * msg)

{

sem_wait(&lock);

if(IsQueueFull(queue))

{

nFull++;

sem_post(&lock);

sem_wait(&fullCond);

sem_wait(&lock);

nFull--;

}

EnQueue(queue,msg);

if(nEmpty>0)

{

sem_post(&emptyCond);

}

sem_post(&lock);

}

void getq(MyMSG * msg)

{

sem_wait(&lock);

if(IsQueueEmpty(queue))

{

nEmpty++;

sem_post(&lock);

sem_wait(&emptyCond);

sem_wait(&lock);

nEmpty--;

}

DeQueue(msg);

if(nFull>0)

{

sem_post(&fullCond);

}

sem_post(&lock);

}

void destroyThreadQueue()

{

destroyCircleQueue(queue);

sem_destroy(&lock);

sem_destroy(&fullCond);

sem_destroy(&emptyCond);

}

四、线程消息队列使用说明。将线程和线程消息队列封装在一起，形成带有消息队列的线程，其它线程向该线程的消息队列插入消息，本线程取消息处理，之后再向其它线程的消息队列插入消息，如此形成流水线运行方式。线程的创建可以使用posix的pthread_create函数，或者boost的boost::thread。具体使用请查看相关文档。另ACE中的ACE_Task实现了带有消息队列的线程，可以直接使用。
五、线程锁描述。线程锁，应该都很熟悉，通常的实现以mutex面目示人。假设实现后的操作有：加锁lock,解锁unlock。
所谓线程锁就是同一时间只能有一个线程拥有的锁。当一个线程通过lock获得线程锁以后，在该线程持有该锁的期间，其它进行获取锁操作的线程只能阻塞在lock操作处，但该线程可以继续对锁进行lock操作而不阻塞。
六、线程锁实现

class mutex

{

sem_t lock;

sem_t used;

int nInOwner;

pthread_t owner;

};

mutex()

{

sem_init(&lock,0,1);

sem_init(&used,0,0);

owner=NULL;

nInOwner=0;

}

void lock()

{

pthread_t curThread=pthread_self();

sem_wait(&lock);

if(pthread_equal(owner,NULL))

{

owner=curThread;

}

else if(pthread_equal(curThread,owner)==0)

{

sem_post(&lock);

sem_wait(&used);

sem_wait(&lock);

owner=curThread;

}

nInOwner++;

sem_post(&lock);

}

void unlock()

{

sem_wait(&lock);

if(--nInOwner==0)

{

owner=NULL;

nInOwner=0;

sem_post(&used);

}

sem_post(&lock);

}

~mutex()

{

sem_destroy(&lock);

sem_destroy(&used);

}

七、线程锁使用说明。系统设计中应该尽量减少锁的使用。但有的时候无法避免，这时就是mutex登场的时候了。mutex的实现，linux下有pthread_mutex_t，ACE里有ACE_Thread_Mutex，boost里有boost::mutex。为了高效的操作可以进一步实现出其它不同的锁机制，比如常见的读写锁,条件锁，不再多说，有兴趣可以自己去实现，详细可以参考操作系统课本。另linux/ACE/boost中均有实现。
lock和unlock要成对使用，但是很多情况下，一个函数有很多出口，再加上异常的情况，需要针对一个lock写很多unlock，这样不仅容易遗漏unlock，而且代码也变得很丑陋。ACE中提供了Guard封装mutex，使用起来比较方便，使用的时候不需要关心锁的释放，具体请看ACE。
也可以自己实现这种类Guard的功能。代码如下：

class Guard

{

mutex *m_mutex;

};

Guard(mutex *lock):m_mutex(lock)

{

m_mutex->lock();

}

~Guard()

{

m_mutex->unlock();

}

使用的时候只需要在函数开始处写std::auto_ptr<Guard> guard(new Guard(lock)) ;这属于智能指针使用的一个小技巧。
八、使用智能指针的需求。在线程池方式中，为了去掉内蕴状态，线程间不得不传递对象指针，这样很难判断指针的生命周期，难以找到释放内存空间的合适位置。智能指针完美解决了这个问题。boost中有boost::shared_ptr,ACE中有ACE_Refcounted_Auto_Ptr。本遍主要讲述线程相关，智能指针不再展开。
九、线程间消息传递框架。
（1）面向过程的消息传递。c语言常用方式。消息以结构体的形式定义。

enum MsgType

{

CONCRETE_MSG1=1,

CONCRETE_MSG2=2

};

struct MyMsg

{

MsgType type;

union union_st

{

concreteMsg1 *msg1;

concreteMsg2 *msg2;

}msg;

};

concreteMsg1 和concreteMsg2 的详细结构不再列出。消息发送线程构建正确的具体消息，指明正确的消息类型，进一步构建正确的MyMsg，发送到线程消息队列。消息处理线程在消息队列头端循环getq，取出消息，根据消息类型调用相应的方法处理。
（2）面向对象的消息传递。线程消息队列中存储command模式中ICommand类型的指针。消息发送线程实例化具体的command，消息处理线程取出command执行command的execute方法。
缺点是：command比较多的时候，会生成大量的类文件，代码不够紧凑。
优点则是可以方便的增加command而不需要过多改动已有代码。

posted on 2008-01-15 10:55 cppexplore 阅读(7318) 评论(8) 编辑收藏引用

# re: 【原创】系统设计之线程漫谈 2008-01-18 01:33 golden

thanks!

a perfect article about thread and develepent

回复更多评论

# re: 【原创】系统设计之线程漫谈 2008-03-05 12:36 陈子文

不好意思,转载忘了标注回复更多评论

# re: 【原创】系统设计之线程漫谈[未登录] 2008-03-05 12:55 cppexplore

@陈子文
：）
转载请著名下多多交流！回复更多评论

# re: 【原创】技术系列之线程（一） 2008-10-23 15:32 cui

你这个好像有点儿矛盾啊..

在你的线程（一）中说信号量是比较重量级的互斥体. 为什么这里又用信号量来实现互斥锁以提高性能呢? 回复更多评论

# re: 【原创】技术系列之线程（一） 2008-10-23 15:39 cppexplore

@cui
呵呵，那是线程（二）中说的。
开始写文章有不少错误的认识，后来对问题的看法再不停的调整，但旧有的文章中有的错误说法一直没有更正。这篇文章里的信号量就是一例。回复更多评论

# re: 【原创】技术系列之线程（一） 2008-10-23 16:28 cui

@cppexplore

^_^ 回复更多评论

# re: 【原创】技术系列之线程（一） 2008-12-26 14:28 ssharry

这里恐怕有问题，如果队列为空，多个消息同时进入，会导致信号量被释放多次。

nEmpty--

应放入put中。
void putq(MyMSG * msg)
{
sem_wait(&lock);
if(IsQueueFull(queue))
{
nFull++;
sem_post(&lock);
sem_wait(&fullCond);
sem_wait(&lock);
nFull--;
}
EnQueue(queue,msg);
if(nEmpty>0)
{
sem_post(&emptyCond);
}
sem_post(&lock);
}
void getq(MyMSG * msg)
{
sem_wait(&lock);
if(IsQueueEmpty(queue))
{
nEmpty++;
sem_post(&lock);
sem_wait(&emptyCond);
sem_wait(&lock);
nEmpty--;
}
DeQueue(msg);
if(nFull>0)
{
sem_post(&fullCond);
}
sem_post(&lock);
} 回复更多评论

# re: 【原创】技术系列之线程（一）[未登录] 2008-12-26 18:44 cppexplore

@ssharry
可能是吧。这篇文章里东西都没实用的价值，就是理论上想象一下而已，呵呵。http://www.cppblog.com/CppExplore/archive/2008/03/20/44949.html这个里面的才是实际可用的。回复更多评论

刷新评论列表

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

CppExplore

公告

常用链接

留言簿(19)

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜

评论