在多核的平台上开发并行化的程序,必须合理地利用系统的资源 - 如与内核数目相匹配的线程,内存的合理访问次序,最大化重用缓存。有时候用户使用(系统)低级的应用接口创建、管理线程,很难保证是否程序处于最佳状态。
Intel Thread Building Blocks (TBB) 很好地解决了上述问题:
- TBB提供C++模版库,用户不必关注线程,而专注任务本身。
- 抽象层仅需很少的接口代码,性能上毫不逊色。
- 灵活地适合不同的多核平台。
- 线程库的接口适合于跨平台的移植(Linux, Windows, Mac)
- 支持的C++编译器 – Microsoft, GNU and Intel
主要的功能:
1)通用的并行算法
循环的并行:
parallel_for, parallel_reduce – 相对独立的循环层
parallel_scan – 依赖于上一层的结果
流的并行算法
parallel_while – 用于非结构化的流或堆
pipeline - 对流水线的每一阶段并行,有效使用缓存
并行排序
parallel_sort – 并行快速排序,调用了parallel_for
2)任务调度者
管理线程池,及隐藏本地线程复杂度
并行算法的实现由任务调度者的接口完成
任务调度者的设计考虑到本地线程的并行所引起的性能问题
3)并行容器
concurrent_hash_map
concurrent_vector
concurrent_queue
4)同步原语
atomic
mutex
spin_mutex – 适合于较小的敏感区域
queuing_mutex – 线程按次序等待(获得)一个锁
spin_rw_mutex
queuing_rw_mutex
说明:使用read-writer mutex允许对多线程开放”读”操作
5)高性能的内存申请
使用TBB的allocator 代替 C语言的 malloc/realloc/free 调用
使用TBB的allocator 代替 C++语言的 new/delete 操作
使用TBB的例子 – task
- #include “tbb/task_scheduler_init.h”
- #include “tbb/task.h”
- using namespace tbb;
- class ThisIsATask: public task {
- public:
- task* execute () {
- WORK ();
- return NULL;
- }
- };
-
- class MyRootTask: public task {
- public:
- task* execute () {
- for (int i=0; i <N; i++) {
- task& my_task =
- *new (task::allocate_additional_child_of (*this))
- ThisIsATask ();
- spawn (my_task);
- }
- wait_for_all ();
- return NULL;
- }
- };
-
- int main () {
- task_scheduler_init my_tbb;
- task& my_root =
- *new (task::allocate_root()) MyRootTask ();
- my_root.set_ref_count (1);
- task::spawn_root_and_wait (my_root);
- return 0;
- }
posted on 2010-11-10 14:49
老马驿站 阅读(710)
评论(0) 编辑 收藏 引用 所属分类:
c++