2.Intel Thread Checker
非常不错的一个工具,如果你用过上面性能分析的工具,这个上手也是比较容易的,界面和使用风格上保持一致,简单说这个工具也是对加锁解锁的数据收集和对死锁的检测,将程序运行中发生的所有逻辑关系(读写操作)和认为死锁现象(时间过长)体现给程序员,让大家进行分析这些可能会导致deadlock、data races等问题。
基本操作:
(1) 选 New Project,在 New Project 对话框中,在 Category 下拉框里选择 Threading Wizards ,在下面的 List View 中选择 Intel? Thread Checker Wizard ,然后 OK 。
(2) 选择你想要检测的程序,一定是Debug的,可以查看源代码,这个应该不是什么要求。
(3) Run Activity:按工具栏上的绿色三角按钮就行了,一般会自动运行程序,这时你执行你想要的操作。另外,对于死锁问题,可以设定时间,在Configure---Options---Cpllector--- Synchronization中进行设定,来定义你认为作为死锁的最小时间设定。
(4) 运行结束后生成很多表,然后就是我们自己分析了。
下面就简要说明一下这些表的作用和一些个人的使用心得:
上图是运行程序后生成的主界面(Diagnostics),以及源码界面(Source View),这里最有用的信息主要是Short Descption和Descption这两个列表内容,第一个表主要是对该操作可能导致的并行问题的归类,比如data race或deadlock等,如果对此类错误不是很理解,可以点击右键在菜单中查看Diagnostics Help,会对此类型错误进行一个概括的介绍,如下图所示(介绍读写资源竞争):
如上是我在多线程程序中的一个数据竞争的现象的帮助文档说明,其逻辑关系是Read该数据后Write该数据,这种情况则可能会导致Data Race的问题,这在点上,Thread Checker则会把程序运行中的各种出现的逻辑情况都罗列并定位到代码所在行。
上图是我在程序中的一个死锁问题的帮助文档的说明,给出可能的死锁原因,正是我在程序中用到了WaitForSingleObject()函数,导致了线程函数和进程条死锁的产生。同时可以定位到死锁线程的源代码,这时候,就需要我们仔细研究死锁的原因了。下图是我查看死锁详细描述定位到源代码的界面(可见高亮显示的两个部分正是导致我线程死锁的原因:创建后等待该线程,而此时线程调用MFC进程条,而进程条又在等该线程):
对于Descption中的内容,则会阐述这个问题的具体内容,可以定位到具体代码行,双击可以切换到代码,这时大家可以分析这行代码了,所示重点怀疑对象了,当然案件的真相和真凶则需要各位“侦探”来判断啦。
以上是我对Data race和deadlock的两个问题程序进行的简单的分析报告,根据Intel对该工具的介绍和相关资料,该工具主要就是针对这两种情况进行分析。一般并行运算主要就是这两种问题啦。(看资料应该可以做出这个判断)
总体来说该工具最有用的就是如上的两个表的数据分析啦,当然还有另外两个表,一个是Stack Traces,这个主要是对堆栈跟踪,可以发现该程序堆栈,看一下一共创建了多少个线程之类的信息。另外一个则是图表统计,统计检测到的问题的一个堆叠柱状图。感觉用处不大。下图是堆栈跟踪图:
3.Intel Thread Profile
正如Intel在flash演示中介绍的那样,这款工具的作用就是:improved thread application performance.当然坦白的说,要想让工具自动实现这点不像说的那么简单,准确来说,它的作用应该是帮助我们提高线程应用的性能,重点在“帮助”上。相对以上两个工具的作用和定位,感觉这款工具目前的功能和它自身的定位还是有一些差距的,没有很多像上面两个工具提供一些分析的作用,而只是对代码多线程的一个统计和图形的直观显示,毕竟,要想让工具自己找到优化方案是有点强人所难的。还有感觉网上对这款工具的使用介绍也不是很多,几乎没有,感觉不想上面两款软件应用的广泛或者大家的代码还没有达到这一阶段的要求吧。操作方法还是保持的一致风格,不用培训,直接上手。
基本操作:
(1) 选择你想要优化的程序,Debug版本可以调试到源代码。在这点上程序支持普通模式(支持Windows API等)和OpenMP专有两个模式。这里选择第一个了,第二个不会用啊。
(2) 在Configure中可以配置一些选项,查看该优化程序的Dependence等,推荐还是默认吧,个人认为足够我们用的了。
(3) 点击Finish运行你的程序,运行你的多线程程序吧,然后在运行你需要检测的程序功能后点击结束。
(4) 这时候则会生成一系列表格图形让大家分析。
下面我来简单介绍一下主要表的功能吧,都是一些很基本的方法,刚刚上手,这个工具的使用教程网上不多,还没有研究很深入,需要以后在多线程开发中学以致用才是关键。
TimeLine表:顾名思义就是时间线的统计,如下表所示,在这个表中,统计了所有线程按照时间轴的状态:
上图所示,在这个程序中,我创建了三个显示,在加上主线程,一共四个,在这个时间轴中显示了这四个线程从生到死的每一个瞬间,对于这些颜色,在右侧会有说明,比较重要的比如绿色代表活动状态,浅绿代表等待。橙色代表至少一个线程运行,灰色表示没有此时没有线程在运行。这样大家可以很清楚的看到每一个线程的全部状态,算是得到了程序线程运行的最直接、最表面的第一手资料了。当然秉承的VTune的一惯风格,双击可以跟踪到源代码哦(如果你有的话)。
Profile Filter表:对线程各种状态的一个归类,对此还不是很熟悉,是对时间表的各种状态的一个统计直方图,如下表所示:
上图是对刚才那个时间表中各种线程各种状态花费时间一个统计图对比,灰色的是非活跃阶段,橙色则是有一个线程活动的时间,统计出各个状态的一个百分比。可以看出上面有许多不同的显示方式,没有太多研究,应该是按照不同的分类方式来对下面时间表的一个体现,大家可以按照自己的爱好去选择吧。
另外还有一个Summary表格,是对整个程序运行的一个统计,在这个表格中数据要比图表详细很多,毕竟图表只是一个通过图形将一个重点数据更加直观的表现,信息量相对数据来说要小很多,在这个摘要中,创建线程数,状态都统计成表格,图像如下:
总体来说,我对这个工具研究的时间不是很多,也不是很了解,只是入门了,以后用到的时候在发挥啦,呵呵。这款软件就是将各个线程状态进行一个统计和时间表现给大家,大家可以发现在某一时间多线程性能可能会有不尽如意的地方或还有很多提升空间,这样大家可以抓住本质,重点来最有效的优化我们的并行程序。