首先需要说明的是,我是一个在职的学生,今年博士生二年级,所以我也需要 不断的学习,因此我希望今天的讲座是我和同学们之间的一个交流。
我先讲一下我的背景,这样可以解释我为什么会有这样的体会。首先讲一下我 个人的背景。我概括了一下,大致可以分为三个阶段。一个是在我读硕士的时候。我搞的是天气模式识别。这个是模式识别的一部分,在90年代初的时候很热的一个方向。当时我也学到了许多相关的东西,比如说神经网络。后来参加工作,我做了大约5年的开发。在这5年里面,我根本不认为我是在做研究,但是它使我打下了坚实的基础,特别是技能方面的基础,比如说编程动手方面。这还是让我觉得受益匪浅的。2000年的时候我开始转到研究这方面来,主要是阳老师带着。这个时候我作研究没有什么经验,处于一种摸索的阶段。当时我印象最深的是阳老师向我推荐了几本很经典的网络方面的书。因为那时我们不能有效的找到一些文献资料,很长的时间里面处于一种摸索阶段。后来慢慢的有了一些论文,就对做研究有了一些感觉。到了今年的上半年,因为有了一定的基础,可以学习一些研究的经验,慢慢的就把事业扩展开去了。其中对我影响比较深的是我和微软研究院一些人的接触。今年四月份的时候,我和微软研究院开始有一些交流活动,后来参加了一个国家科学部举办的一个培训。在这半年的时间,我学到了很多东西,处于一种学习阶段。我一直比较关注如何的更有效的开展研究工作,因为这是一个具有普遍性的问题。这就是我这两年的背景,下面我要讲到的许多东西都和我这些背景有关。
还有一个背景就是学科背景。并不是每一个学科它搞研究的方法都是差不多的,特别是对我们计算机学科来讲,它还有许多的特点。我们这个学科不仅是研究,更注重应用技术,尤其我们研究所的方向就是应用方面的。对于这个方面来说,有这样几个特点:发展快,研究成果转化快。这个特点是我们计算机学科所不同于其他学科的。我曾经和微软研究院的一个副院长交流的时候,他的一个观点很独特。他说,现在sci是国内评价一个人或一门学科最硬的指标,但是它对于我们这种学科是不适用的。为什么呢?因为我们这个学科发表东西特别快,比如说网络方面或者多媒体方面的,它可能有一个年会,而sci在年会之后的三年才进行收录。而三年过后,那个年会的创作高峰期已经过了。所以说计算机学科最有价值的东西往往不在sci里面。对于一些传统学科比如说物理或者化学,sci的评价更具参考价值。还有一个特点就是说计算机这个领域比较开放。所有信息可以通过各种途径找到,包括别人所作的研究成果,只要你用心去找,一定能找得到。这样就造成了大家的竞争,就说你很难超越别人。大家都在做,都做的很好,这就要求你的起点非常高。如果一个人单独做,那基本上是没戏的。就像刚才周老师介绍的许多文献,那都是人家几年的工作。你再看别人文献的时候,要注意到那时人家两三年前的工作,所以这个起点你一定要清楚。我们这个学科还有特点就是应用性强,工程性强。这个也是没有办法的,这样的话我们这个学科可能是应用方面比较强,后天理论方面可能不足,这也是每一个科研单位面临的问题。所以对我们来讲,需要相对的补充一些理论方面的知识。
下面我本来准备讲一下查资料的方法。开始准备的时候没有想到周老师会讲的这么好,我也就不再多讲了。我们做工作一定要有个好的起点,这个起点就是前人做的工作。站在前人的肩膀上,不见得是巨人,但你不能从头做起。
还有一个就是你扩大自己的知识面。现在的自然学科对话要求有开阔的知识面,这个也是难以平衡的,一个是深度,一个是广度。特别是在我们读书的阶段,一定要培养自己的知识面,因为以后参加工作以后,就可能没有那么多的精力和机会去开阔了。在读书的时候,和同学的交流,参加一些活动,阅读一些文献资料,这些都是开阔知识面的好机会。我觉得阅读好的论文和书籍是一个有效的方法。因为那些是人家做的一些很好的工作,对你来说是可以拿来直接用的,是很有效的一个捷径。还有就是如果你有机会接触到一些大师的话,要好好把握。大师往往能在一些地方给你重要的启发。我是很盼望能够经常见到一些大师,这样对我的帮助肯定特别大,因为他们身上有很多很多东西值得我学习,对于我们每个人都是这样。北大学生往往对于来北大的一些人不重视,他来他的,我做我的。其实很有可能他会改变你的人生,所以这种机会一定要好好把握。
还有就是培养自己看事物的深度。你们在座的研究生处于最能够到达事物深度的年龄段,对事物的认识一定要把握好,要勤于思考,联系事物。我举个例子来说。前几年我一直在做软件开发,我一直在想,面向对象的本质是什么,为什么这10年来OO的影响这么大,而且它的影响长盛不衰。你找一本教科书,它会告诉你面向对象的特性,但你要想一下,这样的说法有没有说服力。我在研究生期间读过有关分数维的书,我们现在看世界一维的一条线,二维的一个平面,三维一个立体,但是有些维数它是一个分数,比如说1.4维,它也能够来描述一些很有意思的现象,比如说好多分形图的维数就是分数维。这个可能和OO还没有联系。在分数维里面有很多特性,比如说自相似性,这在数学里面有几套等价的理论。比如说信息论,我们可以用信息量来衡量一个事物的复杂性,用信息里面的熵衡量,这个是整个IT比较奠基的东西。后来5月份的时候我给研究生上课,讲到composite的时候它就是用对象来描述事物,他有一定的自相似性,因为它在节点上又包含了抽象类父类的信息。那天我突然想到这个和OO其实有很多东西是相关的,因为OO的本质是描述事物之间的关系的,就是说好多对象可以用对象来说,其实他们之间有一定的相似性。像composite这种模式具有相当的普遍性,就是说它反应了现实生活中的好多模型。为什么OO现在能这么样的反应现实生活中的特征,这两者之间是相关的。也许我说的不是很精确。但是我后来确实把两件事情联系起来,那是我正在课堂上讲授composite模式的时候突然想到的。我说这个事情并不是吹捧我自己,我是说当你经常的深层次的思考一些问题的话,会有一些意外的收获。不要总是停留在表面上,因为我们将来要进行研究工作,如果你做的研究比较深的话,经过思考之后你会有一些发现,这些发现对你将来的工作会有很大的帮助。
还有研究工作的一个起点就是对领域的认知。我们每一个人在应用领域里面不见得完全相同,但作为研究起点起码对领域应该有几点认知。一个是从理解中的认知,它的一些应用基础,它解决了一些什么样的问题,这个是需要认知的。还有一个就是国内外的形式,比如说在学术研究领域里面有那些很好的年会,有那些杂志。这些知识绝对是有帮助的。