最近也不知道在干什么,每天没精打采的,写点代码,有时候是垃圾代码,有时候精妙的代码,呵呵可是不是我的原创从
HACKER'S DELIGHT上copy来的东西,至于想干什么,我自己现在都有点不知道。究竟该去读书,还是继续上班也没个定数,反正心里很乱。要尽快下个决定,时间不等人!
最近在做数据挖掘中的web usage mining,关于apache
log的东西,准备这次用C写了,恶心的java,感这种事情就是疯子的想法,我上次的一个相关性分析和聚类的模型使用Java写的,让我恼火至极,可能
我比较懒学不好Java的思想,还是写C,写汇编比较好玩,呵呵,我还是比较擅长和机器打交道,不适合和人说话,呵呵因为OO太像人类说话的思维了,没有
机器的那种优美的感觉,要是汇编高手的话,就会有和“尤尼5号”谈话的感觉,很早的一部机器人电影了,感觉非常的好,呵呵,可能Java然我感觉不到我在
控制计算机,感觉不到控制一堆破铜烂铁硅,所以我学不好Java吧,不过,存在就是合理的,Java的确很优秀,以后也要好好学习一下。
做Web log
mining的时候现在最大的问题就是运算效率,现在数据量小,要是以后的log数据每天上了几百GB,呵呵,几百GB的文本的有多少行,呵呵至少是分文
件的,不过就算是10GB的文本操作起来,统计起来,挖掘起来也是个要命的事情,而且极其要命,这个和在学校做实验不一样,在学校做实验可能50行的数据
就算不错了,根本不会去考虑那么大的数据,现在不同了,在公司要做东西,唉,上班是很无聊的事情,还是那句话真想去读Ph.D,而且是数学Ph.D、计算
机Ph.D一起读,朕相信自己能力!
web log
mining的paper看了不少,但是做的很牛的公司却不知道都在干什么,比如google一定也在做,不过分析什么东西就不知道了,手段更是不得而
知,天晓得他们怎么想的,看了一堆paper,照着paper写代码呵呵这可真是一种挑战。从国外到国内大家分析的都是那一点东西,key
page,权威页面,访问统计,URL聚类,URL关联,etc……不过这些东西写起来还真的是更像实验品而不能够做成产品,呵呵,究竟什么是产品,老子
也不知道,反正每天听一帮傻逼谈论的头头是道,那天听见他们说:
产品@#¥……%&……#%@&,
操作系统¥%#……!@&*(#……,
算法&……#%*!@&*(¥!,
挖掘&*……#@)(*,
web OS&
*(……#&*#@,靠,都是疯子,什么叫做狗屁不懂,什么叫半吊子,老子见识了。我虽然学的不好,但我不出来到处乱讲啊,就是认真学就是了。可
是他们,明明没学过也能瞎他妈的胡编乱造的叭叭,真让我哭笑不得。那天听见一个惊天之语:“算法就是做小学应用题的东西”。哇哈哈哈,笑的我真不想在说什
么了,这也太搞了吧,操,一群不学无术的家伙!!