oldworm

云计算实践2

上一篇《基于云计算的价格查询实现》就算是云计算实践1吧，所以这篇就叫《云计算实践2》。其实今年开始研究云计算有一段时间了，约3个月前研究md5破解(http://www.shprog.com/HashCrack.aspx)，那个项目就是选来玩云计算的，当时觉得md5破解这个小项目好玩，逻辑很简单，密码字母组合可长可短，规模可大可小，1台机器不嫌少，1万台不嫌多，所以就选中了它，没想到第一个md5破解版本后来演变成了主要是密码数据库的制造，虽然第一版没有做成标准云计算，但也算有个结果，而且存储效率、制造速度还是令人满意的，也就是说那个项目只是云计算研究的副产品，我的本意并不是想做一个md5破解或者qq密码破解，但结果就产生了这么一个产品，也算是努力了一个多月的结果，期间对hash算法、存储格式等绞尽脑汁思考了很久，也因此对云计算倒是考虑得不多，最终偏离了大目标。

好在后续研究基于云计算的价格查询终于又回到云计算上来了，而且仿照google的map/reduce做了一个标准的jobserver + tasknode形式的实现，虽然兄弟们未必对价格查询项目看好，但对这个基于windows实现的云计算框架还是一致看好的，价格查询项目第一阶段基本完成预定目标，所以昨天我又将以前md5破解的东西写了一个在线版的dll，拿到云计算框架里面来试图云破解，不过这个不是特别成功，主要是即时计算耗时有些多，平均1个task计算1亿组合大约需要30秒，因此在我现在只有2个点参与运算的情况下遍历很大区间是很耗时的，也因此我没有做一个在线云破解md5的页面，这个工作作为研究性探索也只在我的控制端下了几个云计算的任务就告一段落，今后将致力于其他更实用的云计算实践。

为了做这第二个云计算的dll，我将原来定义的jobtask接口（可参见《基于云计算的价格查询实现》）修改了一下，不再使用原来的c风格接口，直接改成c++风格了，如下：

interface IJobTask

{

virtual HMODULE free() = 0;

//初始化函数，部署环境等

virtual bool init(bool tasknode) = 0;

//分割函数，分割输入

virtual size_t split(const char *input, size_t len, std::vector<CAutoBuffer *> &vbuf) = 0;

//task执行函数

virtual bool map(const char *cmdline, CAutoBuffer &buf, CAutoBuffer &ibuf) = 0;

//reduce打包输出函数

virtual bool reduce(std::vector<CAutoBuffer *> &vbuf, CAutoBuffer &buf) = 0;

//获取执行错误

virtual char *geterror() = 0;

};

有朋友批评我，说我的接口使用stl容器，使用自定义类CAutoBuffer等不好，我以前也是这么跟别人讲的，接口不要使用这些东西，但看了google的map/reduce实现用的都是MapInput、ReduceInput之后我改变了看法，暂时就这样定义吧，大不了各个dll都用同一版本的vc编译就是了，也没有什么大不了的，如果不行整体升级一下总可以吧，为了短时间盯住主要目标，也只能大刀阔斧不考虑过多细节了，这也算是一个平衡的结果吧。

这次修改除了修改了接口，简化了实现之外，还实现了一些特性，动态卸载，上一个版本装入之后就不卸载了，要关闭exe才能卸载这些dll，所以无法热更新，这个版本实现动态卸载之后就支持热更新了，关键就在那个free函数，

virtual HMODULE free() = 0;

该函数实例如下：

virtual HMODULE free()

{

HMODULE h = m_hlib;

delete this;

return h;

// if(h) FreeLibrary(h); 这里释放是有问题的，所以不能这样释放

}

在外部调用的地方

FreeLibrary(jf->free());

这样就实现了动态卸载dll的功能

用上云计算布局的价格查询的这段时间，还是有一些经验教训的，基于这种相隔很远，网络条件差别很大的机器布局的云计算环境，可靠性是很差的，大多数时间可能反应还是比较快，但有的时候反应就特别慢，可能网络延时会相差200ms，或者500ms，或者更多，我特意记录了每个task的实际执行时间和包括网络传输在内的总时间，就是从这两个时间看出差距的，所以如果要基于这种环境做实时性很高的计算还是不适合的，如果对节点反馈实时性要求很高，那一定要布置类似局域网形式的计算环境，点点反馈时间1ms内，而且响应稳定不易受到影响。此外磁盘Log时间是不定的，我记录最后一个task完成到job完成之间调用了两次WriteLog，对大多数job来说，最后一个完成的task的时间和job完成的时间一致，但偶尔有少数job时间和最后一个完成的task时间差别很大，甚至有超过1s的，原先没有这么精细的测量，这次在jobserver写了很多log，起初是为了找错误，后来是为了追踪job和task执行，倒是意外的发现了一些问题，也获得了一些意外的收获。

云计算好啊，早年我做过一个远程控制的程序，当时做了一条命令broadcast，可以广播其他任意命令，当时很得意于这个设计，也有指挥千军万马的感觉，但当时各自执行，结果并不汇总，各个任务完全独立。现在给云计算环境下达一个任务，也有同样的感觉，可能对使用我的价格查询(http://www.oldworm.com/pps.aspx)的用户或者使用google查询的用户根本感觉不到，他这一个查询提交下去后面有那么多机器联动运算，但作为开发人员，真真切切的看到后面那么多机器在执行任务，真的是很爽的一件事情，一起看下我两台机器联动执行任务的场面共勉吧：

图看得不是很清楚，实际上第一个taskmanager是一台机器，另一个taskmanager是另一台机器，那两个都是在远程桌面里面运行的，下面ie是我的网页，可以看到我在网页里面查询nokia的时候，上面两台机器的tasknodeapp里面就接收到任务并执行了任务，那个tasknodeapp是我临时用来演示的，事实上里面都是调用tasknode.dll，tasknode的主要任务都是tasknode.dll执行的，为这个dll做了好几个不同的容器，有service的有普通mfc的还有console的，这也是我的得意设计哦。

未来还将继续云计算实践，期待有相同兴趣爱好的朋友一起交流。

posted @ 2010-10-03 14:23 袁斌阅读(357) | 评论 (0) | 编辑收藏

定时器模块改造

之前的文章讲过，我设计的网络框架有几组线程，分别是io、异步、同步、定时器，各个不同应用server几组线程组合形式不尽相同，简单的可只有io线程，复杂一点的可io+同步，更复杂一点的也可io+同步+异步+定时器，总之我以几组线程的自由组合方式应付各种应用，在我负责的server全是这一套框架实现的，不管是支持几万人连接的服务器，还是只有几个用户连接的内部服务器，这套框架也算是久经考验，稳定运行多年，内部使用也非常简单，如给sync线程组发一个消息只要PostSyncEvent，如果要给异步线程发一个消息只要发PostAsyncEvent，虽然只能开发的时候确定哪个任务在哪组线程执行，但修改还是非常方便的，执行体就是一组这样的函数：

OnSyncEvent(DWORD dwEvent, DWORD wParam, DWORD lParam);

OnAsyncEvent(DWORD dwEvent, DWORD wParam, DWORD lParam);

一眼就知道是在哪个线程组里面执行，当然有的线程组是一个线程，有的线程组是多个，这涉及到有的资源是不是要加锁，有经验的开发人员很容易理解。

说了一下框架才容易理解我的问题，之前定时器是一个独立的线程组，同步线程组、异步线程组、io组都没有定时器功能，定时器触发后要发送消息到相应线程组，有的要发给异步线程组，有的要发给同步线程组，这就会引起线程切换，这是问题之一，还有一个问题，之前的定时器是由windows的时钟队列实现的，这个定时器优点是很明显的，定时精确，功能强大，参数众多，独立线程组，但也有很明显的问题，如果要删除一个定时器则有线程依赖，就是要在定时器线程才能删除定时器，这个依赖约束很大，也很容易引起问题，用起来很不方便，使得一些资源的释放不能够即时进行。正因为有这么些问题，也为了使得时钟模块更容易移植，我设计了一个新时钟模块，为实现以下目标：

1、无线程依赖，随便调用者在哪个线程调用都可删除指定的定时器。

2、和事件消息集成在一个线程内，实现无需切换的定时器功能，这样主线程、同步线程组、异步线程组都可在内部处理定时器消息，无需单独的定时器线程辅助，方便很多。

为实现以上目标，我引入了libevent里面的minheap管理定时器，并根据之前管理事件的处理办法，继续使用iocp队列管理线程消息，在每个线程组用iocp管理事件，根据最短触发的定时器计算wait时间，这样就在同一组线程内实现了定时器和事件合并处理，当然实现方法有很多，也可用iocp+WaitableTimer等，也可用apc，但那些实现的windows烙印都太深刻，虽然精度更高，实现更容易，我用minheap+iocp队列方式的实现相对来说对windows的依赖较少，因为替换一个iocp队列处理事件是很容易的，这样也方便移植和复用代码。经这样修改之后，各个线程组包括主线程都可处理定时器和事件消息，也使得以前鸡肋式的主线程终于可当同步线程发挥作用，以前的定时器线程组也不一定需要了，既减少了线程，也减少了切换，现在各个线程组（包括主线程）都有完全一致的消息处理和时钟处理函数。

事件函数：

OnTimerEvent(DWORD dwEvent, DWORD wParam, DWORD lParam);

OnSyncEvent(DWORD dwEvent, DWORD wParam, DWORD lParam);

OnAsyncEvent(DWORD dwEvent, DWORD wParam, DWORD lParam);

OnServiceEvent(DWORD dwEvent, DWORD wParam, DWORD lParam);

定时器函数：

OnTimerTimer(TlsInfo *ptls, EventTimer *et);

OnSyncTimer(TlsInfo *ptls, EventTimer *et);

OnAsyncTimer(TlsInfo *ptls, EventTimer *et);

OnIoTimer(TlsInfo *ptls, EventTimer *et);

OnServiceTimer(TlsInfo *ptls, EventTimer *et);

可以给线程组增加定时器删除定时器

AddTimer、AddSyncTimer、AddAsyncTimer、AddServiceTimer、AddIoTimer

DelTimer、DelSyncTimer、DelAsyncTimer、DelServiceTimer、DelIoTimer

可给各线程组发消息

PostTimerEvent、PostSyncEvent、PostAsyncEvent、PostServiceEvent

这套框架是我多年服务器端开发的得意之作，体现了我简洁实用的设计思想，用起来非常方便，可任意组合，适应各种需求的应用，由于除主线程之外的io线程组、同步线程组、异步线程组、定时器线程都是可以关、开1个、开多个，所以组合非常灵活，开1个可当同步线程，开多个可当异步线程（内部抢资源），关闭就不存在该组线程，即使是io线程组也是可关的，这样就使得这套框架不仅仅用在标准server上，就算是当作一般的消息队列服务器也没问题，高度的灵活性使得这套框架可适应各种规模的应用，这次对定时器的改造使得这种组合更灵活，虽然现在的实现方法定时器的精度有一些下降，但瑕不掩瑜，这样改造之后功能无疑是更强大了。

posted @ 2010-10-03 14:23 袁斌阅读(701) | 评论 (0) | 编辑收藏

实用云计算环境简述

如今it领域没听说过云计算的绝对是out了，虽然大家都知道云计算，虽然很多高校很多专业都开设了云计算专业，虽然很多人都在讨论云计算，虽然也有少数人走在了应用云计算的前列，然而，可悲的是，大多数人对云计算的认识仅限于amazon、google、microsoft、ibm有能力架设云计算环境，其他公司都靠边，甚至唯他们的云计算才叫云计算，别的企业根本不可能做云计算，各级政府部门最搞笑了，动不动花多少钱引进某某云计算环境，填补某某空白，多少cpu多少机器每秒多少万亿次计算，最终是不是一堆浪费电力的摆设也没有人知道，也没人去过问。

略感欣慰的是，很多企业都在务实地部署自己的云计算环境，大如腾讯、淘宝、百度、小如我们这样刚成立的小公司，其实要部署一个私有云计算环境并没有那么难，以我个人的经验来看，如果有一个精干的小团队，几个人一个月部署一个私有云计算环境是完全可能可行的。在我看来，所谓云计算就是分布式存储+分布式计算，不局限于底下os是win还是*nix，也不局限于是局域网环境还是广域网环境，也不管上面跑的是c++的程序还是javascript的程序，下面简单介绍下我设计的一个即时查询价格的云计算体系：

我一直在win下开发，win用得非常熟练，所以我把云计算环境部署在windows之上，当然也考虑到windows的机器众多，tasknode可轻易找到非常多的目标机器，我部署的云计算环境主要分两类节点，jobserver和tasknode，jobserver主管任务切割、任务调度，tasknode是计算节点。另外还有一些节点，jobowner可连接jobserver并提交任务，并可查询该任务的执行情况，admin可连接jobserver查询jobserver的状态。

其实这些上篇博客已经写过，我再讲的详细一点，看具体的执行情况，首先jobowner给jobserver提交package，这个package是一个zip文件，包含一组文件，jobowner提交package之后jobserver会根据约定的规则管理package，并在jobserver展开该package，如下：

Jobowner连到jobserver之后，发出如下的命令到jobserver

0x49 0x0 0x0 0x0 0x2 0x0 0xb 0x0 127.0.0.1 0x0 ppsget.dll 0x0

{type:[0,1,2,3,4],rmax:5,wb:"pc",text:"诺基亚 e63"} 0x0

上面是用我设计的一种混合显示格式显示的包数据，可以看到里面带上了ppsget.dll，这就是指定包内部名，其实还可以这样ppsget.dll:getpage，如此一个dll就可支持多个IJobTask输出，getpage只是获得其中一个IJobTask接口（关于IJobTask接口参考上一篇云计算实践2的文章）。具体命令是json格式，主要是为了方便信息传输和解析。Jobserver接收到该命令之后，调用ppsget.dll的IJobTask接口中的split函数，将该任务分解，之后调度Tasknode执行，tasknode收到jobserver发过来的任务之后，检查包名称，如果缺少就会主动向jobserver要求发送相应的包，并进行部署，待部署完成之后从包获取指定的IJobTask接口，执行该接口的map函数，将结果按照约定的格式发给jobserver，最后由jobserver调用IJobTask中的reduce函数进行打包，最后将结果发给jobowner并记录相关Log。

上图中还可看到一个HashCrackCloud.dll，这是另一个云计算环境下破解md5密码的dll，这个上篇文章也写了一下，这里就不详述了。

为使得tasknode可适应各种机器环境，我把tasknode设计为一个dll，该dll内部自己管理消息及任务执行，该dll可被加载到各种容器进程（如gui进程、console进程、service进程）等执行，看下我的tasknode和它的容器进程：

这也算是我的得意设计吧，这样设计的tasknode在windows系统下的确具有很高的灵活性。

这样的tasknode甚至可直接加载在jobserver进程，也可被任意win系列机器的任意进程加载参与运算，用主动加载或被动加载都很方便，极大的方便了云计算环境的部署，反正具体执行的任务都由package完成，tasknode只要按照约定的规则部署 package即可，所以这种云计算环境是非常轻量级又非常灵活的，开发一个新的任务只要做一个新的IJobTask即可，目前我这套体系除了没有考虑太多安全性之外，这个云计算环境的实施还是非常容易的，实际上我们这个价格查询的后台云计算环境只用了不到2周的时间就开发完成。

再看下jobserver记录的每个job的log：

从log中可很容易的分析出一个job每个task的执行情况，并可根据这些数据进行相应的优化处理。

之所以把jobserver和tasknode以及package都写出来，主要是为了表达一个看法，要实现一个简单的云计算环境其实并不难，有经验的团队很容易就能做出来，参考下google的map/reduce论文，按照自己的需要简化实现，真理在实践中，如果只是仰望google、amazon，那就真的是在云中雾里，另一个想要表达的就是云的形式是多种多样的，并不一定amazone、google的云计算环境才是标准的，对实用派来说，形式都是次要的，实用才是关键的。

posted @ 2010-10-03 14:23 袁斌阅读(1817) | 评论 (1) | 编辑收藏

基于云计算的价格查询实现

上篇博客提到价格查询功能，当时正在考虑做成云计算模式，所以当时连多线程都没考虑，就是准备将功能都交给云计算系统的，由云计算内部管理线程和调度问题，所以当时实现就根本不用考虑多线程，现在功能基本实现，下面大致讲讲我的做法。

国内很多人谈到全文检索就必提lucene，提到云计算就必提google的map/reduce、开源的hadoop、amazon的ec2，似乎只有那些东西才叫云计算，咱是实战派，没兴趣口舌之争，在俺看来分布式存储+分布式计算就叫云计算，俺就看了看google的map/reduce论文，照其思想在win下做了个简单的job/task调度系统，使其能支撑俺的第一个实战应用价格查询，图示如下：

① 、adminclient承担管理功能，可查看任务及执行情况，可查看Tasknode机器情况，如果需要可管理Task，目前只支持简单的几条命令，adminclient主动连jobserver登录成功后可发送管理命令。

② 、JobOwner提交一个Job之后返回一个jobid，如果意外断开可通过下次重连的时候提交jobid和一个sessionid可提取job结果数据，job提交通过提交一个zip包即可，参数等文件都打在包里面，tasknode可直接解包执行里面的dll。Jobowner主动连jobserver，登录成功后可发job命令。

③ TaskNode是执行具体任务的客户端，job包用zip打包后发布给tasknode，tasknode参与计算并反馈结果。TaskNode设计成多线程模式，一个线程保持和jobserver的通信，其他线程参与运算，Tasknode可同时执行多个不同的任务，如a线程执行价格查询，b线程执行hash破解等。Tasknode主动连jobserver，登录后可接受jobserver分派的任务，由于tasknode是主动连jobserver的，所以即使是内网机器或者任意有闲置资源的机器都可作为Tasknode，不管它是家里的、公司的、还是网吧的，这也是该系统基于windows实现的一个重要前提，因为win的机器是如此的多，在国内win的机器无处不在。

JobServer是job调度器，管理包分发以及任务分割、调度，典型的执行流程是这样，jobowner提交一个命名的包给jobserver，jobserver将该包部署管理，之后jobowner 可给jobserver提交任务，jobserver收到任务后根据任务指定的包配置执行，如部署包后装载dll并执行任务分割操作，分割是将一个job分割为多个task，之后再将每个task提交给一个tasknode执行，并管理tasknode的输出以及可能的出错，出错现在的处理是交给另一个tasknode执行，当剩下最后一个tasknode的时候会将该tsaknode同步叫给另一个不同的tasknode执行，不管谁最后成功执行这个tasknode，只要该task执行成功立即结束整个job，并将结果反馈给jobowner，jobowner也可在执行中提交查询命令，jobserver会将被查询job当前的输出返回，这样碰到需要长时间执行的任务也能适用。

从以上介绍可以看到，具体任务是由包执行的，这个包实际上可能是一个dll，也可能是几个dll加上一些配置文件组成，之所以设计成这种模式，主要是考虑整个系统在win上方便部署，主dll需要支持几个固定的接口：

//任务dll初始化函数

typedef bool (*jobtask_init_)(jobtaskfunc *jtfunc, bool tasknode);

//map分割函数

typedef size_t (*jobtask_split_)(jobtaskfunc *jtfunc,

const char *input, size_t len,

std::vector<CAutoBuffer *> &vbuf);

//reduce打包函数

typedef size_t (*jobtask_reduce_)(jobtaskfunc *jtfunc,

std::vector<CAutoBuffer *> &vbuf,

CAutoBuffer &buf);

//Task执行函数

typedef bool (*jobtask_map_)(jobtaskfunc *jtfunc, const char *cmdline, CAutoBuffer &outbuf);

//释放函数

typedef bool (*jobtask_free_)(jobtaskfunc *jtfunc);

上面init函数主要执行线程相关的初始化，该函数典型的可能是空，或者是

CoInitialize(NULL); 等

Split函数是用来将job输入分割为N个tasknode输入的，该函数由jobserver调用，每个tasknode输入就是map函数的输入，tasknode的任务就是调用map函数，并传递输入，最后将输出返回给jobserver，jobserver在需要的时候调用reduce将各个tasknode的输出打包返回，free函数是个辅助函数，释放资源的。

熟悉google的map/reduce的应该知道，我的实现简化了reduce，在我的实现里面并没有独立的reduce worker，该任务由jobserver自己做了，这一方面是简化实现，另方面也是适应需求的结果，毕竟在我的需求里面输入是很少的(一个典型任务100字节量级)，tasknode的计算是很多的，输出也是不多的（1k量级），所以由jobserver打包整个输出也很轻松，用不着一组独立的reduce来管理输出。另外可以看到上面接口用了我的自定义类CAutoBuffer，这个类主要管理不定长数据的，其实用vector<char>也可，但考虑方便，我的实现内部都用了CAutoBuffer。一个典型的分布式应用只要做一个dll，有上面几个函数，并输出一个

struct jobtaskfunc

{

//初始化函数

jobtask_init_ init;

//释放函数

jobtask_free_ free;

//以下被tasknode调用

jobtask_map_ map;

//以下被jobserver调用

jobtask_split_ split;

jobtask_reduce_ reduce;

};

typedef jobtaskfunc *(WINAPI *create_jobtask_)();

函数即可。

学习map/reduce重要的是学习其思想，并不拘泥于实现形式，我想这大概正是国内环境欠缺的，国内能说得头头是道的人太多，能动手干出结果来的人很少，真正坐下来做实事的不多，只喜欢抄抄概念，拿别人的东西过来架设一下，就是这样的人也能混成大拿。我从map/reduce思想出发，学习其思想，简化其实现，为实际应用服务，虽然这个东西很简单，甚至可以说有些简陋，但实际效果不错，虽然现在只部署了两个点，但总体上还是令人满意的。

实现这个jobserver/tasknode系统并部署价格查询花了不到两周时间，实际上花在jobserver、tasknode上的时间大概只有一周多一点，ppsget.dll（具体干活的dll）用正则表达式分析网页并提取输出，该dll被应用到多线程环境后也出了一些问题，用boost：：reg的时候居然偶尔会出现异常，原以为boost::reg这样的应用应该是非常明确的，要么找到，要么没有找到，除此不应该有第三态，没想到boost::reg这个不争气的东西不但不是二态的，还容易出现异常，试用了一下tr1::regex也是类似的问题，无奈只能在外面包了一层异常处理，虽然不再被异常搞死，但一旦出现异常就是很慢的，要10s左右才返回，现在也没有特别好的办法，只在异常的时候将页面保存，事后分析并改写正则表达式，尽量将正则表达式做小，将非贪婪式查找用少一点。

下面看看我们价格查询网站 http://www.shprog.com/pps.aspx 的输出：

那个360的价格居然是图片，ocr模块是俺同事搞的，现在识别率能达到99%以上，还是很不错的。

posted @ 2010-10-03 14:22 袁斌阅读(223) | 评论 (0) | 编辑收藏

Json解析速度问题

一直想测试一下json的解析速度，前些天终于花了一点时间测了一下，在我的破笔记本上，解析一个包含10个元素（各种类型都有）的object型json，1秒钟大概只能解析不到10w次，就算把内存池用到极致也只能解析12.5w次左右，换用自己定义的一种bjson格式，速度快了一些，但也不超过20w次，想想工作量也的确很大，生成一个包含10个子元素的object，需要动态分配最少10次，还要做最少10次hash的insert，还有各种格式的转换工作，里面有array和object还要额外分配容器并处理子对象，这可都是耗时操作，终于明白了为什么webserver为何一秒钟只能处理几千个请求甚至只能处理几百个请求了，看来要将游戏协议完全用json暂时还是不大可取，从效率上看折中点的做法依然是struct+json或struct+string\0string\0…，这些我以前的blog都写过，只是现在找到了效率上的依据，毕竟游戏服务器一秒都是要处理几万数据包的，要是全是json光解析json就把时间耗光了，更不用说去处理其他任务了。

posted @ 2010-10-03 14:21 袁斌阅读(904) | 评论 (0) | 编辑收藏

价格查询网

花了四天写了个价格查询的web体验版，大致结构是这样的，前端web界面：

该web通过tcp连接后台一个ppsserver，ppsserver调用一个ppsget.dll从一些配置好的网站现拉网页分析产品价格等信息，说起来是很简单的，要是画出结构图来也是很简单的，看看效果：

为了写这个东西查了比价网等很多资料，看来看去觉得现在的一些比价网都把自己当购物门户了，上面什么信息都有，数据都是缓存的，有的还隐藏原始链接，用户点进去也都是缓存的数据，不再链接到原始出处，看了几个网站数据误差较大，有个网站排在最前面价格最低的链接点进去之后发现根本没有那个低价格，也不知道那个价格信息是什么时候的，或者根本就提取错了。看了那么多比价网站，时间误差最小的也超过10个小时，很令我失望，总之我的出发点和这些网站不同，我希望做一个界面很简洁的、实时查询的服务，而且速度要求很快，一次查询速度最好小于1秒，当然我现在技术预览版离这个目标还差得很远。界面简洁使得用户即使是使用手机也能得到很好的输出，也不占用多少带宽，我还希望前端接上条码扫描功能，这样很多不会输入的人就可直接对着条码就能查询网店价格，多方便啊，呵呵。不过做这个功能发现技术不是大问题，我4天除了布好了架构还做了5家网店的网页分析，可见这些基本技术都不太难，最大的矛盾是实时查询数据量太大，就算只查询一个产品，分析5个网站的数据加在一起估计接近1M，这要是每秒有个几百几千人访问那还得了啊，得要多大的带宽才能撑得住啊，难怪看了那么多比价网站没有一家提供实时查询的，不是他们做不了实时查询，的确是因为带宽太大，所以我想接下来做一套分布式查询模型，将很多无固定ip的机器接入ppscontrolserver，一起参与为用户提供查询服务，今天在看mapreduce，希望自己不要闭门造车，其实很多年前就想做这个功能了，只是一直没有下手，加上那个时候也没有一套稳定的网络库，现在条件都具备了，希望最近可以做一个简单的分布式计算框架出来，那样以后要做类似功能就容易了，可能只要加入一个简单的dll发布一个计算命令就可以了。这个分布式计算模型做出来之后，传统的比价网站就只能望俺项背了。

posted @ 2010-10-03 14:21 袁斌阅读(487) | 评论 (0) | 编辑收藏

HashCrack系统架构

HashCrack跑起来了一段时间，一直没有写架构方面的总结，今天在地铁上画了一张图：

照此架构理论上是可以支持非常巨大的后端数据的，如果将web也弄成多个，分别连不同的SN则可支持非常巨大的用户量。

posted @ 2010-10-03 14:20 袁斌阅读(227) | 评论 (0) | 编辑收藏

HashCrack程序数据及索引设计2

上个月写了《HashCrack程序数据及索引设计》里面已经提到早期设计的几种存储方法，最后达到了每条记录15个字节左右的水平，但这个存储效果还是很差的，而且是单体文件，受制于内存限制，后来又设计了几种复合索引格式，支持1万亿记录一个复合索引，下面简单讲讲之后的研究成果。

6、将内容区和索引区合并，索引位置不再提供指向内容区的size_t，内容区不再需要，直接在索引区，这样索引区indexnode

Struct indexnode

{

Size_t nextoffset;

Char str[0];

};

经过此修改之后稍微不好的地方就是如果一个文件里面要管理不同长度的字符串那么只能取最长的字符串长度，以便indexnode保持相同大小容易索引。

这种方法虽然效果不错，但平均下来一个字符串还是要占用11个左右的字节，而且不同长度的字符串有一些浪费的地方。

7、以上的存储方法虽然已经比较紧凑，但还不是最紧凑的方法，如果不保存字符串只是保存字符串在序列中的位置，那么不同字符串也没有长度不同，也可以用同样的大小去保存，如果一个db保存42亿以下的字符串，那么只要4个字节就可以了，如果一个db保存1万亿以下的数据，那么只要5个字节就可以，这真是个非常有创意的想法，其实我当初想到这个想法的时候很担心计算效率，迟迟没有动手代码，但思考了几天之后打消了我对效率的担心，相反，只保存一个position比复制N个字符串可能还要快一点，这样我们就只要9个字节描述indexnode了，看定义：

Struct indexnode

{

Size_t lpos;

Byte hpos;

Size_t nextoffset;

};

精确到9个字节表示一条记录，很不错，也没有更多的限制。事实上9字节版本的速度比方法6的确是要快一点，还没优化的时候就比6方法要快一些了，当然查询的时候由于要多计算一些信息，理论上是要慢一点的，但由于都是内存计算，其实影响不是很大。

8、上述9个字节的方法虽然已经很紧凑，但如果给nextoffset做一点限制，让一个区段的数据为1667w以下，那么描述nextoffset 只需要3个字节即可，这样indexnode总的长度就只需要8个字节，这真是很好的想法，我为这个想法骄傲，看下indexnode的8字节版本

Struct indexnode

{

Size_t lpos;

Size_t hpos:8;

Size_t nextoffset:24;

};

精确的8字节indexnode，如此我们最终实现了最紧凑的md5数据库，每条记录8个字节，几乎无法再减少了，期待哪天突然灵光闪现再创造出更紧凑的存储方法吧，呵呵，这个实现其实已经超越了我最初的估计了，我以为能减少到12个字节已经到顶了，没想到还能减少到8个字节。

8字节的版本最初写出来的时候效率下降得很厉害，因为以前nextoffset当指针用，现在3个字节无法当指针，只能转换，多一个转换函数效率下降了一些，其他地方刚写的时候也是非优化算法，所以第一个8字节版本效率比9字节降低了一半以上，但花了一个早上优化之后效率又上去了，现在制造复合索引只需要82秒就可完成1亿条记录，速度比方法6快不少，方法6需要120秒左右。

或许我讲得比较简单，如果不是深入研究这一块的人或许看不明白，但精华我基本上讲出来了，实现上其实有很多技巧，如果要做到象我一样的速度其实是需要很深功力的，我测试用的机器是朋友的入门级服务器E5504 2.0cpu，4G内存，普通7200转硬盘。

posted @ 2010-10-03 14:19 袁斌阅读(177) | 评论 (0) | 编辑收藏

HashCrack项目阶段性总结

从开始研究HashCrack两个多月了，虽然中间忙其他项目间断了近一个月，但总的耗在HashCrack上的时间也有一个多月，最近几天又把web部分完善了一下，顺便做了其他几种加密算法，现在HashCrack支持MD5、SHA1、MYSQL5HASH、QQHASH四种算法，每种算法都制造了46亿数据，总共占磁盘34.2 * 3G，qqhash和md5复用同一份数据。好在之前架构做得比较好，换一种加密算法只要换两个函数即可，所以加后面三种算法只花了1天时间。为了让界面更友好一点，临时学了下ajax，并学习了一下.net里面调用c++ dll，顺便用c++做了一个dll提供四种算法的加密供web调用。新web页面地址是 http://www.shprog.com/hashCrack.aspx，部分界面如下：

看上去一个简单页面，背后2服务器程序（1web 1 hashcrackserver），103G数据，3个dll（hashencrypt.dll, page.dll, data.dll)，一个制造数据的exe，还有一个client工具，那工具好久没升级了，client工具支持一次多条查询。Hashcrackserver支持分布，client端工具也支持数据分布和运算，总的是一个云计算系统。

现在觉得我的这个页面比www.cmd5.com www.md5.com.cn免费版有价值一点，他们虽然总的数据可能多一些，但开放的数据很少，特别mysql5 qqhash sha1要么没有，要么没开放或只开放了一点点数据，对免费用户实际用处不大。

posted @ 2010-10-03 14:19 袁斌阅读(243) | 评论 (0) | 编辑收藏

HashCrack程序数据及索引设计

前文已经讲述，字母全排列是个惊人的数字，即使只遍历小写字母和数字6个全排列也有36^6 = 2176782336，21亿多个，7个排列36^7 = 78364164096，783亿多，8个排列36^8 = 2821109907456，2.8万亿多个，数字非常惊人。Md5反查是个string-string的映射，16-N个字符的映射，如果考虑hex模式的md5那就是32-N的映射，考虑映射人们最先想到的可能都是数据库存储方式，我也首先想到了用数据库存储，分别考察了一下sqlite和berkeleydb，但测试下来制造数据的速度很慢，sqlite加索引大概只能到5w条记录/s，不加索引为10w条/s，berkeleydb用单条模式大概只能到4.5w条/s，这个速度已经很慢了，更难于接受的是如果写1000w对sqlite加索引来说不是耗时200s，而是2000s了，也就是说耗时随单个数据文件记录的条数增多几乎成平方模式递增，而不是简单的线性递增，这是很要命的，就算制造1亿条数据耗时也是惊人，我的实测中没有测试过用sqlite制造1000w条以上的数据，在我心目中已经否定了那种模式。虽然我知道很多号称有多少亿条数据的网站其实都是用的数据库，我不知道他们花了多少时间制造数据，或者几天，或者几个月，或者更长时间，反正我对采用普通数据库模式制造数据完全持否定态度，嵌入式速度太慢，其他数据库则不光速度慢而且也不适合分布式应用，难道用户每装个点还要装个mysql之类的数据库，几乎不可能啊。

下面说说我的方法，我本来第一版本是计划先不做文件式数据库的，第一版本来只规划了做内存数据，充分榨取每一个字节，关于内存数据库我实现了好几个版本，下面分别介绍一下：

版本1：hash模式

用char key[16];做键，char pass[n];做内容，由于hash桶占用了一些字节：

DWORD h, nKeyLen; //hash键值, 字符串长度

DWORD tag; //私有值，默认为0提供给外部使用

bucket *pListNext; //hash表双链的下一个节点

bucket *pListPrev; //hash表双链的上一个节点

bucket *pNext; //拉链的下一个节点

VALUE second; //具体数据

_Elem first[0]; //first键

用这个hash模式大概存储一个6个字符的串的md5信息花了50个字节，花费太多，结果自然存不了多少数据，该方案作为第一验证方案，除了花费内存太多还是个能通过的方案。

版本2：hash简化方案

在上述版本基础上简化桶设计，抛弃作为标准桶的一些字段，精简之后如下:

DWORD h; //hash键值

bucket *pNext; //拉链的下一个节点

byte nKeyLen; //字符串长度

VALUE second; //具体数据

_Elem first[0]; //first键

该版本存储一个6个字符的串的md5信息需要31个字节，比版本1少了很多，进步一些了。

方案1和方案2速度都很快。

版本3：vector方案

考虑到hash占用内存较多，采用vector方案，直接存储

Char mm[16];

Char pass[n];

存储一个6个字符的串的md5信息需要22个字节，该方案排序速度太慢，查找速度肯定也比不上版本1和版本2，之后还测试过将vector里面存储指针，那种模式每个6个字符的串的md5信息占用内存26个，接近hash版本，排序速度比直接存储数据的好一点，但也还是很慢，总之这个方案作为一个过度方案最终也被放弃了。

方案4：全文件Hash紧缩方案

以上这些方案的特点是都存储了char mm[16]; 也就是说存储部分都有计算出来的md5，经过思考之后觉得可以放弃存储md5，不存储md5是个很妙的想法，继续发挥hash思想，也不保存根据md5计算出来的hash值本身，只将该md5和串的信息关联到hash值的模所在的索引节点，这样就将索引节点信息减少到极致：

size_t coffset; //content offset low

unsigned short a:12; //切分为12, 4

unsigned short b:4; //4，为下一个冲突值的索引序数，如果没有就为0

size_t nextindex; //冲突条目的存储序号，为0表示没有冲突

使用该索引可让单文件最多支持内容16T，最多687亿记录，具体实现的时候由于全使用文件所以速度比较慢，速度退化到sqlite之类同一级别了，不过这个设计思想为方案5提供了借鉴，如果跟方案5一样用大块内存辅助，速度大概可以上升一个级别，不过由于没有具体实现，待研究之后再做评估。

方案5：hash紧缩内存方案

学习方案4的设计思想，考虑仅在内存里面实现一个紧凑型文件，由于只考虑内存可表示的32位范围，所以简化索引节点定义如下：

Size_t coffset; pass相对于内容区首的偏移

Size_t nindex; 冲突节点下一个序，如果为0则表示没有冲突

内容区存储更简单，每个字符串直接保存，最后的0也保存，这样每个字符串自然分开，对一个6个字符长的串来说，保存一个信息只需要15个字节，真的是省啊，1亿个字符串也只要大约1.5g左右硬盘就够了。此方案虽然很妙，但实现的时候却费了一些周折，具体做的时候也做过好几个版本，由于考虑该方案的内容和索引最后都可以直接保存到文件，所以该方案对位置的保存都用的是相对位置，也由于想让索引节点信息简单，最初是让冲突索引采用线性步长跳跃方法，测试之后发现这个方法速度奇慢，而且还有个非常讨厌的问题，随着数据量的增多冲突扩散越来越厉害，耗时非线性的陡峭增长。放弃这个实现之后还是回到了经典的拉链法，拉链法速度就是快，但拉链法处理索引节点虽然容易，但要让索引信息可直接保存却要花一些脑子，最后采用先用内存扩展拉链，待全部索引构造好之后再把拉链出来的部分重新填到原始索引区中的空区，并修正对应索引相对位置。这个方法的精妙之处在于既省空间又有速度，最令人兴奋的是采用该方法耗时随着数据量的增大是线性增长，最后的实现在我的笔记本上大概100w/s，1亿条记录从字母组合到最终生成索引文件也只要不到2分钟的时间，制造了一些数据之后统计了一下，冲突节点比例大概占26%-35%，也就是说有65%以上的数据只要一次hash就直接命中，平均拉链长度1.2左右，最长拉链10，总体还是很满意的。

原本第一版没有考虑这个可存储的方案，但花了几天就搞定了一个基本可用的存储方案还是很令人兴奋的，虽然该存储方案还有一些问题没有彻底解决，但已经有进一步处理的办法，待下一个相对空闲时间段再仔细研究一下，定会有更简洁的实现做出来，至于待解决的是什么问题以及如何解决那些问题还是等我代码写好了再写出来吧。

posted @ 2010-10-03 14:18 袁斌阅读(199) | 评论 (0) | 编辑收藏

仅列出标题

云计算实践2

定时器模块改造

实用云计算环境简述

基于云计算的价格查询实现

Json解析速度问题

价格查询网

HashCrack系统架构

HashCrack程序数据及索引设计2

HashCrack项目阶段性总结

HashCrack程序数据及索引设计

常用链接

留言簿(4)

随笔分类

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜