有意转让搜索引擎

本人前段时间写了一个小的搜索引擎,效果跟百度特像,基本没有什么区别,除了没有广告系统外,但是是小搜索引擎,所以不能胜任大型搜索服务,程序是按通用搜索写的,可以稍做改动变成一个垂直搜索引擎。本人愿意低价出售该引擎,或者也可以采取合作的方式。其中蜘蛛的爬行效率是很高的,分词速度也特别快,我专门测试过,所有代码都是c++实现。有意者可跟我联系QQ87828577
合作方式:
1、可以只提供蜘蛛程序,并定制成企业的特殊需要,如将搜集的信息经过解析,按要求的字段形式存入数据库;
2、可以稍加改动成一个垂直搜索引擎;
3、可以提供搜索领域的idea,如果idea可行,本人可以合作方式实现该idea;
4、可以提供整套服务,包括蜘蛛、分词、索引、搜索服务;

 

 
郁闷,感觉cppblog的人气不够,是不是考虑搬家到csdn呢?奇怪了cppblog删贴?

posted on 2007-11-10 12:09 PeakGao 阅读(1848) 评论(21)  编辑 收藏 引用 所属分类: C++技术其他

评论

# re: 有意转让一个搜索引擎 2007-11-10 12:46 <a href=http://minidx.com>minidxer</a>

分词用什么算法?  回复  更多评论   

# re: 有意转让一个搜索引擎 2007-11-10 13:02 万连文

这个,需要花钱嘛??如果不花钱,我想收藏一份研究。  回复  更多评论   

# re: 有意转让一个搜索引擎 2007-11-10 13:12 PeakGao

@万连文
如果没有用起来,估计有可能发布源代码,但是没有时间表  回复  更多评论   

# re: 有意转让一个搜索引擎 2007-11-10 13:24 PeakGao

@&lt;a href=http://minidx.com&gt;minidxer&lt;/a&gt;
虽然分词没有海量的准,但是速度比它声明的还快,经测试1581 bytes/ms,相当于 4743万个汉字/分钟,比海量的 2000万字/分钟 还快,呵呵,只是精度没他的高,我的机器配置并不高:AMD Athlon 2500+,512M DDR内存  回复  更多评论   

# re: 有意转让一个搜索引擎 2007-11-10 16:25 <a href=http://minidx.com>minidxer</a>

不好意思,我问得不是速度……
是问用了什么算法  回复  更多评论   

# re: 有意转让一个搜索引擎 2007-11-10 16:28 <a href=http://minidx.com>minidxer</a>

所有代码都是c++实现……
为什么我看到的是search.php……?  回复  更多评论   

# re: 有意转让一个搜索引擎 2007-11-10 17:35 PeakGao

@&lt;a href=http://minidx.com&gt;minidxer&lt;/a&gt;
分词只有那么几种有效的算法,呵呵,我也没有时间去研究一种新的算法,只是为了速度做了改进而已。
没有search.php你还想直接运行exe啊,哈哈,连search.php都只是一个壳,内部调用的COM组件  回复  更多评论   

# re: 有意转让一个搜索引擎 2007-11-10 17:37 PeakGao

@&lt;a href=http://minidx.com&gt;minidxer&lt;/a&gt;
原来写了一个php的搜索功能,但是后来改了程序,就没有继续改,就写了个COM,c++熟悉多了,php不是我的强项  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:13 <a href=http://minidx.com>minidxer</a>

不是cppblog删贴,而是这样的帖子没有放在首页的必要。  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:16 PeakGao

@&lt;a href=http://minidx.com&gt;minidxer&lt;/a&gt;
发现你发帖好快啊,我还没有编辑好,你的回复就来了,看你首页才发现你搞全文检索的,呵呵
  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:18 <a href=http://minidx.com>minidxer</a>

比较感兴趣,所以想问一下。
大小上索引文件和原文件的比例?
对html,doc,pdf等格式的索引是用什么实现的?
不好意思,看来上面我没问清楚,我想知道的使用了什么算法实现分词,而不关心是自己写的算法还是原来就有的。这个能否说明一下?
还有索引文件的存储机制,对各种编码的支持情况,如果可以的话能否说明一下?  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:20 <a href=http://minidx.com>minidxer</a>

还有索引的评分机制是用什么算法?  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:20 <a href=http://minidx.com>minidxer</a>

是否支持在线索引?  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:22 <a href=http://minidx.com>minidxer</a>

测试过的最大索引是多少?效率如何?不好意思,问题比较多……、  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:24 PeakGao

@&lt;a href=http://minidx.com&gt;minidxer&lt;/a&gt;
可私聊  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:24 <a href=http://minidx.com>minidxer</a>

呵呵,是的,所以我对这个比较感兴趣。:)  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:27 PeakGao

加我QQ吧,交个朋友  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:27 <a href=http://minidx.com>minidxer</a>

恩,我要问得基本上就是上面这些问题,方便的话可以mail到minidxer@gmail.com

不过,算法方面应该不是什么秘密吧?呵呵  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:29 <a href=http://minidx.com>minidxer</a>

:),我的系统除了IE上的其他的对中文支持不好所以用不了QQ……  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 19:56 PeakGao

发邮件给你了,但是发现好像掉了几个问题,呵呵  回复  更多评论   

# re: 一个小的搜索引擎 2007-11-10 20:11 <a href=http://minidx.com>minidxer</a>

看到了,谢谢~~~  回复  更多评论   


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理


<2007年4月>
25262728293031
1234567
891011121314
15161718192021
22232425262728
293012345

导航

统计

常用链接

留言簿(9)

随笔分类(67)

随笔档案(65)

搜索

最新评论

阅读排行榜

评论排行榜