C++博客 :: 首页 :: 新随笔 ::  ::  :: 管理

Heritrix-1.14.1怎么配置?

Posted on 2010-10-07 22:24 Kevin_Zhang 阅读(317) 评论(0)  编辑 收藏 引用 所属分类: 搜索引擎Heritrix
1.下载heritrix-1.14.1.zip和heritrix-1.14.1.src 并解压,解压heritrix-1.14.1.jar.
2.在eclipse下创建java project,命名为比如heritrix,进入其工程的目录,我的是F:\workspace\myeclipse\heritrix,删除src文件夹。
3.copy解压后的heritrix-1.14.1.zip文件夹下的lib,webapps,heritrix-1.14.1到F:\workspace\myeclipse\heritrix目录下,并删除F:\workspace\myeclipse\heritrix\heritrix-1.14.1目录下的org和st两个文件夹。
copy解压后的heritrix-1.14.1.src 文件夹下的heritrix-1.14.1\src\java下的org和st两个文件夹到F:\workspace\myeclipse\heritrix\heritrix-1.14.1\目录下
4.修改heritrix-1.14.1文件夹名称为src
5.修改src\heritrix.properties文件中的heritrix.cmdline.admin = 为 heritrix.cmdline.admin = admin:sun,这个就是要设置你的用户名和密码,可以随便,中间是冒号。
6.刷新工程,把lib下的jar包全部添加到工程中,即点击heritrix工程,右键属性---java build path---libraries--- add jars选择heritrix工程下lib所有jar。
7.运行org.archive.crawler.Heritrix类,在地址栏输入http://localhost:8080/
OK!就是这么简单! 
自:http://zhidao.baidu.com/question/72080439.html

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理