Posted on 2010-10-07 22:24
Kevin_Zhang 阅读(326)
评论(0) 编辑 收藏 引用 所属分类:
搜索引擎 、
Heritrix
1.下载heritrix-1.14.1.zip和heritrix-1.14.1.src 并解压,解压heritrix-1.14.1.jar.
2.在eclipse下创建java project,命名为比如heritrix,进入其工程的目录,我的是F:\workspace\myeclipse\heritrix,删除src文件夹。
3.copy解压后的heritrix-1.14.1.zip文件夹下的lib,webapps,heritrix-1.14.1到F:\workspace\myeclipse\heritrix目录下,并删除F:\workspace\myeclipse\heritrix\heritrix-1.14.1目录下的org和st两个文件夹。
copy解压后的heritrix-1.14.1.src 文件夹下的heritrix-1.14.1\src\java下的org和st两个文件夹到F:\workspace\myeclipse\heritrix\heritrix-1.14.1\目录下
4.修改heritrix-1.14.1文件夹名称为src
5.修改src\heritrix.properties文件中的heritrix.cmdline.admin = 为 heritrix.cmdline.admin = admin:sun,这个就是要设置你的用户名和密码,可以随便,中间是冒号。
6.刷新工程,把lib下的jar包全部添加到工程中,即点击heritrix工程,右键属性---java build path---libraries--- add jars选择heritrix工程下lib所有jar。
7.运行org.archive.crawler.Heritrix类,在地址栏输入http://localhost:8080/
OK!就是这么简单!
转自:
http://zhidao.baidu.com/question/72080439.html