sunrise

每天不断学习,才能不断提升自己。

  C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  64 随笔 :: 0 文章 :: 92 评论 :: 0 Trackbacks

     一.Apache,Php5,Mysql不可少,然后下载mediawiki软件。

之前没有接触过这些软件,so每一个都需要装....

(1)apache配置

 在Debian下, 安装完成后, 软件包为我们提供的配置文件位于/etc/apache2目录下:

  tony@tonybox:/etc/apache2$ ls -l

  total 72

  -rw-r--r-- 1 root root 12482 2006-01-16 18:15 apache2.conf

  drwxr-xr-x 2 root root 4096 2006-06-30 13:56 conf.d

  -rw-r--r-- 1 root root 748 2006-01-16 18:05 envvars

  -rw-r--r-- 1 root root 268 2006-06-30 13:56 httpd.conf

  -rw-r--r-- 1 root root 12441 2006-01-16 18:15 magic

  drwxr-xr-x 2 root root 4096 2006-06-30 13:56 mods-available

  drwxr-xr-x 2 root root 4096 2006-06-30 13:56 mods-enabled

  -rw-r--r-- 1 root root 10 2006-06-30 13:56 ports.conf

  -rw-r--r-- 1 root root 2266 2006-01-16 18:15 README

  drwxr-xr-x 2 root root 4096 2006-06-30 13:56 sites-available

  drwxr-xr-x 2 root root 4096 2006-06-30 13:56 sites-enabled

  drwxr-xr-x 2 root root 4096 2006-01-16 18:15 

  其中

  apache2.conf

  为apache2服务器的主配置文件, 查看此配置文件, 你会发现以下内容

  # Include module configuration:

  Include /etc/apache2/mods-enabled/*.load

  Include /etc/apache2/mods-enabled/*.conf

  # Include all the user configurations:

  Include /etc/apache2/httpd.conf

  # Include ports listing

  Include /etc/apache2/ports.conf

  # Include generic snippets of statements

  Include /etc/apache2/conf.d/[^.#]*

  有此可见, apache2 根据配置功能的不同, 对配置文件进行了分割, 这样更利于管理

  conf.d

  下为配置文件的附加片断,默认情况下, 仅提供了 charset 片断,

  tony@tonybox:/etc/apache2/conf.d$ cat charset

  AddDefaultCharset UTF-8

  如有需要我们可以将默认编码修改为 GB2312, 即文件的内容为: AddDefaultCharset GB2312

  httpd.conf

  是个空文件

  magic

  文件中包含的是有关mod_mime_magic模块的数据, 一般不需要修改它。

  ports.conf

  则为服务器监听IP和端口设置的配置文件,

  tony@tonybox:/etc/apache2$ cat ports.conf

  Listen 80

  mods-available

  目录下是一些。conf和。load 文件, 为系统中可以使用的加载各种模块的配置文件, 而mods-enabled目录下则是指向这些配置文件的符号连接, 从配置文件apache2.conf 中可以看出, 系统通过mods-enabled目录来加载模块, 也就是说, 系统仅通过在此目录下创建了符号连接的mods-available 目录下的配置文件来加载模块。同时系统还提供了两个命令 a2enmod 和 a2dismod用于维护这些符号连接。这两个命令由 apache2-common 包提供。命令各式也非常简单: a2enmod [module] 或 a2dismod [module]

  sites-available

  目录下为配置好的站点的配置文件, sites-enabled 目录下则是指向这些配置文件的符号连接, 系统通过这些符号连接来起用站点 sites-enabled目录下的符号连接附有一个数字前缀, 如000-default, 这个数字用于决定启动顺序, 数字越小, 启动优先级越高。 系统提供了两个命令 a2ensite 和 a2dissite 用于维护这些符号连接。这两个命令由 apache2-common 包提供。

  /var/www

  默认情况下将要发布的网页文件应该置于/var/www目录下,这一默认值可以同过主配置文件中的DocumnetRoot 选项修改。

  二.mediawiki直接解压到apache里面(就是解压在var/www路径下),解压后重名为wiki;

三. 然后进主页localhost/wiki,对MediaWiki进行安装。去创建数据库wikidb。里面有41个表。在导入数据之间,要先清除page,revision,text三个表。

delete from page; 

delete from revision; 

delete from text; 

四.http://dumps.wikimedia.org/backup-index.html在这里可以下载任何语言wiki的数据库xml文件。下载的文件类似于enwiki-20061130-pages-articles.xml.bz2(英文版的),wiki差不多每两个月更新一次数据。

五.安装mediawiki。去下载mediawiki的源代码,如果其官方网站被封的话可以去www.allwiki.com这个中文网站上去下载。下载后解压到你的apache能找到的一个目录下,将其config目录权限设置为777,然后在浏览器里访问其 config/index.php,进行一些配置后,会在config目录下生成一个LocalSettings.php的文件,将这个文件拷贝到它的上一级目录。最后别忘了将config的目录再改回原来的权限。

六.把文件导入数据库: 
命令: 
java -Xmx600M -server -jar mwdumper.jar --format=sql:1.5 
enwiki-20061130-pages-articles.xml.bz2 | mysql -u wikiuser -p wikidb 

参见:http://fuhao-987.iteye.com/blog/1044933

http://jgs80.blog.163.com/blog/static/3566265320076177435762/

posted on 2012-08-21 09:22 SunRise_at 阅读(2856) 评论(0)  编辑 收藏 引用 所属分类: 自然语言处理

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理