Eclipse中加载Nutch(一)

发布时间:2014-10-25 2:23:02
来源:分享查询网

1.系统(Windows XP) 2.前提(JDK1.6,Tomcat6.0服务器,Eclipse7.0,Cygwin仿真系统,Lucene-2.4.0.zip包,Nutch-0.9.tar.gz包) 3.环境准备    JDK是1.6所以不用配置环境变量,Lucene-2.4.0要解压出来,将lucene-core-2.4.0.jar和lucene-demos-2.4.0.jar导入环境变量CLASSPATH中,导入后可以在命令行输入echo %CLASSPATH%命令,看是否有导入成功. 4.Lucene测试运行 将Lucene解压包中的src中的jsp目录复制到Tomcat的webapps/ROOT目录,改名为Luceneweb.复制lucene-core-2.4.0.jar和lucene-demos-2.4.0.jar包到Luceneweb/WEB-INF/lib目录.在Luceneweb下创建文件夹docs,并在docs文件夹中放入文本文件或HTML文件(一定要放入文件,这里是后续检索步骤需要用到的文件),在Windows下进入cmd窗口,需要先进入Luceneweb/WEB-INF/lib,然后运行命令"org.apache.lucene.demo.IndexHTML",命令为java org.apache.lucene.demo.IndexHTML -create -index "C:/Program Files/Apache Software Foundation/Tomcat 6.0/webapps/Luceneweb/index" "C:/Program Files/Apache Software Foundation/Tomcat 6.0/webapps/Luceneweb/docs" 执行成功的话会在Luceneweb目录下创建Index文件夹,并生成索引文件. 编辑Luceneweb文件夹下的configuration.jsp文件,把String indexLocation="opt/lucene/index";修改成String indexLocation="C://Program Files//Apache Software Foundation//Tomcat 6.0//webapps//Luceneweb//index";然后重启Tomcat,打开浏览器,访问地址http://127.0.0.1:8080/Luceneweb/,  

返回顶部
查看电脑版