ubuntu下安装apachesolr与中文分词配置

Submitted by admin on Sun, 07/12/2015 - 21:27

安装jdk与tomcat7

apt-get install openjdk-7-jdk
apt-get install tomcat7 tomcat7-admin


下载并配置apachesolr

http://archive.apache.org/dist/lucene/solr/

下载如下格式的文件:

solr-4.x.x.tgz

下载solr,尽量使用4.x的最新版本吧,5.x目录结构改动很大,没摸索出来。

tar xzf solr-4.x.x.tgz
cd solr.4.x.x.tgz
cp example/lib/ext/* /usr/share/tomcat7/lib/
cp dist/solrj-lib/* /usr/share/tomcat7/lib/
cp dist/solr-4.x.x.war /var/lib/tomcat7/webapps/solr.war
mkdir -p /var/lib/tomcat7/solr
cp -r example/solr/collection1/conf /var/lib/tomcat7/solr/


solr配置

https://www.drupal.org/project/search_api_solr

rsync -av search_api_solr/solr-conf/solr-4.x/ /var/lib/tomcat7/solr/conf/

使用http://pan.baidu.com/s/1gduye8F的scheme.xml配置覆盖如下文件

/var/lib/tomcat7/solr/drupal/conf/scheme.xml

vi /var/lib/tomcat7/solr/solr.xml
<?xml version="1.0" encoding="UTF-8" ?>
<solr persistent="false">
  <cores adminPath="/admin/cores">
    <core name="drupal" instanceDir="drupal" />
  </cores>
</solr>
mkdir /var/lib/tomcat7/solr/drupal
cp -r /var/lib/tomcat7/solr/conf /var/lib/tomcat7/solr/drupal/

如果需要两个环境,则执行如下:

cp /var/lib/tomcat7/solr/drupal /var/lib/tomcat7/solr/dev -r
vi /var/lib/tomcat7/solr/solr.xml
<?xml version="1.0" encoding="UTF-8" ?>
<solr persistent="false">
  <cores adminPath="/admin/cores">
    <core name="dev" instanceDir="dev" />
    <core name="drupal" instanceDir="drupal" />
  </cores>
</solr>

配置IK中文分词

https://code.google.com/p/ik-analyzer/downloads/list下载并解压IKAnalyzer,版本号选择2012FF_hf1。


cp IKAnalyzer2012FF_u1.jar /var/lib/tomcat7/webapps/solr/WEB-INF/lib/
cp stopword.dic IKAnalyzer.cfg.xml /var/lib/tomcat7/webapps/solr/WEB-INF/classes

修改文件所有者并重启服务

service tomcat7 stop
chown tomcat7:tomcat7 /var/lib/tomcat7 -R
service tomcat7 start


备注:

之前发表的两篇文章,关于solr安装与中文分词,当时tomcat7还未出现。现在不建议使用。

http://www.dplor.com/archives/579

http://www.dplor.com/archives/543