By admin |

配置完apache solr后,发现搜索功能还是很烂?这里需要用到中文分词。apache solr的中文分词方案有好几种,比如自带的smartcn;第三方的扩展paoding分词,IKAnalyzer。 本文介绍的是solr 4.x与IKAnalyzer分词的整合步骤。 本文步骤是对前文的继续。所以前置步骤请到http://dplor.com/archives/543去按部就班配置。 IKAnalyzer下载地址,版本2012FF_hf1。

https://code.google.com/p/ik-analyzer/downloads/list

下载并解压IKAnalyzer,版本号选择2012FF_hf1 有用的文件:

IKAnalyzer2012FF_u1.jar
IKAnalyzer.cfg.xml
stopword.dic
cp IKAnalyzer2012FF_u1.jar /var/lib/tomcat6/webapps/solr/WEB-INF/

检查/var/lib/tomcat6/webapps/solr/WEB-INF/classes是否存在,如果不存在,自行创建。

cp IKAnalyzer.cfg.xml /var/lib/tomcat6/webapps/solr/WEB-INF/classes
cp stopword.dic /var/lib/tomcat6/webapps/solr/WEB-INF/classes

下面是修改/opt/solr/collection1/conf/schema.xml的文件。 为了节省篇幅,建议直接使用下面连接中提供的schema.xml文件 http://pan.baidu.com/s/1qWsJJ1E

下载之后,复制过去:

cp schema.xml /opt/solr/collection1/conf/schema.xml