首页 > 代码库 > 【solr】solr5.0整合中文分词器

【solr】solr5.0整合中文分词器

1、solr自带的分词器远远满足不了中文分词的需求,经查使用最多的分词器是solr是mmseg4j分词器,具体整合大家可以参考

https://github.com/zhuomingliang/mmseg4j

一定要注意版本

2、将这两个包直接拷贝到tomcat下的solr/lib中

技术分享

 

3、在solr/java里新建dic目录将词库拷贝进去

技术分享

 4、直接在浏览器http://127.0.0.1:8080/solr即可如下分词结果

 

 技术分享

 

ok,分词整合完毕!

 

【solr】solr5.0整合中文分词器