你好,游客 登录 注册 搜索
背景:
阅读新闻

Solr 6.6.0 配置IKAnalyzer中文分词

[日期:2017-12-28] 来源:Linux社区  作者:sweety820 [字体: ]

IKAnalyzer是一个开源的,基于Java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的 IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。GitHub的地址是https://github.com/wks/ik-analyzer,Google的地址是https://code.google.com/archive/p/ik-analyzer/。 官方好久没更新了。

1. 下载ikanalyzer-solr6.5.zippinyin.zip(,见本文下面,这里这两个文件已经配置好了);

2. 解压ikanalyzer-solr6.5.zip

ext.dicIKAnalyzer.cfg.xmlstopword.dic 复制到Tomcat \webapps\solr\WEB-INF\classes中,把ik-analyzer-solr5-5.x.jarsolr-analyzer-ik-5.1.0.jar 复制到Tomcat \webapps\solr\WEB-INF\lib中;
3. 打开webapps\solr\solrhome{{core_name}}\conf下的managed-schema文件,在</schema> 前加入配置:

 <!-- IK分词 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="false"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
</analyzer>
</fieldType>

这里说下useSmart,我试过,当设置为true时,分词粒度比较小,支取权重比较高的分词,当设置为false时,分词粒度比较小,能匹配多个词;

到这里,IKAnalyzer就算配置完毕,可以直接在后台调试分词了。

------------------------------------------分割线------------------------------------------

ikanalyzer-solr6.5.zippinyin.zip可以到Linux公社1号FTP服务器下载

FTP地址:ftp://ftp1.linuxidc.com

用户名:ftp1.linuxidc.com

密码:www.linuxidc.com

在 2017年LinuxIDC.com//12月/Solr 6.6.0 配置IKAnalyzer中文分词/

下载方法见 http://www.linuxidc.com/Linux/2013-10/91140.htm

------------------------------------------分割线------------------------------------------ 

更多Solr相关教程见以下内容

CentOS7下搭建Solr 6.6全文检索服务器及IK分词器配置  http://www.linuxidc.com/Linux/2017-12/149897.htm

Apache Solr: 安装和运行 http://www.linuxidc.com/Linux/2016-12/138527.htm

Solr实现Low Level查询解析(QParser) http://www.linuxidc.com/Linux/2012-05/59755.htm

Solr6.0.0 + Tomcat8 配置问题 http://www.linuxidc.com/Linux/2016-05/131845.htm

CentOS 6.7下单机部署Solr 7.1.0  http://www.linuxidc.com/Linux/2017-12/149889.htm

Solr 的详细介绍请点这里
Solr 的下载地址请点这里

本文永久更新链接地址http://www.linuxidc.com/Linux/2017-12/149900.htm

linux
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款