TA的每日心情 | 开心 2021-12-13 21:45 |
---|
签到天数: 15 天 [LV.4]偶尔看看III
|
铭毅天下,原文地址:blog.csdn.net/laoyang360 https://blog.csdn.net/wojiushiwo987/article/details/51472821
1、ES5.4.0 IK分词安装步骤
步骤1:下载最新版的ik插件
地址:https://github.com/medcl/elasticsearch-analysis-ik
步骤2:解压Elasticsearch-analysis-ik-master.zip
unzip elasticsearch-analysis-ik-master.zip
步骤3:修改ES版本号。
修改pom.xml,最新(20170622)是5.4.2, 改为5.4.0
步骤4:执行mvn package
步骤5:在/opt/elasticsearch/plugins下新建ik文件夹。
完成拷贝:将
cp elasticsearch-analysis-ik-master/target/releases/elasticsearch-analysis-ik-5.4.0.zip
/opt/elasticsearch/plugins/ik/
步骤6:重启ES。
2、IK使用
ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;
ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”
3、小结
1、分词插件有很多,IK是由ES的中国第一位员工曾勇开发的,相对效果更好些。
2、虽然github已经很简明扼要的有说明,但自己安装的时候,总会遇到这样或那样的问题,记录下来,以备后用。
|
|