浅练ES入门&&工具Kibana&&head的使用&&IK分词器应用

浅练ES入门&&工具Kibana&&head的使用&&IK分词器应用 2023-05-20 715

一、什么是Kibana？

Kibana是ES的一个数据分析和可视化工具

1.下载地址

ElasticSearch官网：

2.安装

解压到本地即可使用

3.修改配置

server.port: 5601
server.host: "0.0.0.0" #允许来自远程用户的连接
elasticsearch.url: http://192.168.163.135:9200 #Elasticsearch实例的URL

4.启动

bin目录下的kibana.bat文件

5.练习

浏览器访问：

二、什么是head？

head插件是用来监控ES的状态，也可以快速创建索引库和映射

1.下载地址

下载地址：

2.启动

文件窗口地址栏cmd，打开黑窗口，输入启动命令

npm run start

3.测试

浏览器访问：127.0.0.1:9100,

打开网页后把Elasticsearch虚拟机IP：端口写上，并连接

三、ES快速入门

1、index管理（index只可用小写）

1.创建index索引库

PUT /java2202
{
  "settings": {
    "number_of_shards": 2,
    "number_of_replicas": 0
  }
}

注意：一台服务器时，备份分片的数量必须设置为0，因为主备在同一台上没有意义

2.删除index

DELETE /java2202

3.修改index

PUT /java2202/_settings
{
   "number_of_replicas":0
}

注意：index一旦创建，主分片数量不可修改，因为：Get时--->hash(id)%number_of_shards

2、mapping管理

1.创建mapping

POST /Java2202/course/_mapping
{
   "properties":{
   "name":{
    type:"text"
    },
    "description":{
    type:"text"
    }
  }
}

2.查询mapping

查询所有索引的映射：

GET /java2202/course/_mapping

3.更新mapping

映射创建成功可以添加新字段，已有字段不允许更新。和添加语法一样，type字段不允许重复

4.删除mapping

通过删除索引来删除映射.一个索引库只能添加一个映射，删除库即可

DELETE /java2202

3、document管理

1.创建document

POST /java2202/course/1
            {
              "name":"python从入门到放弃",
              "description":"人生苦短，我用Python",
              "studymodel":"201002"
            }

2.修改document（修改的id有则修改，无则添加）

PUT /java2202/course/1
           {
             "name":"python从入门到放弃",
             "description":"人生苦短，我用Python",
             "studymodel":"201002"
           }

3.查询document

GET /Java2202/course/1

4.删除document

DELETE /java2202/course/1

代码如下（示例）：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings(ignore)
import  ssl
ssl._create_default_https_context = ssl._create_unverified_context

四、IK分词器

1.下载

下载IK分词器：（Github地址：）

2、解压

将解压的文件拷贝到ES安装目录的plugins下的ik(重命名)目录下，重启es

建议重命名，也可不改名

3、测试分词效果

两种分词效果

3.1、ik_max_word

会将文本做最细粒度的拆分，比如会将“中华人民共和国人民大会堂”拆分为“中华人民共和国、中华人民、中华、华人、人民大会堂、人民、共和国、大会堂、大会、会堂等词语。

3.2、ik_smart

会做最粗粒度的拆分，比如会将“中华人民共和国人民大会堂”拆分为中华人民共和国、人民大会堂。

POST /_analyze
{
  "text":"中华人民共和国人民大会堂",
  "analyzer":"ik_smart"
}

POST /_analyze
{
  "text":"中华人民共和国人民大会堂",
  "analyzer":"ik_max_word"
}

4、自定义分词

如果要让分词器支持一些专有词语，可以自定义词库。

iK分词器自带的main.dic的文件为扩展词典，stopword.dic为停用词典。

先把这三个文件拿到Windows桌面，再进行修改 xml文件，把另外两个文件名家后缀名加上即可另外两个文件可以加上特有的名词和停用字典（如：的，得，地）

文章来自:IT技术分享网
分享地址:http://www.5ityx.cn/cate100/316364.html

上一篇： .gitignore 文件不生效问题 & 解决方法

下一篇： .java编译成.class 与 .class反编译成.java

浅练ES入门&&工具Kibana&&head的使用&&IK分词器应用

一、什么是Kibana？

Kibana是ES的一个数据分析和可视化工具

1.下载地址

2.安装

3.修改配置

4.启动

5.练习

二、什么是head？

head插件是用来监控ES的状态，也可以快速创建索引库和映射

1.下载地址

2.启动

3.测试

三、ES快速入门

1、index管理（index只可用小写）

1.创建index索引库

2.删除index

3.修改index

2、mapping管理

1.创建mapping

2.查询mapping

3.更新mapping

4.删除mapping

3、document管理

1.创建document

2.修改document（修改的id有则修改，无则添加）

3.查询document

4.删除document

四、IK分词器

1.下载

2、解压

建议重命名，也可不改名

3、测试分词效果

4、自定义分词

浅练ES入门&&工具Kibana&&head的使用&&IK分词器应用 相关内容

聚合标签

浅练ES入门&&工具Kibana&&head的使用&&IK分词器应用相关内容