Elasticsearch之文档操作
Elasticsearch之文档操作
# Elasticsearch之文档操作
这是es
系列的第五篇文章了,阅读前四篇有助于小伙伴们理解本篇文章。
# 回顾
前面的四篇文章我们讨论了什么是es
,是用来干什么的,如何进行安装,怎么样建立索引库,如何给索引库添加mapping
映射。本篇我们开始讨论如何添加文档,如何修改文档已经如何删除文档。
# 文档
什么是es
文档,其实mapping
就是es
的数据字段约束,我们定义好一个索引,并且定义了一个mapping
映射,就相当于我们在关系型数据库中定义好了这个表的表结构。也就是我们这个索引会用那些列。es
中的一个文档,其实就是在mapping
约束下的一行数据记录。索引可以认为是文档的优化集合,每个文档都是字段的集合,这些字段是包含数据的键值对。默认情况下,Elasticsearch
对每个字段中的所有数据建立索引,并且每个索引字段都具有专用的优化数据结构。希望这样说小伙伴们可以理解。
# maping
映射结构
上篇文章中我们创建了一个叫做movie
的索引,并且创建了该索引的mapping
,复习一下查询索引的命令
curl -X GET "localhost:9200/movie/_mapping?pretty"
可以看到,返回一个json
串,可以清晰的看到我们定义的mapping
,这里就不贴出来,不知道的小伙伴可以到上一篇文章中查看。
# 添加
下面,我们根据定义的映射,来添加我们的文档,特别说明:我们后续针对es
的操作,都会用一个工具postman
俩操作,目前还不会的小伙伴们可以自行学习一下。
我们都知道,添加文档用PUT
命令,所以需要执行如下命令进行文档的添加,具体请看下图,postman
的操作
http://ip:9200/movie/_doc/1
我们将要添加的数据,以
json
键值对的方式书写完成,放在body
输入框中,点击raw
,选择JSON
的格式
_doc
作者目前用的es
版本为7.8
的版本,es
7.0以前是支持多类型的,但是7.0以后,就将多类型移除掉了,默认支持_doc
l类型。
请求成功成功后会返回如下内容:
{
"_index": "movie",
"_type": "_doc",
"_id": "1",
"_version": 3,
"result": "created",
"_shards": {
"total": 2,
"successful": 1,
"failed": 0
},
"_seq_no": 2,
"_primary_term": 2
}
2
3
4
5
6
7
8
9
10
11
12
13
14
根据上面的内容,我们可以看到的信息有,这个文档是是创建的
"result": "created"
,属于movie
索引的_doc
类型以及他的版本号。
# id
自动分配
上面的例子,我们添加文档的时候,是指定了一个文档的id
为1,那么我们如果不指定id
呢?这个时候es
会为我们自动生成一个id
,请看下面的操作。
可以看到让系统自动分配
id
,用PUT
增加文档的时候回报错,可以看到,提示用post
并非PUT
。然后我们换成post
进行请求,返回结果如下,可以看到系统为我们分配的id
是一个字符串。
{
"_index": "movie",
"_type": "_doc",
"_id": "9XmceHQByHcRbTF_z1TT",
"_version": 1,
"result": "created",
"_shards": {
"total": 2,
"successful": 1,
"failed": 0
},
"_seq_no": 4,
"_primary_term": 3
}
2
3
4
5
6
7
8
9
10
11
12
13
14
# 修改
es
的修改,不是真正的修改,它的机制是将,原有的文档删除掉,然后新建一个,并且版本号加1.那么我们将修改的内容如下:
{
"films" : "八百",
"name" :"八百",
"release_area":"中国",
"release_time" :"八月二十一",
"theme":"赞美小人物"
}
2
3
4
5
6
7
再次使用PUT
命令进行请求,返回结果如下:
{
"_index": "movie",
"_type": "_doc",
"_id": "1",
"_version": 4,
"result": "updated",
"_shards": {
"total": 2,
"successful": 1,
"failed": 0
},
"_seq_no": 3,
"_primary_term": 2
}
2
3
4
5
6
7
8
9
10
11
12
13
14
可以看到,这个时候
"result": "updated"
,是updated``而不是created
的操作,并且版本号进行了累加。
# 删除
删除一个文档就很简单了,直接指定你要删除的文档id
就可以了,如下:
# 查询
我们将刚刚删除的那个文档在添加进去,下面我们看一下如何查询文档。
# 查询单个文档
我们查询id
为1的文档,如下:
# 批量查询
批量查询,我们会用到一个_mget
的指令,如下:
http://121.36.55.57:9200/_mget
请求体为
{
"docs":[
{
"_index":"movie",
"_type":"_doc",
"_id":"1"
},
{
"_index":"movie",
"_type":"_doc",
"_id":"2"
}
]
}
2
3
4
5
6
7
8
9
10
11
12
13
14
查询结果
{
"docs": [
{
"_index": "movie",
"_type": "_doc",
"_id": "1",
"_version": 1,
"_seq_no": 6,
"_primary_term": 3,
"found": true,
"_source": {
"films": "八百",
"name": "八百",
"release_area": "中国",
"release_time": "八月二十一",
"theme": "赞美小人物"
}
},
{
"_index": "movie",
"_type": "_doc",
"_id": "2",
"_version": 1,
"_seq_no": 7,
"_primary_term": 3,
"found": true,
"_source": {
"films": "信条",
"name": "信条",
"release_area": "美国,英国",
"release_time": "九月四日",
"theme": "时空逆袭"
}
}
]
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
还可以这些查询,指定索引,指定类型,直接提供id
就可以查询
http://121.36.55.57:9200/movie/_doc/_mget
请求体如下:也是可以查到的。
{
"ids":["1","2"]
}
2
3
# 小结
好啦,小伙伴们,今天的东西不难,很简单,只是简单的向大家介绍了,es
针对文档的CRUD
操作。其实es
的重点是查询,下篇文章中我们会导入大批量的数据,然后各式各样的查询方法和小伙伴们玩转es
.