ElasticSearch的常用数据类型

news/2024/10/11 16:47:15/

常见的数据类型

Text类型(文本数据类型)

用于索引全文值的字段,例如电子邮件的正文或产品的描述。这些字段是analyzed,也就是说,它们通过分析器传递,以便 在被索引之前将字符串转换为单个术语的列表。通过分析过程,Elasticsearch可以在 每个全文字段中搜索单个单词。文本字段不用于排序,很少用于聚合

PUT test-03
{"mappings": {"properties": {"full_name": {"type": "text"}}}
}

Keyword (关键字数据类型)

用于索引结构化内容(例如ID,电子邮件地址,主机名,状态代码,邮政编码或标签)的字段。

关键字字段只能按其精确值进行搜索。

PUT test-03
{"mappings": {"properties": {"tags": {"type": "keyword"}}}
}

Alias(别名类型)

别名包括两种类型:

  • 数据流的别名指向一个或多个数据流
  • 索引的别名指向一个或多个索引

当使用ES时,可以创建别名来对索引进行分组、划分和隐藏。创建别名是一种将逻辑名称映射到一个或多个索引的方式,这使得在查询过程中能够快速地使用这些索引。

POST _aliases
{"actions": [{"add": {"index": "test-01","alias": "test"}},{"add": {"index": "test-03","alias": "test"}}]
}# 获取所有的别名列表
GET _aliases# 获取test别名列表
GET _alias/test

Arrays (集合类型)

在Elasticsearch中,没有专用的array数据类型。默认情况下,任何字段都可以包含零个或多个值,但是,数组中的所有值都必须具有相同的数据类型.

{"message": "some arrays in this document…","tags": ["elasticsearch","wow"],"lists": [{"name": "knight","description": "programming list"},{"name": "rose","description": "cool stuff list"}]
}

Binary (二进制类型)

该binary类型接受二进制值作为 Base64编码的字符串。该字段默认情况下不存储,并且不可搜索

PUT test-03
{"mappings": {"properties": {"tags": {"type": "text"},"blob":"binary"}}
}

Boolean(布尔类型)

布尔字段接受JSON true和false值,但也可以接受解释为true或false的字符串

PUT test-03
{"mappings": {"properties": {"is_published": {"type": "boolean"}}}
}

日期类型

JSON没有日期数据类型,因此Elasticsearch中的日期可以是:

  • 包含格式化日期的字符串,例如"2024-01-01"或"2024/01/01 12:10:30"
  • 时间戳
PUT test-011
{"mappings": {"properties": {"date":{"type": "date","format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"}}}
}PUT test-011/_doc/1
{ "date": "2024-01-01" }PUT test-011/_doc/2
{ "date": "2024-01-02" }GET test-011/_search

返回:

{"took" : 558,"timed_out" : false,"_shards" : {"total" : 1,"successful" : 1,"skipped" : 0,"failed" : 0},"hits" : {"total" : {"value" : 2,"relation" : "eq"},"max_score" : 1.0,"hits" : [{"_index" : "test-011","_type" : "_doc","_id" : "1","_score" : 1.0,"_source" : {"date" : "2024-01-01"}},{"_index" : "test-011","_type" : "_doc","_id" : "2","_score" : 1.0,"_source" : {"date" : "2024-01-02"}}]}
}

Dense vector(密集矢量数据类型)

Flattened (扁平化的数据类型)

Geo-point(地理位置数据类型)

PUT test-012
{"mappings": {"properties": {"location": {"type": "geo_point"}}}
}###
PUT test-012/_doc/1
{"text": "Geo-point as an object","location": {"lat": 41.12,"lon": -71.34}
}

地理形状数据类型

的geo_shape数据类型方便的索引和与任意的地理搜索为矩形和多边形的形状,例如。当正在索引的数据或正在执行的查询包含除点以外的其他形状时,应使用它。

PUT test-012
{"mappings": {"properties": {"location": {"type": "geo_shape"}}}
}

IP数据类型

一个ip字段可以索引/存储IPv4或 IPv6地址

PUT test-013
{"mappings": {"properties": {"ip_addr": {"type": "ip"}}}
}PUT test-013/_doc/1
{
"ip_addr": "192.168.1.1"
}

Join (联接数据类型)

Nested (嵌套数据类型)

Object (对象数据类型)

Numeric (数值数据类型)

Range(范围数据类型)

Token count (令牌计数数据类型)


http://www.ppmy.cn/news/1405426.html

相关文章

【算法】字典序超详细解析(让你有一种相见恨晚的感觉!)

目录 一、前言 二、什么是字典序 ? ✨字典序概念 ✨深度理解字典序 ✨字典序排序的重要性和应用场景 三、常考面试题 ✨ 下一个排列 ✨ 字典数排序 ✨ 字典序最小回文串 四、共勉 一、前言 经常刷算法题的朋友,肯定会经常看到题目中提到 字典序 这样…

on-my-zsh 命令自动补全插件 zsh-autosuggestions 安装和配置

首先 Oh My Zsh 是什么? Oh My Zsh 是一款社区驱动的命令行工具,正如它的主页上说的,Oh My Zsh 是一种生活方式。它基于 zsh 命令行,提供了主题配置,插件机制,已经内置的便捷操作。给我们一种全新的方式使用命令行。…

JWFD流程图转换为矩阵数据库的过程说明

在最开始设计流程图的时候,请务必先把开始节点和结束节点画到流程图上面,就是设计器面板的最开始两个按钮,先画开始点和结束点,再画中间的流程,然后保存,这样提交到矩阵数据库就不会出任何问题,…

视频监控/云存储/磁盘阵列/AI智能分析平台EasyCVR集成时调用接口报跨域错误是什么原因?

EasyCVR视频融合平台基于云边端架构,可支持海量视频汇聚管理,能提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、智能分析等视频服务。平台兼容性强,支持多协议、多类型设备接入,包括:国标G…

蓝色wordpress外贸建站模板

蓝色wordpress外贸建站模板 https://www.mymoban.com/wordpress/7.html

Android 手机部署whisper 模型

Whisper 是什么? “Whisper” 是一个由OpenAI开发的开源深度学习模型,专门用于语音识别任务。这个模型能够将语音转换成文本,支持多种语言,并且在处理不同的口音、环境噪音以及跨语言的语音识别方面表现出色。Whisper模型的目标是提供一个高效、准确的工具,以支持自动字幕…

python vtk获取模型角度

在Python中,使用VTK库获取3D模型的角度通常涉及到计算模型的几何参数,如物体的最小外接矩形或边界盒子。以下是一个简单的例子,展示如何使用VTK计算3D模型的边界盒子,从而获取模型的角度: import vtk# 创建一个VTK的PolyData对象,并添加模型数据 polyData = vtk.vtkPoly…

Rust所有权和Move关键字使用和含义讲解,以及Arc和Mutex使用

Rust 所有权规则 一个值只能被一个变量所拥有,这个变量被称为所有者。 一个值同一时刻只能有一个所有者,也就是说不能有两个变量拥有相同的值。所以对应变量赋值、参数传递、函数返回等行为,旧的所有者会把值的所有权转移给新的所有者&#…