数据存储效率对决：Redis String vs. Hash性能大比拼，哪个更适合你？

开发运维 2023-08-21 Escape 手机阅读

一、Redis的数据类型

1、常规类型

1）String（字符串）：最基本的数据结构，可以存储任何类型的字符串、数字或二进制数据。

2）Hash（哈希表）：类似于关联数组或字典，可以存储多个字段和对应的值，常用于存储对象属性或配置信息。

3）List（列表）：一个有序的字符串列表，支持在列表两端进行插入和删除操作，还提供了多种操作，如查找、裁剪、排序等。

4）Set（集合）：一个无序的字符串集合，支持添加、删除、查找和求交、并、差等操作，还提供了多种操作，如求随机元素、判断元素是否存在等。

5）ZSet（有序集合）：和 Set 类型相似，但是每个元素都有一个分数（score），根据分数进行排序，可以支持按照分数范围进行查找、插入和删除操作。

2、官网最全类型

Redis支持的数据类型概述

Redis 是一个数据结构服务器。Redis 的核心提供了一系列本机数据类型，可帮助您解决从缓存到队列再到事件处理的各种问题。下面是每种数据类型的简短描述，以及更广泛的概述和命令参考的链接。

如果您想尝试每种数据结构的综合教程，请参阅下面的概述页面。

String

Redis String是最基本的 Redis 数据类型，表示字节序列。有关更多信息，请参阅：

Redis 字符串概述
Redis字符串命令参考

List

Redis List是按插入顺序排序的字符串列表。有关更多信息，请参阅：

Redis 列表概述
Redis列表命令参考

Sets

Redis 集是唯一字符串的无序集合，其作用类似于您最喜欢的编程语言中的集（例如，Java HashSets、Python 集等）。使用 Redis 集合，您可以在 O(1) 时间内添加、删除和测试是否存在（换句话说，无论集合元素的数量有多少）。有关更多信息，请参阅：

Redis 集概述
Redis set命令参考

Hash

Redis 哈希是建模为字段值对集合的记录类型。因此，Redis 哈希类似于Python 字典、Java HashMap和Ruby 哈希。有关更多信息，请参阅：

Redis 哈希概述
Redis 哈希命令参考

Sorted sets

Redis 排序集是唯一字符串的集合，它们通过每个字符串的关联分数来维护顺序。有关更多信息，请参阅：

Redis 排序集概述
Redis有序集命令参考

Streams

Redis Streams是一种数据结构，其作用类似于仅附加日志。流有助于按事件发生的顺序记录事件，然后将它们联合起来进行处理。有关更多信息，请参阅：

Redis 流概述
Redis Streams 命令参考

Geospatial indexes

Redis Geospatial indexes对于查找给定地理半径或边界框内的位置非常有用。有关更多信息，请参阅：

Redis 地理空间索引概述
Redis 地理空间索引命令参考

Bitmaps

Redis Bitmaps允许您对字符串执行按位运算。有关更多信息，请参阅：

Redis 位图概述
Redis 位图命令参考

Bitfields

Redis Bitfields有效地对字符串值中的多个计数器进行编码。位域提供原子获取、设置和增量操作，并支持不同的溢出策略。有关更多信息，请参阅：

Redis 位域概述
命令BITFIELD。

HyperLogLog

Redis HyperLogLog数据结构提供大型集合的基数（即元素数量）的概率估计。有关更多信息，请参阅：

Redis HyperLogLog概述
Redis HyperLogLog命令参考

Extensions

要扩展所包含数据类型提供的功能，请使用以下选项之一：

在 Lua 中编写您自己的自定义服务器端函数。

使用模块 API编写您自己的 Redis 模块或查看社区支持的模块。

使用Redis Stack提供的JSON、查询、时间序列和其他功能。

3、Redis内部编码

在 Redis 中，"内部编码"指的是数据在内存中以何种方式进行编码和存储，以便在运行时有效地管理和操作数据。Redis 为每种数据类型选择了一组不同的编码方式，以根据数据的特点和使用情况来最大程度地减少内存占用并提高性能。

每种数据类型都可能有多种内部编码方式，这些编码方式对应不同的数据结构，以适应不同的数据场景。例如，对于字符串类型，Redis 可能根据字符串的内容和长度选择不同的内部编码方式。而对于哈希类型，Redis 可能根据字段数量和字段值的长度来选择内部编码方式。

内部编码的选择是自动进行的，由 Redis 在运行时根据数据的特点和存储需求来动态地切换。这种动态切换使 Redis 能够在不同的情况下优化内存使用和性能，从而更好地满足不同应用场景的需求。

了解内部编码可以帮助您更好地理解 Redis 如何管理数据，并在设计和优化应用程序时做出更明智的决策。

我们可以通过命令object encoding 来查看对象的内部编码：

 > SET mystring "123"
OK
> OBJECT ENCODING mystring
int

以下是常见对象类型及对应的内部编码：

字符串类型 (string)：

内部编码：根据字符串内容和长度，可能使用 int、embstr、raw 三种编码方式。
说明：int 编码用于存储可以表示为整数的字符串，embstr 编码用于短字符串，raw 编码用于一般字符串。

哈希类型 (hash)：

内部编码：根据哈希表中字段数量和字段值的长度，可能使用 ziplist、hashtable 两种编码方式。
说明：ziplist 编码用于字段较少或字段值较短的情况，hashtable 编码用于字段较多或字段值较长的情况。

列表类型 (list)：

内部编码：根据列表长度和元素的长度，可能使用 ziplist、linkedlist 两种编码方式。
说明：ziplist 编码用于短列表，linkedlist 编码用于较长的列表。

集合类型 (set)：

内部编码：根据集合中元素数量和元素的长度，可能使用 intset、hashtable 两种编码方式。
说明：intset 编码用于存储整数成员的集合，hashtable 编码用于存储字符串成员的集合。

有序集合类型 (zset 或 sortedset)：

内部编码：根据有序集合中元素数量和元素的长度，可能使用 ziplist、skiplist 两种编码方式。
说明：ziplist 编码用于短有序集合，skiplist 编码用于较长的有序集合。

二、String与Hash如何选择？

Redis作为一种流行的内存数据存储，提供了多种数据结构来适应不同的用例。其中，String和Hash是Redis中最基础的两种数据结构。虽然它们都是Redis的重要组成部分，但它们各自具有不同的用途和性能特点。在本文中，我们将深入探讨在应用程序需求下如何在String和Hash之间做出选择。

1、String数据结构

String是Redis中最简单的数据类型，可以存储文本、整数和浮点数。在选择使用String数据结构时，应考虑以下场景：

单一值存储：如果只需要为给定的键存储单个值，例如缓存计算结果或存储用户偏好设置，那么String是首选的选项。

原子操作： Redis对String提供原子操作，允许您对键的数值进行递增、递减和操作。这对于实现计数器、锁和简单分析非常有用。

缓存简单数据：如果要缓存不需要复杂结构的数据，如HTML片段或序列化对象，String能够提供高效的存储和检索。

2、Hash数据结构

相对于String，Hash是一种更为复杂的数据结构，它允许您在单个键下存储字段-值对。以下情况考虑使用Hash数据结构：

结构化数据： Hash非常适合存储结构化数据，比如用户资料，其中每个字段对应于特定的属性（如用户名、电子邮件、年龄）。

部分更新：当需要更新对象的特定字段而不影响整个数据结构时，Hash表现出色。这比使用String替换整个值更加高效。

减少键空间混乱：使用Hash，您可以将相关字段分组在一个键下，而不是为实体的每个字段使用单独的String键，从而使键空间更加有序。

使用场景：

String 数据类型：

- 适用于存储单个值，如用户的 session 数据、计数器、配置信息等。
- 不需要进行复杂的结构化查询或数据处理。
- 适合存储简单的字符串数据，如缓存、验证码等。

Hash 数据类型：

- 适用于存储多个字段的数据，类似于关联数组或对象。
- 需要进行复杂的结构化查询和数据处理，如用户信息、商品信息、文章内容等。
- 可以有效地对单个字段进行读写操作，避免整个对象的序列化和反序列化开销。

性能分析：

String 数据类型性能：

- 读写操作非常高效，可以在常数时间内完成。
- 适用于简单的 GET 和 SET 操作，特别是对于键的更新频率较低的情况。
- 在存储大量短期数据，如缓存数据时，表现出色。

Hash 数据类型性能：

- 适用于需要存储和操作多个字段的数据，不需要对整个对象进行读写操作。
- Hash 在存储大量字段时可以节省内存，因为 Redis 对每个字段会采用类似字典的结构进行存储。
- 对于大规模的查询和更新操作，Hash 数据类型可以更高效地进行。
- 注意，当 Hash 内部字段数量较少时，可能会造成内存浪费，因为 Hash 需要一定的额外空间来存储字段信息。

在实际应用中，往往会结合使用不同的 Redis 数据类型来满足不同的需求。例如，对于用户的基本信息，可以使用 Hash 数据类型存储用户 ID 到详细信息的映射关系；而对于用户的 session 数据，可以使用 String 数据类型存储单个用户的 session 信息。

在做选择时，要根据实际需求权衡存储结构、查询和更新的频率、数据量等因素。需要强调的是，Redis 的性能在大部分情况下都非常出色，但最佳选择会取决于您的具体应用需求。最好的方式是在实际场景中进行测试和基准测试，以确定最适合您应用的数据类型。