这年头,你看到的东西未必就是你认为的东西。一个mysql协议的后面,可能是tidb;一个linux机器后面,可能是一个精简的docker;你觉得xjjdog是个女的,但可能ta自己也不太清楚;而当你大呼php万岁的时候,可能是研发人员和你开个玩笑,重写了后缀,而后端用的却是java。
大家都知道redis速度快,但它的容量和内存容量有关,很容易达到瓶颈。有些互联网公司,直接使用redis作为后端数据库(在下佩服)。当业务量暴增,就面临一个redis容量和价格的权衡问题。改业务代码是来不及了,只好用一些持久化存储 ,来模拟redis的一些数据结构。
redis支持近十种数据类型,最常用的有5种。string、hash、zset、set、list等。本文将针对几种常见的数据结构,探讨一下常用操作的模拟实现。
其实,我们所需要开发的,就是一个redis代理proxy。redis的客户端,连接上我们的代理之后,会进行协议解析。解析出来的命令,将会被模拟,然后根据配置的路由,定位到相应的mysql中。
也就是你所使用的redis,其实使用mysql来存储数据的。没有rdb,也没有aof。
Redis是文本协议
redis是文本协议,协议名称叫做RESP。RESP 是 Redis 序列化协议的简写。它是一种直观的文本协议,优势在于实现异常简单,解析性能极好。
如图,Redis 协议将传输的结构数据,可以总结为 5 种最小单元类型。每个单元结束时,统一加上回车换行符号/r/n 。
下面是几个规则:
比如,下面这个就是数组[9,9,6]的报文。
所以这个协议的解析和拼装,是非常简单的。拿netty来说,就有codec-redis 模块供我们使用。
实现:数据结构设计
在数据表的设计上,我们发现,kv和hash在效率上没有什么差别,因为它能够直接根据key定位到。
反倒是zset,由于有排序的功能,造成了很多操作的执行效率都不尽人意。
另外,由于我们不同的数据结构,是使用不同的表进行存储的。所以删除操作,要在每张表上都执行一遍。
kv设计
kv,即string,是redis里最基本的数据类型。一个key对应一个value,string类型的值最大能存储512MB。
设计专用的数据库表rstore_kv,其中,rkey是主键。
set操作
get操作
del操作
exists操作
ttl操作
hash设计
hash 是一个键值(key=>value)对集合。hash 特别适合用于存储对象。
设计专用的数据库表rstore_hash,其中,rkey和hkey是联合主键。
hset操作
hget操作
hgetall操作
hdel操作
del操作
hlen,hexists操作
ttl操作
zset设计
Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。它的底层结构是跳跃表,效率特别高,但是会占用大量内存。
设计专用的数据库表rstore_zset,其中,rkey和member是联合主键。
zadd操作
zscore操作
zrem操作
zcard,exists操作
zcount操作
zremrangebyscore操作
zrangebyscore操作
zrange操作
zrank操作
ttl操作
del操作
set设计
sadd操作
scard操作
sismember操作
smembers操作
srem操作
del操作
ttl操作
End
本篇文章仅仅模拟了常用数据结构的常用功能,有很多很多功能是不支持的,比较明显的就是分布式锁setnx等。所以这个proxy层的开发,要想做到ok,并不是那么简单。
同时,我们以一种模拟的视角,来看一下redis的数据结构,在关系型数据库中的表现形式。这样,更能够加深我们对redis的认识,明白它存在的价值。
【责任编辑:武晓燕 TEL:(010)68476606】