为什么需要Redis集群

  • 需要提高更大的并发量

    • Redis官方提出拥有10万QPS的请求量
    • 如果业务需要Redis拥有100万的QPS
    • 可以通过集群来提升并发量。
  • 需要存储更大的数据量

    • 一般服务器的机器内存为16G-256G
    • 如果业务需要500G的数据量
    • 可以通过集群的分区技术来扩展数据量

数据分区

1.顺序分区

例如一共有编号为1~100的100条数据,一共有3个分区ABC,则需要预先设计

  • 1~33号数据落入A分区
  • 34~66号数据落入B分区
  • 67~100号数据落入C分区

2.哈希分区

hash(key) % node_count

3.顺序分区 VS 哈希分区

分布方式特点典型产品
哈希分布数据分散度高<br/>键值分布与业务无关<br/>无法顺序访问一致性哈希Memcache<br/>Redis Cluster<br/>其他缓存产品
顺序分布数据分散度易倾斜<br/>键值分布与业务有关<br/>可顺序访问BigTable<br/>HBase

哈希分区

1.节点取余分区

  • 含义:hash(key) % node_count
  • 优点:hash+取余的方式计算节点的分区很简单
  • 缺点:当节点伸缩时候,数据节点关系发生变化,导致数据迁移
  • 扩容的时候建议翻倍扩容,可以降低数据的迁移量。

2.一致性哈希分区

  • 含义:哈希+顺时针(优化取余)

    • 约定长度232位的哈希环,在其中分布若干个hash点。
    • 第一步对每个key做哈希处理得到hashVal
    • 第二步将hashVal顺时针偏移,得到的第一个hash点,即为分区的落点
  • 优点:节点伸缩的时候,只会影响邻近节点,但是还是会有数据迁移
  • 翻倍的伸缩,可以保证最小的迁移数据且达到数据的负载均衡

3.虚拟槽分区

  • 预设虚拟槽,每个槽映射一个数据子集,一般比节点数大
  • 采用CRC16(key) & 16383来决定节点
  • 每个节点顺序地平均分布16384个槽,即当有5个节点时

    • A 0 ~ 3276
    • B 3277 ~ 6553
    • C 6554 ~ 9830
    • D 9831 ~ 13107
    • E 13108 ~ 16383

RedisCluster架构

一、节点

由多个master主节点组成,各个master都负责去读写,每个master都有各自的slave节点。

每个node的cluster_enabled配置为yes

二、Gossip协议

多个master节点之间会使用Gossip协议进行通信

1.meet消息

​ 用于通知新节点加入。消息发送者通知接收者加入到当前集群,meet消息通信正常完成后,接收节点会加入到集群中并进行周期性的ping、pong消息交换。

​ 当A meet B以及A meet C之后,B就可以与C做交互了

2.ping消息

​ 集群中交换最频繁的消息,集群内各个节点每秒向多个其他节点发送ping消息,用于检测节点是否在线和交换彼此状态信息。

​ ping消息发送封装了自身节点和部分其他节点的状态数据。

3.pong消息

​ 当接收到ping、meet消息时,作为响应消息回复给发送方确认消息正常通信。

​ pong消息内部封装了自身状态数据。

​ 节点也可以向集群内广播自身的pong消息来通知整个集群对自身状态进行更新

4.fail消息

​ 当节点判定集群内另一个节点下线时,会向集群内广播一个fail消息,其他节点接收到fail消息之后把对应节点更新诶下线状态

三、指派槽

需要为RedisCluster指派槽,指定各个master节点的槽范围,让它进行正常的读写

四、复制

每个master节点包含若干个slave节点,形成主从复制的形式,以提高高可用性。

通过各个节点之间相互监控来达到Sentinel的目的

RedisCluster安装

RedisCluster主要配置

命令含义
cluster-enabled yes节点是否开启集群模式
cluster-node-timeout 15000节点主观下线超时时间,毫秒
cluster-config-file "nodes.conf"集群配置文件
cluster-require-full-coverage no是否需要所有节点全都可用,集群才能对外服务,此处推荐设置为no

一、原生命令安装

1.配置开启节点

port : 7000、7001、7002、7003、7004、7005

port ${port}
daemonize yes
dir "/redisDataPath"
dbfilename "dump-${port}.rdb"
logfile "${port}.log"
cluster-enabled yes
cluster-config-file nodes-${port}.conf

2.meet

cluster meet ip port
#例如在7000端口上依次执行
cluster meet 127.0.0.1 7001
cluster meet 127.0.0.1 7002
cluster meet 127.0.0.1 7003
cluster meet 127.0.0.1 7004
cluster meet 127.0.0.1 7005

3.指派槽

cluster addslots slot [slot...]
#可以通过编写脚本shell方便实现
#addslot.sh
port=$1
start=$2
end=$3
for slot in `seq ${start} ${end}`
do
    echo "slot:${slot}"
    redis-cli -p ${port} cluster addslots ${slot}
done
#
./addslot.sh 7000 0 5461
./addslot.sh 7001 5462 10922
./addslot.sh 7002 10922 16383

4.设置主从

#可以在任一节点上执行cluster nodes命令查看所有节点的node_id等信息
redis-cli -p 7000 cluster nodes
#在从节点上执行以下操作表示复制master节点
cluster replicate node-id
#
redis-cli -h 127.0.0.1 -p 7003 cluster replicate ${node-id-7000}
redis-cli -h 127.0.0.1 -p 7004 cluster replicate ${node-id-7001}
redis-cli -h 127.0.0.1 -p 7005 cluster replicate ${node-id-7002}

二、官方工具安装

./redis-trib.rb create --replicas 1 127.0.0.1:8000 127.0.0.1:8001 
    127.0.0.1:8002 127.0.0.1:8003 127.0.0.1:8004 127.0.0.1:8005
    
# 1 代表每个master有1个slave
# 此时,一共6个节点,每个master有1个slave,即前3个会形成master节点,后3个会形成slave节点

三、原生命令 VS redis-trib.rb

优点缺点
原生命令易于理解Redis Cluster架构生产环境不使用,太麻烦,容易犯错
redis-trib.rb高效,准确<br/>生产环境可以使用
Last modification:June 2, 2019
如果觉得我的文章对你有用,请随意赞赏