概念
redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set –有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步
基础
redis是线程安全的
(因为只有一个线程)
,采用非阻塞I/O多路复用
,其所有操作都是原子的,不会因并发产生数据异常Redis的速度非常快
(因为使用非阻塞式IO,且大部分命令的算法时间复杂度都是O(1))
使用高耗时的Redis命令是很危险的,会占用唯一的一个线程的大量处理时间,导致所有的请求都被拖慢。
(例如时间复杂度为O(N)的KEYS命令,严格禁止在生产环境中使用)
String是Redis的基础数据类型,Redis没有Int、Float、Boolean等数据类型的概念,所有的基本类型在Redis中都以String体现
Redis的List是链表型的数据结构,可以使用LPUSH/RPUSH/LPOP/RPOP等命令在List的两端执行插入元素和弹出元素的操作。虽然List也支持在特定index上插入和读取元素的功能,但其时间复杂度较高(O(N)),应小心使用
Hash即哈希表,Redis的Hash和传统的哈希表一样,是一种field-value型的数据结构,可以理解成将HashMap搬入Redis
Hash的优点包括:
1、可以实现二元查找,如"查找ID为1000的用户的年龄"
2、比起将整个对象序列化后作为String存储的方法,Hash能够有效地减少网络传输的消耗
3、当使用Hash维护一个集合时,提供了比List效率高得多的随机访问命令
持久化方式
RDB
建议至少开启RDB方式的数据持久化:RDB方式的持久化几乎不损耗Redis本身的性能,在进行RDB持久化时,Redis主进程唯一需要做的事情就是fork出一个子进程,所有持久化工作都由子进程完成
Redis默认开启RDB快照:
1 | save 900 1 |
AOF
采用AOF持久方式时,Redis会把每一个写请求都记录在一个日志文件里。在Redis重启时,会把AOF文件中记录的所有写操作顺序执行一遍,确保数据恢复到最新
AOF提供了三种fsync配置,always/everysec/no,通过配置项[appendfsync]指定:
appendfsync no:不进行fsync,将flush文件的时机交给OS决定,速度最快
appendfsync always:每写入一条日志就进行一次fsync操作,数据安全性最高,但速度最慢
appendfsync everysec:折中的做法,交由后台线程每秒fsync一次
数据淘汰机制
Redis提供了5种数据淘汰策略:
volatile-lru:使用LRU算法进行数据淘汰(淘汰上次使用时间最早的,且使用次数最少的key),只淘汰设定了有效期的key
allkeys-lru:使用LRU算法进行数据淘汰,所有的key都可以被淘汰
volatile-random:随机淘汰数据,只淘汰设定了有效期的key
allkeys-random:随机淘汰数据,所有的key都可以被淘汰
volatile-ttl:淘汰剩余有效期最短的key
最好为Redis指定一种有效的数据淘汰策略以配合maxmemory设置,避免在内存使用满后发生写入失败的情况
Pipelining
Redis提供许多批量操作的命令,如MSET/MGET/HMSET/HMGET等等,这些命令存在的意义是减少维护网络连接和传输数据所消耗的资源和时间
如果客户端要连续执行的多次操作无法通过Redis命令组合在一起,此时便可以使用Redis提供的pipelining功能来实现在一次交互中执行多条命令
Redis性能调优
1、最初的也是最重要的,确保没有让Redis执行耗时长的命令
2、使用pipelining将连续执行的命令组合执行
3、操作系统的Transparent huge pages功能必须关闭
4、如果在虚拟机中运行Redis,可能天然就有虚拟机环境带来的固有延迟。可以通过./redis-cli --intrinsic-latency 100命令查看固有延迟。同时如果对Redis的性能有较高要求的话,应尽可能在物理机上直接部署Redis。
6、检查数据持久化策略
7、考虑引入读写分离机制
主从复制
Redis支持一主多从的主从复制架构。一个Master实例负责处理所有的写请求,Master将写操作同步至所有Slave。
借助Redis的主从复制,可以实现读写分离和高可用:
实时性要求不是特别高的读请求,可以在Slave上完成,提升效率。特别是一些周期性执行的统计任务,这些任务可能需要执行一些长耗时的Redis命令,可以专门规划出1个或几个Slave用于服务这些统计任务
借助Redis Sentinel可以实现高可用,当Master crash后,Redis Sentinel能够自动将一个Slave晋升为Master,继续提供服务
Redis Sentinel 哨兵模式
Redis Sentinel是Redis官方开发的监控组件,可以监控Redis实例的状态,通过Master节点自动发现Slave节点,并在监测到Master节点失效时选举出一个新的Master,并向所有Redis实例推送新的主从配置。
Redis Sentinel需要至少部署3个实例才能形成选举关系
Redis Cluster 集群分片
为何要做集群分片?
1、Redis中存储的数据量大,一台主机的物理内存已经无法容纳
2、Redis的写请求并发量大,一个Redis实例以无法承载
Redis Cluster的能力
1、能够自动将数据分散在多个节点上
2、当访问的key不在当前分片上时,能够自动将请求转发至正确的分片
3、当集群中部分节点失效时仍能提供服务
其中第三点是基于主从复制来实现的,Redis Cluster的每个数据分片都采用了主从复制的结构
Redis Cluster分片原理
Redis Cluster中共有16384个hash slot,Redis会计算每个key的CRC16,将结果与16384取模,来决定该key存储在哪一个hash slot中,同时需要指定Redis Cluster中每个数据分片负责的Slot数。Slot的分配在任何时间点都可以进行重新分配。
客户端在对key进行读写操作时,可以连接Cluster中的任意一个分片,如果操作的key不在此分片负责的Slot范围内,Redis Cluster会自动将请求重定向到正确的分片上
Redis常见问题
单线程的redis为什么这么快?
1、纯内存操作
2、单线程操作,避免了频繁的上下文切换
3、采用了非阻塞I/O多路复用机制
先删除缓存再更新数据库
,这个操作是错误的
如果出现两个并发线程同时操作,更新操作是先删除了缓存,查询操作从数据库查了旧的数据,导致如果数据没有再更新的话,缓存中一直是旧数据
Redis安装
通过homebrew
1 | brew install redis //下载安装 |
通过官方下载源码包
1 | wget http://download.redis.io/releases/redis-5.0.0.tar.gz |
包下的README.md有使用教程
1 | set key value |
redis.conf配置
1 | daemonize : 是否后台运行,将其设为no,表示前台运行。 |
Redis Cluster集群部署
每个节点对应一个redis.conf和node.conf(自动生成,命名不同)
- 最小的Redis群集配置文件
1 | port 7000 |
- 启动redis
1 | redis-server ./redis7000.conf |
- 将redis节点关联成集群
1 | redis-cli --cluster create 127.0.0.1:7000 127.0.0.1:7001 \ |
输入yes后,此时搭建集群成功
另外可以使用如下命令快速搭建集群
1 | create-cluster start |
spring boot整合redis
引入pom
1 | <dependency> |
application.yml配置
1 | server: |
redis配置文件
1 | @Configuration |
RedisUtil
1 | @Component |
SpringBoot中可以基础redis作为缓存
配置:spring.cache.type:redis
启动缓存:@EnableCaching
实现:CachingConfigurerSupport
最后使用注解:@Cacheable注解在方法上,该方法的返回结果既被缓存
参考文献:
- I/O多路复用
- 官方redis集群教程
- Redis系列九(redis集群高可用)
- docker redis 集群(cluster)搭建
- springboot整合redis周围缓存
- Spring Data Redis官方教程
- Spring Boot使用Spring Data Redis操作Redis(单机/集群)
以下是复习Redis面试原理相关