Python使用Redis缓存
Python使用Redis缓存
RandomEnch前言
最近编写了一个Flask应用,其API接口需要访问MySQL数据库读取数据,为了防止高并发情况下MySQL数据库的压力,使用了Redis作为缓存来提高API接口的响应速度。本文将介绍Redis的基本概念和在Python中的使用方法。
Redis简介
Redis(Remote Dictionary Server)是一个开源的高性能键值对存储数据库,最初由 Salvatore Sanfilippo 开发,它在内存中存储数据,并提供了持久化功能,可以将数据保存到磁盘中,是一种NoSQL(not-only sql,非关系型数据库)的数据库。
它的数据结构十分丰富,基础数据类型包括:string(字符串)、list(列表,双向链表)、hash(散列,键值对集合)、set(集合,不重复)和 sorted set(有序集合),这使得它不仅仅是一个简单的键值存储,还可以用于存储和处理复杂的数据。
Redis 特点/优势
Redis 具备许多特点和优势,所以在大规模应用和高并发场景中得到广泛应用。
- 丰富的数据结构:Redis 支持多种数据结构,包括字符串(String)、哈希(Hash)、列表(List)、集合(Set)、有序集合(Sorted Set)等。每种数据结构都有丰富的操作命令,可以方便地对数据进行存储和处理。
- 持久化:Redis 提供了两种持久化方式,RDB(Redis Database)和 AOF(Append Only File)。RDB 是将数据库在指定时间点转储到磁盘的快照持久化方式,AOF 是将写操作追加到文件末尾的日志持久化方式。这两种方式可以根据需求进行选择,保证数据在服务器重启后不会丢失。
- 高性能:Redis 是一种内存数据库,数据存储在内存中,因此读写速度非常快。它采用单线程模型,避免了多线程带来的竞争问题,使得 Redis 能够充分利用 CPU 和内存资源。
- 支持事务:Redis 支持事务操作,可以将多个命令打包执行,保证这些命令要么全部执行成功,要么全部失败,保持数据的一致性。虽然 Redis 在单个命令的执行上是原子性的,但是多个命令的组合并不是原子性的,通过事务可以实现一组命令的原子性执行。
- 高可用与分布式:Redis 支持主从复制、哨兵和集群等功能,可以构建高可用和分布式的 Redis 架构。主从复制可以实现数据的热备份和读写分离,哨兵可以监控 Redis 的健康状态并进行自动故障转移,集群可以将数据分布在多个节点上,提高性能和扩展性。
- 发布订阅:Redis 支持发布订阅模式,可以实现消息的发布和订阅。发布者将消息发布到指定的频道,订阅者可以订阅感兴趣的频道并接收相应的消息,实现了解耦和实时通信。
Redis 为什么很快
- 内存存储:Redis将数据存储在内存中,而不是像传统的磁盘存储数据库那样将数据写入到硬盘上。由于内存的读写速度远远快于磁盘,因此Redis能够实现极快的读写性能。
- 单线程模型:Redis采用单线程模型,每个Redis实例都由单个主线程来处理所有的客户端请求。虽然单线程看起来似乎会限制其性能,但这实际上是Redis的一大优势。单线程模型消除了多线程之间的竞争和锁等开销,使得Redis能够充分利用CPU资源,并且避免了多线程带来的复杂性。此外,Redis在内部使用了I/O多路复用技术(例如epoll或kqueue)来处理并发请求,使得单线程能够同时处理多个客户端连接。
- 非阻塞IO:Redis使用了非阻塞IO,也就是在读写操作时不会阻塞其他操作。在读取数据时,如果内存中没有所需的数据,Redis会立即返回一个空结果,而不会等待数据从磁盘加载进来。这样即使在高并发情况下,Redis也能够快速地响应请求。
- 高效的数据结构:Redis支持多种高效的数据结构,比如字符串、哈希、列表、集合、有序集合等。这些数据结构的设计和实现都非常高效,能够在常量时间内完成查找、插入、删除等操作,保证了Redis的高速性能。
- 异步操作:Redis支持异步操作,比如异步持久化和异步复制。异步操作能够让Redis在进行磁盘持久化和主从复制时不会阻塞其他操作,提高了整体的性能。
优化的网络协议:Redis使用RESP(Redis Serialization Protocol)作为网络协议,RESP是一种简单、高效的二进制协议。RESP协议的设计使得网络传输的数据量尽可能地减少,减少了网络传输的开销,提高了性能。 - 原子性操作:Redis支持很多原子性操作,比如INCR、DECR、SETNX等。原子性操作能够在一条命令中完成多个操作,而且这些操作是不可中断的,保证了数据的一致性。
应用场景
由于 Redis 具备高性能、丰富的数据结构和多种特性,它的主要应用场景如下:
- 缓存:作为缓存数据库,Redis 可以将经常访问的数据存储在内存中,避免频繁读写数据库,提高应用的响应速度。缓存可以存储热点数据,减轻后端数据库的压力,提高系统的吞吐量。
- 计数器:利用 Redis 的原子性操作,可以实现高效的计数器功能,比如网站的点赞、浏览次数等统计功能。由于 Redis 原子性操作的特性,计数器的更新可以并发执行而不会出现竞争问题。
- 消息队列:Redis 的发布订阅功能和列表数据结构可以实现简单的消息队列,用于解耦系统的各个模块。生产者将消息发布到指定频道,消费者订阅感兴趣的频道并处理消息,实现异步消息传递。
排行榜:使用有序集合数据结构,可以实现排行榜功能,比如游戏中的玩家排名。通过有序集合的分数属性,可以对玩家的得分进行排序和排名,实时显示排行榜。 - 会话缓存:在 Web 应用中,可以使用 Redis 存储用户的会话数据,实现分布式会话管理。用户登录后,可以将会话数据存储在 Redis 中,从而实现多台服务器之间的会话共享。
Redis 常用命令
Redis 提供了命令行客户端 redis-cli,用于与 Redis 服务进行交互。以下是一些常用的 Redis 命令:
SET:添加或修改一个字符串类型的键值对。
GET:根据键名获取对应的值。
INCR:将一个整数值自增 1。
DECR:将一个整数值自减 1。
LPUSH:向列表的左边插入一个元素。
RPUSH:向列表的右边插入一个元素。
HSET:添加或修改一个哈希类型键的字段值。
HGET:根据键名和字段名获取哈希类型的值。
Python 中使用 Redis
安装 redis-py 库
1 | pip install redis |
连接 Redis 服务器
1 | import redis |
数据操作
字符串操作
- key 代指键名
- string 代指值(字符串类型)
设置键值对 set(key, string)
1 | r.set('mykey', 'myvalue') |
获取字符串 get(key)
1 | value = r.get('mykey') |
检查键是否存在 exists(key)
1 | exists = r.exists('mykey') |
删除键 delete(key)
1 | deleted = r.delete('mykey') |
批量设置键值对 mset({key: value, key1: value1})
1 | r.mset({'key1': 'value1', 'key2': 'value2'}) |
哈希操作
- keytable 代指哈希表
- key 字段
- value 数据
存储哈希值hset(keytable, key, value)
1 | r.hset('myhash', 'field1', 'value1') |
获取哈希值hget(keytable, key)
1 | value = r.hget('myhash', 'field1') |
批量存储哈希值hget(keytable, key_dict)
1 | # 假设 hmset 可用 |
获取所有哈希值hgetall(keytable)
1 | all_fields_values = r.hgetall('myhash') |
列表操作
- mylist 代指列表名
- value代指数据
添加元素
- lpush(mylist, value) 在列表左侧添加
- rpush(mylist, value) 在列表右侧添加
1 | r.lpush('mylist', 'value1') # 在列表左侧添加 |
获取列表元素lrang(mylist, start, end)
- start 索引开始位置
- end 索引结束位置
1 | # 获取列表中的所有元素 |
移除元素
- lpop:移除并获取列表的第一个元素
- rpop:移除并获取列表的最后一个元素
1 | # 移除并获取列表的第一个元素 |
列表长度llen(mylist)
1 | print(r.llen('mylist')) # 输出列表的长度 |
集合操作
- myset 集合名
- value 数据
添加元素sadd(myset, value)
1 | r.sadd('myset', 'element1') |
获取集合中的元素smember(myset)
1 | elements = r.smembers('myset') |
集合的长度scart(myset)
1 | length = r.scard('myset') |
集合的差集sdiff(myset, myset1)
1 | set1 = {'element1', 'element2', 'element3'} |
集合的交集sinter(myset, myset1)
1 | inter = r.sinter('set1', 'set2') |
从集合中移除元素
使用srem命令从集合中移除一个或多个元素。
1 | r.srem('myset', 'element1', 'element2') |
集合的随机元素
使用srandmember命令从集合中随机获取一个或多个元素。
1 | random_element = r.srandmember('myset') |
集合的弹出元素
使用spop命令从集合中随机移除一个元素并返回该元素。
1 | popped_element = r.spop('myset') |
有序集合
有序集合是Redis中一种特殊的集合类型,它不仅包含元素,还为每个元素关联了一个浮点数分数(score),这使得元素可以按照分数进行排序。
添加元素到有序集合
使用zadd命令向有序集合中添加一个或多个元素及其分数。
1 | r.zadd('mysortedset', {'member1': 1, 'member2': 2}) |
获取有序集合中的元素
使用zrange(升序)或zrevrange(降序)命令获取有序集合中的元素及其分数。
1 | # 升序获取 |
获取有序集合的排名
使用zrank(升序排名)或zrevrank(降序排名)命令获取元素的排名。
1 | rank = r.zrank('mysortedset', 'member1') |
删除有序集合中的元素
使用zrem命令从有序集合中移除一个或多个元素。
1 | r.zrem('mysortedset', 'member1', 'member3') |
使用Redis作为缓存
为了避免短时间内大量的请求访问导致读取数据频繁,可以使用Redis作为缓存来提高API接口的响应速度。我的思路是将函数名和参数作为key,返回值作为value,并根据数据的变动情况设置缓存过期时间。基本不变的数据可以设置较长的过期时间,而经常变动的数据可以设置较短的过期时间,既能提高缓存命中率,又能避免缓存的滞后性。
同时,为了方便存入和取出数据,我将缓存函数写为了装饰器(decorator),可以直接在函数上添加@cache()装饰器,即可在调用函数前先检查缓存,如果缓存存在,则直接返回缓存数据,否则调用函数并将结果存入缓存。
另外,我还在装饰器中添加了refresh参数的识别,如果函数传参时带有refresh=True参数,装饰器会自动将其剔除,不会影响原函数执行,但会强制刷新缓存,即不检查缓存是否存在,这样可以更灵活地控制缓存的更新,比如某些特殊情况下需要即时更新缓存的函数。
1 | import redis |
使用方法:
1 | # 调用缓存装饰器,过期时间为默认时间 |