您现在的位置是:亿华云 > 人工智能
Redis八股文精讲:字符串
亿华云2025-10-09 13:48:47【人工智能】1人已围观
简介写在前面小牛之前出了八股文背诵版系列,不少朋友问我,能不能搞个八股文精讲,把面试问题讲讲透,于是系列就这样诞生了。咱们第一期先聊聊Redis。字符串Redis底层是C语言实现的。于是不少朋友想当然的以
写在前面
小牛之前出了八股文背诵版系列,文精不少朋友问我,讲字能不能搞个八股文精讲,符串把面试问题讲讲透,文精于是讲字系列就这样诞生了。咱们第一期先聊聊Redis。符串
字符串
Redis底层是文精C语言实现的。于是讲字不少朋友想当然的以为,Redis的符串字符串和C语言字符串实现方式一致。
但事实上,文精Redis自己定义了一套字符串的讲字实现,名曰SDS(simple dynamic string)。符串
不少同学在面试时,文精面试官轻描淡学来一句,讲字来讲一讲Redis的符串SDS吧。大家一脸懵逼,半天答不上来。最后搞半天,其实面试官就是问的Redis字符串呀。
首先回答一个问题:为什么Redis不采用C语言的字符串直接做具体实现?
这当然是因为这种数据结构有固有缺陷啦。主要有如下几个
缺点1:O(n)复杂度获取长度
我们知道,C语言如何判断一个字符串已经结束,亿华云当然是通过标志位\0。
C语言Str
所以,对于我们想获得字符串长度,我们需要从头开始遍历,直至遍历到\0,时间复杂度变成了O(n)。
缺点2:没有较好的扩容机制
对于C语言,想要搞个字符串数组,肯定需要预先确定好字符串长度。如果这个字符串经常需要修改,修改前后长度一致还好说,如果不一致,那程序层面就需要重新申请一段新内存,并把字符一个个拷贝到新的地方。
缺点3:特殊字符无法处理
引用《Redis源码剖析与实战》的例子 如果我们想存储字符串"redis\0"
char *a = "redis\0";到原始C语言,它编译器看到\0,以为还是字符结束的标志呢,如果把它打印下来,它只打出redis。所以特别是对于二进制数据,这种奇奇怪怪的case特别多,因此C语言的字符数组就处理不了这块存储二进制字符的需求了。
为了解决C语言字符数组的云服务器提供商不足,redis提出了新的方法。我们先来看看3.0及之前版本的实现。
struct sdshdr { unsigned int len; unsigned int free; char buf[]; }来解释一下这些字段吧。
len:数组字符串已使用长度
free: 数组未使用的字符串长度
buf:存储字符串
在之后的版本,Redis对SDS进行了改进,但大体思想不变
struct sdshdr { unsigned int len; unsigned int alloc; unsigned char flags; char buf[]; }来解释一下这些字段吧。
len:数组字符串已使用长度
alloc: 数组分配的长度
flags: 表示SDS类型
buf:存储字符串
对于SDS类型,我也稍微多啰嗦两句。在新版本redis中,有4种SDS类型(sdshrd5 never used)。其中 sdshrd8 sdshrd16 sdshrd32 sdshrd64 的区别仅仅就在len和alloc上有所区别。
对于sdshrd8 该定义为
struct sdshdr8 { uint8_t len; uint8_t alloc; unsigned char flags; char buf[]; }以此类推,sdshrd16就是
struct sdshdr16 { uint16_t len; uint16_t alloc; unsigned char flags; char buf[]; }那为啥新版Redis搞这么多结构体?一个结构体不是一法通万法就够了嘛。
当然,事实确实如此,按实现角度看。如果只采用sdshrd64,肯定也够了。
但按抠门角度看呢?如果我们机子很菜,内存很小,想抠抠索索能省一点,是一点,这样做就有好处辣。源码下载
好处在哪里?当然是uint8_t、uint16_t、uint32_t、uint64_t占的空间不一样,对于小字符串,用小头sdshdr8,这样len 和alloc占用字段也能省一点,就是这么回事。
所以可以看到,SDS本质上是C语言的字符数组,加上了一点别的标识属性的结构体而已。小伙伴们下次碰见面试官问SDS,就不用慌啦!
最后多啰嗦两句SDS扩容:
对于字符串增加了,如果原始的剩余空间足够,直接返回 如果空间不足够,重新申请两倍最小需要长度的空间,再进行挨个赋值。最后总结一下:Redis提出动态字符串这一数据结构,改进了C语言字符数组的不足。该动态字符串有如下好处:
字符串长度获取时间复杂度从O(n)->O(1) 减少字符串扩容引起的数据搬运次数。 可以存储更加复杂的二进制数据参考
《Redis源码剖析与实战》
https://blog.csdn.net/weixin_39744512/article/details/111170924
https://blog.csdn.net/wolf2s/article/details/107945242
《Redis的设计与实现》
很赞哦!(22847)
相关文章
- 审核通过的域名将显示在域名竞拍页面,并进入正式拍卖期,买家可以在拍卖周期内出价,加价幅度与拍卖保证金说明,点此查看。
- 硬核八张图搞懂 Flink 端到端精准一次处理语义 Exactly-once
- 鸿蒙轻内核M核源码分析系列十三 消息队列Queue
- 用 Python 监控 Uniswap 加密货币价格
- 个人域名转为公司需要什么条件?个人域名转为公司该怎么做?
- 分布式事务,阿里为什么钟爱TCC
- 教你使用TensorFlow2对阿拉伯语手写字符数据集进行识别
- 用uid分库,uname上的查询怎么办?
- 在更换域名后,并不是就万事大吉了,我们需要将旧域名做301重定向到新域名上,转移旧域名的权重到新域名上。
- 如何设计领域特定语言,实现终极业务抽象?