简单动态对象(simple dynamic string, SDS)
C字符串只会作为字符串字面量(string literal)用在一些无须对字符串进行修改的地方,不如打印日志
redisLog(REDIS_WARNING, "Redis is now ready to exit, byebye…");
当Redis需要的不仅仅是一个字符串字面量,而是一个可以被修改的字符串时,Redis就会使用SDS来表示字符串值
SDS还被用作缓冲区(buffer)
AOF模块中的AOF缓冲区
客户端状态中的输入缓冲区
SDS的定义
这个结构体的长度是4+4+6=14个字节
SDS与C字符串的区别
常数复杂度获取字符串长度
C获取字符串长度的复杂度为O(N),SDS长度复杂度为O(1)
设置和更新SDS长度的工作是由SDS的API在执行时自动完成的,使用SDS无须进行任何手动修改长度的工作(修改长度且向修改后的SDS填充数据时,应该是比C复杂的?)
使用SDS,Redis将获取字符串长度所需的复杂付从O(N)降低到了O(1),确保了获取字符串长度的工作不会成为Redis的性能瓶颈
杜绝缓冲区溢出
SDS的控件分配策略完全杜绝了发生缓冲区溢出的可能性:当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足修改所需的要求,如果不满足的话,API会自动将SDS的空间扩展至执行修改所需的大小,然后才执行实际的修改问题
注意:sdscat不仅对SDS进行了拼接操作,还为SDS分配了与当前len相同的未使用空间。
减少修改字符串时带来的内存重分配次数
SDS通过未使用空间借出了字符串长度和底层数组长度之间的关联。通过未使用空间,SDS实现了空间预分配和惰性空间释放两种优化策略。
空间预分配
空间预分配用于优化SDS的字符串增长操作:当SDS的API对一个SDS进行修改,并且需要对SDS进行空间扩展的时候,程序不仅会未SDS分配修改所必须的空间,还会为SDS分配额外的未使用空间:
修改后,SDS的len<1MB,程序分配和len属性同样大小的未使用空间
修改后,SDS的len>=1MB,程序会分配1MB的未使用空间。
在扩展SDS空间之前,SDS API会先检查未使用空间是否足够,如果足够的话,就会·直接使用未使用空间,而无需执行内存重分配。
通过这种预分配策略,SDS将连续增长N次字符串所需的内存重分配次数从必定N次降低为最对N次。
惰性空间释放
惰性空间释放用于优化SDS的字符串缩短操作:当SDS的API需要缩短SDS保存的字符串时,程序并不立即使用内存重分配操作来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来使用
通过惰性空间释放策略,SDS避免了缩短字符串时所需要的内存重分配操作,并为将来可能有的增长操作提供了优化。
SDS提供相应的API,在有需要时,真正释放SDS的未使用空间,不用担心惰性空间释放策略会造成内存浪费。
二进制安全
SDS得API都是二进制安全得的binary-safe),所有SDS API都会以处理二进制得方式来处理SDS存放在buf数组里得数据,程序不会对其中得数据做任何限制、过滤、或者假设,数据在写入时是什么样得,它被读取时就是什么样的。
SDS的buf属性称为字节数组,用它来保存一系列二进制数据。
通过使用二进制安全的SDS,使得Redis不仅可以保存文本数据,还可以保存任意格式的二进制数据。
兼容部分C字符串函数
SDS的API都是二进制安全的,并遵循C字符串以空字符结尾的惯例,这是为了让保存文本数据的SDS可以重用一部分<string.h>库定义的函数。
总结
SDSAPI
重点回顾
Redis只会使用C字符串作为字面量,在大多数情况下,Redis使用SDS(Simple Dynamic String,简单动态字符串)作为字符串表示。
比起C字符串,SDS具有以下有点:
常数复杂度获取字符串长度
杜绝缓冲区溢出
减少修改字符串长度时所需的内存重分配次数
二进制安全
兼容部分C字符串函数