简单动态对象(simple dynamic string, SDS)

重要 C字符串只会作为字符串字面量(string literal)用在一些无须对字符串进行修改的地方,不如打印日志

redisLog(REDIS_WARNING, "Redis is now ready to exit, byebye…");

重要 Redis需要的不仅仅是一个字符串字面量,而是一个可以被修改的字符串时,Redis就会使用SDS来表示字符串值

重要 SDS还被用作缓冲区(buffer)

AOF模块中的AOF缓冲区

客户端状态中的输入缓冲区

SDS的定义

 

这个结构体的长度是4+4+6=14个字节

 

SDSC字符串的区别

常数复杂度获取字符串长度

重要 C获取字符串长度的复杂度为O(N)SDS长度复杂度为O(1)

重要 设置和更新SDS长度的工作是由SDSAPI在执行时自动完成的,使用SDS无须进行任何手动修改长度的工作(修改长度且向修改后的SDS填充数据时,应该是比C复杂的?

重要 使用SDS,Redis将获取字符串长度所需的复杂付从O(N)降低到了O(1),确保了获取字符串长度的工作不会成为Redis的性能瓶颈

杜绝缓冲区溢出

重要 SDS的控件分配策略完全杜绝了发生缓冲区溢出的可能性:当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足修改所需的要求,如果不满足的话,API会自动将SDS的空间扩展至执行修改所需的大小,然后才执行实际的修改问题

重要 注意:sdscat不仅对SDS进行了拼接操作,还为SDS分配了与当前len相同的未使用空间。

减少修改字符串时带来的内存重分配次数

SDS通过未使用空间借出了字符串长度和底层数组长度之间的关联。通过未使用空间,SDS实现了空间预分配和惰性空间释放两种优化策略。

空间预分配

空间预分配用于优化SDS的字符串增长操作:当SDSAPI对一个SDS进行修改,并且需要对SDS进行空间扩展的时候,程序不仅会未SDS分配修改所必须的空间,还会为SDS分配额外的未使用空间:

重要 修改后,SDS的len<1MB,程序分配和len属性同样大小的未使用空间

重要 修改后,SDS的len>=1MB,程序会分配1MB的未使用空间。

在扩展SDS空间之前,SDS API会先检查未使用空间是否足够,如果足够的话,就会·直接使用未使用空间,而无需执行内存重分配。

通过这种预分配策略,SDS将连续增长N次字符串所需的内存重分配次数从必定N次降低为最对N次。

惰性空间释放

重要 惰性空间释放用于优化SDS的字符串缩短操作:当SDSAPI需要缩短SDS保存的字符串时,程序并不立即使用内存重分配操作来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来使用

重要 通过惰性空间释放策略,SDS避免了缩短字符串时所需要的内存重分配操作,并为将来可能有的增长操作提供了优化。

重要 SDS提供相应的API,在有需要时,真正释放SDS的未使用空间,不用担心惰性空间释放策略会造成内存浪费。

二进制安全

重要 SDSAPI都是二进制安全得的binary-safe),所有SDS API都会以处理二进制得方式来处理SDS存放在buf数组里得数据,程序不会对其中得数据做任何限制、过滤、或者假设,数据在写入时是什么样得,它被读取时就是什么样的。

重要 SDS的buf属性称为字节数组,用它来保存一系列二进制数据。

重要 通过使用二进制安全的SDS,使得Redis不仅可以保存文本数据,还可以保存任意格式的二进制数据。

兼容部分C字符串函数

重要 SDSAPI都是二进制安全的,并遵循C字符串以空字符结尾的惯例,这是为了让保存文本数据的SDS可以重用一部分<string.h>库定义的函数。

总结

 

SDSAPI

 

重点回顾

重要 Redis只会使用C字符串作为字面量,在大多数情况下,Redis使用SDS(Simple Dynamic String,简单动态字符串)作为字符串表示。

重要 比起C字符串,SDS具有以下有点:

待办事项 常数复杂度获取字符串长度

待办事项 杜绝缓冲区溢出

待办事项 减少修改字符串长度时所需的内存重分配次数

待办事项 二进制安全

待办事项 兼容部分C字符串函数