當(dāng)前位置:首頁 > 公眾號精選 > 小林coding
[導(dǎo)讀]作為一名后端工程師,工作中你肯定和 Redis 打過交道。Redis 為什么快,這點想必你也知道,至少為了面試也做過準(zhǔn)備。很多人知道 Redis 快僅僅因為它是基于內(nèi)存實現(xiàn)的,對于其它原因倒是模棱兩可。

作為一名后端工程師,工作中你肯定和 Redis 打過交道。Redis 為什么快,這點想必你也知道,至少為了面試也做過準(zhǔn)備。很多人知道 Redis 快僅僅因為它是基于內(nèi)存實現(xiàn)的,對于其它原因倒是模棱兩可。


那么今天就來一起看看:


- 思維導(dǎo)圖 -




基于內(nèi)存實現(xiàn)


這點在一開始就提到過了,這里再簡單說說。


Redis 是基于內(nèi)存的數(shù)據(jù)庫,那不可避免的就要與磁盤數(shù)據(jù)庫做對比。對于磁盤數(shù)據(jù)庫來說,是需要將數(shù)據(jù)讀取到內(nèi)存里的,這個過程會受到磁盤 I/O 的限制。


而對于內(nèi)存數(shù)據(jù)庫來說,本身數(shù)據(jù)就存在于內(nèi)存里,也就沒有了這方面的開銷。




高效的數(shù)據(jù)結(jié)構(gòu)


Redis 中有多種數(shù)據(jù)類型,每種數(shù)據(jù)類型的底層都由一種或多種數(shù)據(jù)結(jié)構(gòu)來支持。正是因為有了這些數(shù)據(jù)結(jié)構(gòu),Redis 在存儲與讀取上的速度才不受阻礙。這些數(shù)據(jù)結(jié)構(gòu)有什么特別的地方,各位看官接著往下看:



1、簡單動態(tài)字符串


這個名詞可能你不熟悉,換成?SDS?肯定就知道了。這是用來處理字符串的。了解 C 語言的都知道,它是有處理字符串方法的。而 Redis 就是 C 語言實現(xiàn)的,那為什么還要重復(fù)造輪子?我們從以下幾點來看:


(1)字符串長度處理



這個圖是字符串在 C 語言中的存儲方式,想要獲取 「Redis」的長度,需要從頭開始遍歷,直到遇到 '\0' 為止。



Redis 中怎么操作呢?用一個 len 字段記錄當(dāng)前字符串的長度。想要獲取長度只需要獲取 len 字段即可。你看,差距不言自明。前者遍歷的時間復(fù)雜度為 O(n),Redis 中 O(1)?就能拿到,速度明顯提升。


(2)內(nèi)存重新分配


C 語言中涉及到修改字符串的時候會重新分配內(nèi)存。修改地越頻繁,內(nèi)存分配也就越頻繁。而內(nèi)存分配是會消耗性能的,那么性能下降在所難免。


而 Redis 中會涉及到字符串頻繁的修改操作,這種內(nèi)存分配方式顯然就不適合了。于是 SDS 實現(xiàn)了兩種優(yōu)化策略:


  • 空間預(yù)分配


對 SDS 修改及空間擴充時,除了分配所必須的空間外,還會額外分配未使用的空間。


具體分配規(guī)則是這樣的:SDS 修改后,len 長度小于 1M,那么將會額外分配與 len 相同長度的未使用空間。如果修改后長度大于 1M,那么將分配1M的使用空間。


  • 惰性空間釋放


當(dāng)然,有空間分配對應(yīng)的就有空間釋放。


SDS 縮短時,并不會回收多余的內(nèi)存空間,而是使用 free 字段將多出來的空間記錄下來。如果后續(xù)有變更操作,直接使用 free 中記錄的空間,減少了內(nèi)存的分配。


(3)二進制安全


你已經(jīng)知道了 Redis 可以存儲各種數(shù)據(jù)類型,那么二進制數(shù)據(jù)肯定也不例外。但二進制數(shù)據(jù)并不是規(guī)則的字符串格式,可能會包含一些特殊的字符,比如 '\0' 等。


前面我們提到過,C 中字符串遇到?'\0'?會結(jié)束,那?'\0'?之后的數(shù)據(jù)就讀取不上了。但在 SDS 中,是根據(jù) len 長度來判斷字符串結(jié)束的。


看,二進制安全的問題就解決了。


2、雙端鏈表


列表 List 更多是被當(dāng)作隊列或棧來使用的。隊列和棧的特性一個先進先出,一個先進后出。雙端鏈表很好的支持了這些特性。


- 雙端鏈表?-


(1)前后節(jié)點



鏈表里每個節(jié)點都帶有兩個指針,prev 指向前節(jié)點,next 指向后節(jié)點。這樣在時間復(fù)雜度為 O(1)?內(nèi)就能獲取到前后節(jié)點。


(2)頭尾節(jié)點



你可能注意到了,頭節(jié)點里有 head 和 tail 兩個參數(shù),分別指向頭節(jié)點和尾節(jié)點。這樣的設(shè)計能夠?qū)﹄p端節(jié)點的處理時間復(fù)雜度降至 O(1)?,對于隊列和棧來說再適合不過。同時鏈表迭代時從兩端都可以進行。


(3)鏈表長度


頭節(jié)點里同時還有一個參數(shù) len,和上邊提到的 SDS 里類似,這里是用來記錄鏈表長度的。因此獲取鏈表長度時不用再遍歷整個鏈表,直接拿到 len 值就可以了,這個時間復(fù)雜度是 O(1)。


你看,這些特性都降低了 List 使用時的時間開銷。


3、壓縮列表


雙端鏈表我們已經(jīng)熟悉了。不知道你有沒有注意到一個問題:如果在一個鏈表節(jié)點中存儲一個小數(shù)據(jù),比如一個字節(jié)。那么對應(yīng)的就要保存頭節(jié)點,前后指針等額外的數(shù)據(jù)。


這樣就浪費了空間,同時由于反復(fù)申請與釋放也容易導(dǎo)致內(nèi)存碎片化。這樣內(nèi)存的使用效率就太低了。


于是,壓縮列表上場了!



它是經(jīng)過特殊編碼,專門為了提升內(nèi)存使用效率設(shè)計的。所有的操作都是通過指針與解碼出來的偏移量進行的。


并且壓縮列表的內(nèi)存是連續(xù)分配的,遍歷的速度很快。


4、字典


Redis 作為 K-V 型數(shù)據(jù)庫,所有的鍵值都是用字典來存儲的。


日常學(xué)習(xí)中使用的字典你應(yīng)該不會陌生,想查找某個詞通過某個字就可以直接定位到,速度非常快。這里所說的字典原理上是一樣的,通過某個 key 可以直接獲取到對應(yīng)的value。


字典又稱為哈希表,這點沒什么可說的。哈希表的特性大家都很清楚,能夠在?O(1)?時間復(fù)雜度內(nèi)取出和插入關(guān)聯(lián)的值


5、跳躍表


作為 Redis 中特有的數(shù)據(jù)結(jié)構(gòu)-跳躍表,其在鏈表的基礎(chǔ)上增加了多級索引來提升查找效率。



這是跳躍表的簡單原理圖,每一層都有一條有序的鏈表,最底層的鏈表包含了所有的元素。這樣跳躍表就可以支持在?O(logN)?的時間復(fù)雜度里查找到對應(yīng)的節(jié)點。


下面這張是跳表真實的存儲結(jié)構(gòu),和其它數(shù)據(jù)結(jié)構(gòu)一樣,都在頭節(jié)點里記錄了相應(yīng)的信息,減少了一些不必要的系統(tǒng)開銷。





合理的數(shù)據(jù)編碼


對于每一種數(shù)據(jù)類型來說,底層的支持可能是多種數(shù)據(jù)結(jié)構(gòu),什么時候使用哪種數(shù)據(jù)結(jié)構(gòu),這就涉及到了編碼轉(zhuǎn)化的問題。


那我們就來看看,不同的數(shù)據(jù)類型是如何進行編碼轉(zhuǎn)化的:


String:存儲數(shù)字的話,采用int類型的編碼,如果是非數(shù)字的話,采用 raw 編碼;


List:字符串長度及元素個數(shù)小于一定范圍使用 ziplist 編碼,任意條件不滿足,則轉(zhuǎn)化為 linkedlist 編碼;


Hash:hash 對象保存的鍵值對內(nèi)的鍵和值字符串長度小于一定值及鍵值對;


Set:保存元素為整數(shù)及元素個數(shù)小于一定范圍使用 intset 編碼,任意條件不滿足,則使用 hashtable 編碼;


Zset:zset 對象中保存的元素個數(shù)小于及成員長度小于一定值使用 ziplist 編碼,任意條件不滿足,則使用 skiplist 編碼。




合適的線程模型


Redis 快的原因還有一個是因為使用了合適的線程模型:


1、I/O多路復(fù)用模型


  • I/O?:網(wǎng)絡(luò) I/O

  • 多路:多個 TCP 連接

  • 復(fù)用:共用一個線程或進程


生產(chǎn)環(huán)境中的使用,通常是多個客戶端連接 Redis,然后各自發(fā)送命令至 Redis 服務(wù)器,最后服務(wù)端處理這些請求返回結(jié)果。



應(yīng)對大量的請求,Redis 中使用 I/O 多路復(fù)用程序同時監(jiān)聽多個套接字,并將這些事件推送到一個隊列里,然后逐個被執(zhí)行。最終將結(jié)果返回給客戶端。


2、避免上下文切換


你一定聽說過,Redis 是單線程的。那么單線程的 Redis 為什么會快呢?


因為多線程在執(zhí)行過程中需要進行 CPU 的上下文切換,這個操作比較耗時。Redis 又是基于內(nèi)存實現(xiàn)的,對于內(nèi)存來說,沒有上下文切換效率就是最高的。多次讀寫都在一個CPU 上,對于內(nèi)存來說就是最佳方案。


3、單線程模型


順便提一下,為什么 Redis 是單線程的。


Redis 中使用了 Reactor 單線程模型,你可能對它并不熟悉。沒關(guān)系,只需要大概了解一下即可。



這張圖里,接收到用戶的請求后,全部推送到一個隊列里,然后交給文件事件分派器,而它是單線程的工作方式。Redis 又是基于它工作的,所以說 Redis 是單線程的。




總結(jié)


基于內(nèi)存實現(xiàn)

  • 數(shù)據(jù)都存儲在內(nèi)存里,減少了一些不必要的 I/O 操作,操作速率很快。


高效的數(shù)據(jù)結(jié)構(gòu)

  • 底層多種數(shù)據(jù)結(jié)構(gòu)支持不同的數(shù)據(jù)類型,支持 Redis 存儲不同的數(shù)據(jù);

  • 不同數(shù)據(jù)結(jié)構(gòu)的設(shè)計,使得數(shù)據(jù)存儲時間復(fù)雜度降到最低。

? ?

合理的數(shù)據(jù)編碼

  • 根據(jù)字符串的長度及元素的個數(shù)適配不同的編碼格式。


合適的線程模型

  • I/O 多路復(fù)用模型同時監(jiān)聽客戶端連接;

  • 單線程在執(zhí)行過程中不需要進行上下文切換,減少了耗時。


絮叨


哈嘍,我是小林,就愛圖解計算機基礎(chǔ),如果覺得文章對你有幫助,歡迎分享給你的朋友,也給小林點個「在看」,這對小林非常重要,謝謝你們,給各位小姐姐小哥哥們抱拳了,我們下次見!

推薦閱讀

天啦嚕!知道硬盤很慢,但沒想到比 CPU Cache 慢 10000000 倍


CPU 執(zhí)行程序的秘密,藏在了這 15 張圖里


面試官:如何寫出讓 CPU 跑得更快的代碼?


讀者問:小林你的 500 張圖是怎么畫的?

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉