當(dāng)前位置:首頁 > 公眾號精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]前言 上一篇總結(jié)了Mysql的鎖機制,通過讀者的反映和閱讀量顯示,總體還是不錯的,感興趣的可以閱讀一下[大廠面試官必問的Mysql鎖機制]。 寫了那么多的Mysql文章,有讀者問我是不是dba,工作真的需要掌握那么深嗎。我想說的是:我是一名Java全職開發(fā)人員不是db


前言

上一篇總結(jié)了Mysql的鎖機制,通過讀者的反映和閱讀量顯示,總體還是不錯的,感興趣的可以閱讀一下[大廠面試官必問的Mysql鎖機制]。

寫了那么多的Mysql文章,有讀者問我是不是dba,工作真的需要掌握那么深嗎。我想說的是:我是一名Java全職開發(fā)人員不是dba。

假如你只滿足于日常的crud,你可以放棄這些底層的知識,可以不必學(xué)的那么深,若是你想往高處走,這些底層的知識,是你必備的。

這一篇是講解Mysql中做使用到的「索引的種類」「索引正確使用的原則」、「怎么優(yōu)化索引」、「以及兩種存儲引擎InnoDB和MyISAM索引的數(shù)據(jù)布局原理」

索引種類

在說索引之前,我們先來說一說什么是索引呢?對于索引個人的理解就是,索引是一種加快查詢數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。

所以,索引就是一種數(shù)據(jù)結(jié)構(gòu),作用就是發(fā)揮這種數(shù)據(jù)結(jié)構(gòu)的作用,加快查詢的效率,例如:InnoDB存儲引擎中使用的是就是B+tree這種數(shù)據(jù)結(jié)構(gòu)來組織索引。

Mysql中索引的種類也不是很多,不同類型的索引有不同的作用,索引的作用相互之間也存在交叉關(guān)系,Mysql中索引主要分為以下幾類:

  1. 「主鍵索引」PRIMARY KEY):主鍵索引一般都是在創(chuàng)建表的時候指定, 「一個表只有一個主鍵索引」,特點是 「唯一、非空」
  2. 「唯一索引」UNIQUE):唯一索引具有的特點就是唯一性,可以在創(chuàng)建表的時候指定,也可以在創(chuàng)建表后創(chuàng)建。
  3. 「普通索引」INDEX):普通索引唯一的作用就是加快查詢。
  4. 「組合索引」INDEX):組合索引是創(chuàng)建一個 「多個字段的索引」,這個概念是相對于上上面的單列索引而言,組合索引查詢遵循 「最左前綴原則」。
  5. 「全文索引」FULLTEXT):全文索引是針對一些大的 「文本字段」創(chuàng)建的索引,也稱為 「全文檢索」
  6. 「聚簇索引」「非聚簇索引」:聚簇索引和非聚簇索引的概念比上面的概念要大,屬于包含和被包含的關(guān)系。例如:InnoDB中主鍵索引使用的就是聚簇索引。

若是你想查看一個表的所有索引,可以執(zhí)行下面的sql來查看:

show index from 表名

例如,查看我自己的測試表里面的索引,如下圖所示,Key_name表示索引的名字,Column_name表示索引的字段。

助你進大廠,這些Mysql索引底層知識你是必須知道的。

上面大概的說了主要索引的概念,下面詳細(xì)的介紹一下這幾大索引的特點和使用。

主鍵索引

主鍵索引在InnoDB存儲引擎中是最常見的索引類型,一個表都會有一個主鍵索引,它索引的字段不允許為空值,并且唯一。

一般是在創(chuàng)建表的時候,可以通過RIMARY KEY指定主鍵索引,在InnoDB存儲引擎中,若是創(chuàng)建表的時候沒有主觀創(chuàng)建主鍵索引,Mysql就會看表中是否有唯一索引,有,就會指定「非空的唯一索引」為主鍵索引;

沒有,就會默認(rèn)生成一個6byte空間的自動增長主鍵作為主鍵索引,可以通過select _rowid from 表名查詢的是對應(yīng)的主鍵值.。

MyISAM儲存引擎是可以不存在主鍵索引,MyISAM和InnoDB儲存數(shù)據(jù)的結(jié)構(gòu)方式還是有明顯的區(qū)別,這個后面篇章會詳細(xì)講解。

唯一索引

唯一索引與主鍵索引的區(qū)別就是,唯一索引允許為空,若是在組合索引中,只要創(chuàng)建的列值是唯一的

唯一索引在實際中更多的是用來保證數(shù)據(jù)的唯一性,假如你僅僅要數(shù)據(jù)能夠快速查詢,你也可以使用普通索引,所以唯一索引重在體現(xiàn)它的唯一性。

實際的業(yè)務(wù)場景,有些庫表字段要求唯一,就可以使用唯一索引,創(chuàng)建唯一索引的方式有三種。

(1)一個是在創(chuàng)建表的時候指定,如下sql:

CREATE TABLE user( 
 id INT PRIMARY KEY NOT NULL, 
 name VARCHAR(16) NOT NULL, 
 UNIQUE unique_name (name(10)) 
);

(2)也可以在表創(chuàng)建后創(chuàng)建,如下sql:

CREATE UNIQUE INDEX unique_name ON user(name(10));

(3)通過修改表結(jié)構(gòu)創(chuàng)建,如下sql:

ALTER user ADD UNIQUE unique_name ON (name(10))

這里有一個細(xì)節(jié)要注意的是創(chuàng)建的name字段,指定的長度是16字符,而創(chuàng)建的索引的長度制定的是10字符,因為也沒有人的名字長度會超過10個字符,所以減少索引長度,能夠減少索引所占的空間的大小。

普通索引

普通索引的唯一作用就是加快數(shù)據(jù)的查詢,一般對查詢語句WHEREORDER BY后面的字段創(chuàng)建普通索引。

創(chuàng)建普通索引的方式也有三種,基本和創(chuàng)建唯一索引的方式一樣,只是把關(guān)鍵字UNIQUE換成INDEX,如下所示:

// 創(chuàng)建表的時候創(chuàng)建
CREATE TABLE user( 
 id INT PRIMARY KEY NOT NULL, 
 name VARCHAR(16) NOT NULL, 
 INDEX index_name (name(10)) 
);
// 創(chuàng)建表后創(chuàng)建
CREATE INDEX INDEX index_name ON user(name(10));
// 修改表結(jié)構(gòu)創(chuàng)建
ALTER user ADD INDEX index_name ON (name(10))

若是想刪除索引,可以通過執(zhí)行下面的sql進行刪除索引:

DROP INDEX index_name ON user;

組合索引

組合索引即用多個字段創(chuàng)建一個索引,組合索引能夠避免「回表查詢」,相對于多字段的單列索引,組合索引的查詢效率更高。

創(chuàng)建組合索引(聯(lián)合索引)的方式和上面創(chuàng)建普通索引的方式一樣,只不過字段的數(shù)目多了,如下sql創(chuàng)建:

// 其它方式和上面的一樣,這里就只列舉修改表結(jié)構(gòu)的方式創(chuàng)建
ALTER TABLE employee ADD INDEX name_age_sex (name(10),age,sex);

回表查詢

什么是回表查詢呢?回表查詢簡單來說「通過二級索引查詢數(shù)據(jù),得不到完整的數(shù)據(jù)行,需要再次查詢主鍵索引來獲得數(shù)據(jù)行」。

InnoDB存儲引擎中,索引分為 「聚簇索引」「二級索引」,主鍵索引就是聚簇索引,其它的索引為二級索引。

聚簇索引中的葉子節(jié)點保存著完整的數(shù)據(jù)行,而二級索引的葉子節(jié)點并不是保存完整的數(shù)據(jù)行。

上面提到InnoDB表是一定要有主鍵索引的,雖然索引占據(jù)空間,但是索引符合二分查找的算法,查找數(shù)據(jù)非常的快。

假設(shè)還是上面的employee表,里面有主鍵索引id,和普通的索引name,那么在InnoDB中就會存在兩棵B+Tree,一棵是主鍵索引樹:

助你進大廠,這些Mysql索引底層知識你是必須知道的。
主鍵索引樹

在主鍵索引樹中的葉子節(jié)點存儲的是完整的數(shù)據(jù)行,另外一棵是name字段的二級索引樹,如下圖所示:

助你進大廠,這些Mysql索引底層知識你是必須知道的。

倘若你執(zhí)行這條sql:select name, age, sex from employee where id ='as';就會先執(zhí)行二級索引的查詢,當(dāng)查詢name='as'時,得到主鍵為50,再根據(jù)主鍵查詢主鍵索引樹,得到完整的數(shù)據(jù)行,具體的執(zhí)行流程如下:

助你進大廠,這些Mysql索引底層知識你是必須知道的。
回表原理圖

這個就是回表查詢,回表查詢會查詢兩次,這樣就會降低查詢的效率,為了避免回表查詢,只查詢一次就能得到完整的數(shù)據(jù)呢?

索引覆蓋

常見的方式就是「建立組合索引(聯(lián)合索引)「進行」索引覆蓋」,什么是索引覆蓋呢?索引覆蓋就是「索引的葉子節(jié)點已經(jīng)包含了查詢的數(shù)據(jù),沒必要再回表進行查詢。」

假如我還是執(zhí)行如下sql:select name, age, sex from employee where name ='as';因為普通索引只有name字段才建立了索引,這必然會導(dǎo)致回表查詢。

為了提高查詢效率,就(name)「單列索引升級為聯(lián)合索引」(name, age, sex)就不同了。

因為建立的聯(lián)合索引,在二級節(jié)點的葉子階段就會同時存在name, age, sex三個的值,一次性就會獲得所需要的數(shù)據(jù),這樣就避免了回表,但是所有的方案都不是完美的。

若是這個聯(lián)合索引哪一天某一個數(shù)據(jù)行的name值改變了或者age改變了,我就需要同時維護主鍵索引和聯(lián)合索引兩棵樹,這樣的維護成本就高了,性能開銷也大了。

相比之前數(shù)據(jù)的改變,我只需要維護主鍵索引即可,聯(lián)合索引的創(chuàng)建就導(dǎo)致了需要同時維護兩棵樹,這樣就會影響插入、更新數(shù)據(jù)的操作,所以并沒有哪種方案是完美的。

最左前綴原則

我們知道單列索引是按照索引列有序性的進行組織B+Tree結(jié)構(gòu)的,聯(lián)合索引又是怎么組織B+Tree呢?

聯(lián)合索引其實也是按照創(chuàng)建索引的時候,最左邊的進行最開始的排序,也就是「最左前綴原則」,比如一個表中有如下數(shù)據(jù):

name age sex
ad 23
bc 21
bc 24
bc 25
de 21

如上圖所示,對于聯(lián)合索引中name字段是放在最前面的,所以name是完全有序的,但是age字段就不是有序的,只有當(dāng)name相同,例如:name='bc'此時age字段的索引排序才是完全有序的。

所以你會發(fā)現(xiàn),在聯(lián)合索引中你只有使用以下的規(guī)則的方式查詢才會使用到索引:

  1. name,age,sex
  2. name,age
  3. name

因為Mysql的底層有查詢優(yōu)化器,會判斷sql執(zhí)行的時候若是使用全表掃描的效率比使用索引的效率更高,就會使用全表掃描。

假如,我查詢的時候使用age>=23,sex='男';兩個字段作為查詢條件,但是沒有使用name字段,因為在name不知情的條件下,對于age是無序的。

對于age>=23條件可能在很多的name不同中都有符合條件的出現(xiàn),所以就沒有辦法使用索引,這也是索引實現(xiàn)的原因,一定要遵循「查找有序,充分的利用索引的有序性」。

假如你是分別在name,age,sex三個字段中分別建立三個單列索引,就相當(dāng)于建立三顆索引樹,那么它的查詢效率,比我們使用一棵索引樹查詢效率就可想而知了。

有一種情況即使使用到了最左邊的name字段也不會使用索引,例如:WHERE name like '%d%';這種like條件的模糊查詢是會使索引失效。

我們可以這樣理解,「查詢字符串也是遵循最左前綴原則的」,字符串的查詢是對字符串里面的字符一個一個的匹配,「若是字符串最左邊為%表示一個不確定的字符串,那么是沒辦法利用到索引的有序性」。

但是若是修改為 :WHERE name like 'd%';就可以使用索引,因為最左邊的字符串是確定的,這種稱為「匹配列前綴」

實際業(yè)務(wù)場景中聯(lián)合索引的創(chuàng)建,「我們應(yīng)該把識別度比較高的字段放在前面,提高索引的命中率,充分的利用索引」

索引下推

Mysql5.6版本提出了索引下推的原則,「用于查詢優(yōu)化,主要是用于like關(guān)鍵字的查詢的優(yōu)化」,什么是索引下推呢?

下面通過演示來說明一下他的概念,還是利用原來的employee測試表,假如我要執(zhí)行下面的sql進行查詢:SELECT * from user where name like '張%' and age=40;

假如沒有索引下推,執(zhí)行的過程如下圖所示:

助你進大廠,這些Mysql索引底層知識你是必須知道的。

查詢會直接忽略age字段,將name查詢的張開頭的id=5、id=7的結(jié)果返回給Mysql服務(wù)器,再執(zhí)行兩次的回表查詢。

若是上面的查詢操作使用了索引下推,執(zhí)行的過程如下:

助你進大廠,這些Mysql索引底層知識你是必須知道的。

Mysql會將查詢條件age=40的查詢條件傳遞給存儲引擎,再次過濾掉age=50的數(shù)據(jù)行,這樣回表的次數(shù)就變?yōu)榱艘淮?,提高了查詢效率?/p>

總結(jié)起來索引下推就是在執(zhí)行sql查詢的時候,會將一部分的索引列的判斷條件傳遞給存儲引擎,由存儲引擎通過判斷是否符合條件,只有符合條件的數(shù)據(jù)才會返回給Mysql服務(wù)器。

全文索引

全文索引也稱為全文檢索,可以通過以下sql建立全文索引:ALTER TABLE employee ADD FULLTEXT fulltext_name(name);或者CREATE INDEX的方式創(chuàng)建。

全文索引主要是針對CHAR、VARCHARTEXT這種文本類的字段有效,有人說不也可以使用like關(guān)鍵字來查詢文本嗎。

普通索引(單列索引)的查詢只能加快字段內(nèi)容中最前面的字符串的檢索,若是對于多個單詞組成文本的查詢普通索引就無能為力了。

索引一經(jīng)創(chuàng)建就沒有辦法修改,若是想要修改索引,必須重建,可以使用以下sql來刪除索引:DROP INDEX fulltext_name ON employee;

聚簇索引和非聚簇索引

聚簇索引和非聚簇索引是相對于存儲引擎的概念,范圍比較大,包含上面所提到的索引類型。

「聚簇索引就是葉子節(jié)點中存儲的就是完整的行數(shù)據(jù),索引和數(shù)據(jù)存儲在一起;而非聚簇索引的索引文件和數(shù)據(jù)文件是分開的,所以查詢數(shù)據(jù)會多一次查詢」。

因此聚簇索引的查詢速度會快于非聚簇索引的查詢速度,在Mysql的存儲引擎中,「InnoDB支持聚簇索引,MyISAM不支持聚簇索引,MyISAM支持非聚簇索引」

聚簇索引

下面我們來看看InnoDB中的聚簇索引,前面說到InnoDB都會有一個主鍵,該主鍵就是用于支持聚簇索引,聚簇索引結(jié)構(gòu)圖,大致如下圖所示:

助你進大廠,這些Mysql索引底層知識你是必須知道的。

InnoDB中適用于最好的主鍵選擇就是給出一個AUTO_INCREMENT的列作為自增的主鍵,有的人可能會使用UUID作為隨機主鍵。

因為索引要維持有序性,若是使用隨機的主鍵,主鍵的插入需要尋找合適的位置進行放置,這樣維護主鍵索引樹的成本就會變得更高。

相反的,自增主鍵,主鍵都是自增變大,在維護主鍵索引樹的成本就會變得更小,隨意應(yīng)該盡量避免隨機主鍵。

非聚簇索引

MyISAM使用的是非聚簇索引,新插入數(shù)據(jù)的時候,會按順序的寫入的磁盤中,并且給每一行數(shù)據(jù)標(biāo)記一個行號,從小逐漸增大。

助你進大廠,這些Mysql索引底層知識你是必須知道的。

當(dāng)MyISAM創(chuàng)建主鍵索引的時候,形成的主鍵索引樹的結(jié)構(gòu)圖如下圖所示:

助你進大廠,這些Mysql索引底層知識你是必須知道的。

在主鍵索引中,數(shù)據(jù)也是非空且唯一,主鍵索引樹中存儲的是數(shù)據(jù)行的行號,當(dāng)查詢數(shù)據(jù)的時候使用主鍵索引查詢需要查詢到行號,然后通過行號獲取數(shù)據(jù)。

非主鍵索引和主鍵索引一樣葉子節(jié)點也是存儲著行號,唯一的區(qū)別就是非主鍵索引不要求非空、唯一。

我們可以通對比圖來對比一下「InnoDB(聚簇索引)」「MyISAM(非聚簇索引)」 的索引數(shù)據(jù)布局,如下圖所示:

助你進大廠,這些Mysql索引底層知識你是必須知道的。

說到這里相信應(yīng)該大家對于「InnoDB(聚簇索引)」「MyISAM(非聚簇索引)」 有了非常清晰的認(rèn)識和理解,下面是來說一說索引的優(yōu)化,這個也是和我們?nèi)粘i_發(fā)最密切相關(guān)的。

索引原則和優(yōu)化

要正確的使用索引,就要正確的創(chuàng)建索引,用索引正確的查詢,不要使索引失效,因此索引的設(shè)計和優(yōu)化的原則應(yīng)該遵循下面的幾個原則:

  1. 索引列不要在表達式中出現(xiàn),這樣會導(dǎo)致索引失效。如: 「SELECT  ...... WHERE id+1=5」;
  2. 索引列不要作為函數(shù)的參數(shù)使用。
  3. 索引列盡量不要使用like關(guān)鍵字。如: 「SELECT  ...... WHERE name like '%d%'」;
  4. 數(shù)字型的索引列不要當(dāng)作字符串類型進行條件查詢。如: 「SELECT  ...... WHERE id = '35'」;
  5. 盡量不要在條件NOT IN、<>、!= 中使用索引。
  6. 在索引列的字段中不要出現(xiàn)NULL值,NULL值會使索引失效,可以用特殊的字符比如空字符串' '或者0來代替NULL值。
  7. 聯(lián)合索引的查詢應(yīng)該遵循最左前綴原則。
  8. 一般對于區(qū)別性比較大的字段建立索引,在聯(lián)合索引中區(qū)別性比較大(識別度比較高)放在最前面,提高索引的命中率。
  9. 索引的大小要適度,不易過大,避免索引的冗余。

總結(jié)

索引是我們工作經(jīng)常會使用到的數(shù)據(jù)查詢方式,正確的使用索引可以大大提高查詢的效率。

  1. 一方面索引減少了索引服務(wù)器需要掃描的數(shù)據(jù)行的數(shù)量,將原來的全表掃描,使用特定的數(shù)據(jù)結(jié)構(gòu),能夠快速的定位數(shù)據(jù)行。
  2. 另一方面使用有序的索引,避免了排序,將原來的隨機的IO操作,變成了順序的IO操作,執(zhí)行有序。

但是索引也不是十全十美的,也有自己的缺點,不正確的使用索引,將會導(dǎo)致索引大量的占據(jù)空間,索引并非是越多越好,索引文件會越發(fā)的膨脹,這樣嚴(yán)重的影響查詢的性能。

對于插入、更新 、刪除數(shù)據(jù),除了維護數(shù)據(jù)以外,還要維護索引文件,這樣也會影響這些操作的性能,但是對于查詢的頻率遠(yuǎn)高于更新和插入數(shù)據(jù)的業(yè)務(wù)場景,索引是再適合不過了。

特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:

助你進大廠,這些Mysql索引底層知識你是必須知道的。

長按訂閱更多精彩▼

助你進大廠,這些Mysql索引底層知識你是必須知道的。

如有收獲,點個在看,誠摯感謝

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉