當(dāng)前位置:首頁 > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]在MySQL中我們通常會(huì)采用limit來進(jìn)行翻頁查詢,比如limit(0,10)表示列出第一頁的10條數(shù)據(jù),limit(10,10)表示列出第二頁。

0 問題描述 

在MySQL中我們通常會(huì)采用limit來進(jìn)行翻頁查詢,比如limit(0,10)表示列出第一頁的10條數(shù)據(jù),limit(10,10)表示列出第二頁。

但是,當(dāng)limit遇到order by的時(shí)候,可能會(huì)出現(xiàn)翻到第二頁的時(shí)候,竟然又出現(xiàn)了第一頁的記錄。

具體如下:

SELECT `post_title`,`post_date` FROM post WHERE `post_status`='publish' ORDER BY view_count desc LIMIT 5,5

使用上述SQL查詢的時(shí)候,很有可能出現(xiàn)和LIMIT 0,5相同的某條記錄。而如果使用如下方式,則不會(huì)出現(xiàn)重復(fù)的情況:

SELECT * FROM post WHERE post_status='publish' ORDER BY view_count desc LIMIT 5,

但是,由于post表的字段很多,僅僅希望用這兩個(gè)字段,不想把post_content也查出來。

為了解決這個(gè)情況,在ORDER BY后面使用了兩個(gè)排序條件來解決這個(gè)問題,如下:

SELECT `post_title`,`post_date` FROM post WHERE `post_status`='publish' ORDER BY view_count desc,ID asc LIMIT 5,

按理來說,MySQL的排序默認(rèn)情況下是以主鍵ID作為排序條件的

也就是說,如果在view_count相等的情況下,主鍵ID作為默認(rèn)的排序條件,不需要我們多此一舉加ID asc。

但是事實(shí)就是,MySQL再order by和limit混用的時(shí)候,出現(xiàn)了排序的混亂情況。

1 分析問題

在MySQL 5.6的版本上,優(yōu)化器在遇到order by limit語句的時(shí)候,做了一個(gè)優(yōu)化,即使用了priority queue

使用 priority queue 的目的,就是在不能使用索引有序性的時(shí)候,如果要排序,并且使用了limit n,那么只需要在排序的過程中,保留n條記錄即可

這樣雖然不能解決所有記錄都需要排序的開銷,但是只需要 sort buffer 少量的內(nèi)存就可以完成排序。

之所以MySQL 5.6出現(xiàn)了第二頁數(shù)據(jù)重復(fù)的問題,是因?yàn)?priority queue 使用了堆排序的排序方法,而堆排序是一個(gè)不穩(wěn)定的排序方法

也就是相同的值可能排序出來的結(jié)果和讀出來的數(shù)據(jù)順序不一致。

MySQL 5.5 沒有這個(gè)優(yōu)化,所以也就不會(huì)出現(xiàn)這個(gè)問題。

也就是說,MySQL 5.5是不存在本文提到的問題的,5.6版本之后才出現(xiàn)了這種情況。

再看下MySQL解釋sql語言時(shí)的執(zhí)行順序:

(1)     SELECT
(2)     DISTINCT <select_list>
(3)     FROM <left_table>
(4)     <join_type> JOIN <right_table>
(5)     ON <join_condition>
(6)     WHERE <where_condition>
(7)     GROUP BY <group_by_list>
(8)     HAVING <having_condition>
(9)     ORDER BY <order_by_condition>
(10)    LIMIT <limit_number>

		

執(zhí)行順序依次為 form… where… select… order by… limit…

由于上述priority queue的原因,在完成select之后,所有記錄是以堆排序的方法排列的

在進(jìn)行order by時(shí),僅把view_count值大的往前移動(dòng)。但由于limit的因素,排序過程中只需要保留到5條記錄即可

view_count并不具備索引有序性,所以當(dāng)?shù)诙摂?shù)據(jù)要展示時(shí),mysql見到哪一條就拿哪一條

因此,當(dāng)排序值相同的時(shí)候,第一次排序是隨意排的,第二次再執(zhí)行該sql的時(shí)候,其結(jié)果應(yīng)該和第一次結(jié)果一樣。

2 解決方法

(1)索引排序字段

如果在字段添加上索引,就直接按照索引的有序性進(jìn)行讀取并分頁,從而可以規(guī)避遇到的這個(gè)問題。

(2)正確理解分頁

分頁是建立在排序的基礎(chǔ)上,進(jìn)行了數(shù)量范圍分割。排序是數(shù)據(jù)庫提供的功能,而分頁卻是衍生的出來的應(yīng)用需求。

在MySQL和Oracle的官方文檔中提供了limit n和rownum < n的方法,但卻沒有明確的定義分頁這個(gè)概念。

還有重要的一點(diǎn),雖然上面的解決方法可以緩解用戶的這個(gè)問題,但按照用戶的理解,依然還有問題

比如,這個(gè)表插入比較頻繁,用戶查詢的時(shí)候,在read-committed的隔離級(jí)別下,第一頁和第二頁仍然會(huì)有重合。

所以,分頁一直都有這個(gè)問題,不同場(chǎng)景對(duì)數(shù)據(jù)分頁都沒有非常高的準(zhǔn)確性要求。

(3)一些常見的數(shù)據(jù)庫排序問題

不加order by的時(shí)候的排序問題

用戶在使用Oracle或MySQL的時(shí)候,發(fā)現(xiàn)MySQL總是有序的,Oracle卻很混亂,這個(gè)主要是因?yàn)镺racle是堆表,MySQL是索引聚簇表的原因。

所以沒有order by的時(shí)候,數(shù)據(jù)庫并不保證記錄返回的順序性,并且不保證每次返回都一致的。

分頁問題 分頁重復(fù)的問題

如前面所描述的,分頁是在數(shù)據(jù)庫提供的排序功能的基礎(chǔ)上,衍生出來的應(yīng)用需求,數(shù)據(jù)庫并不保證分頁的重復(fù)問題

NULL值和空串問題

不同的數(shù)據(jù)庫對(duì)于NULL值和空串的理解和處理是不一樣的

比如Oracle NULL和NULL值是無法比較的,既不是相等也不是不相等,是未知的。

而對(duì)于空串,在插入的時(shí)候,MySQL是一個(gè)字符串長(zhǎng)度為0的空串,而Oracle則直接進(jìn)行NULL值處理。




		
		
		

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉