每個(gè)程序員都必須知道的幾種通用數(shù)據(jù)結(jié)構(gòu)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
數(shù)據(jù)結(jié)構(gòu)想必大家都不會(huì)陌生,對(duì)于一個(gè)成熟的程序員而言,熟悉和掌握數(shù)據(jù)結(jié)構(gòu)和算法也是基本功之一。數(shù)據(jù)結(jié)構(gòu)本身其實(shí)不過是數(shù)據(jù)按照特點(diǎn)關(guān)系進(jìn)行存儲(chǔ)或者組織的集合,特殊的結(jié)構(gòu)在不同的應(yīng)用場(chǎng)景中往往會(huì)帶來不一樣的處理效率。
常用的數(shù)據(jù)結(jié)構(gòu)可根據(jù)數(shù)據(jù)訪問的特點(diǎn)分為線性結(jié)構(gòu)和非線性結(jié)構(gòu)。線性結(jié)構(gòu)包括常見的鏈表、棧、隊(duì)列等,非線性結(jié)構(gòu)包括樹、圖等。數(shù)據(jù)結(jié)構(gòu)種類繁多,本文將通過圖解的方式對(duì)常用的數(shù)據(jù)結(jié)構(gòu)進(jìn)行理論上的介紹和講解,以方便大家掌握常用數(shù)據(jù)結(jié)構(gòu)的基本知識(shí)。
數(shù)據(jù)結(jié)構(gòu)是一種特殊的組織和存儲(chǔ)數(shù)據(jù)的方式,可以使我們可以更高效地對(duì)存儲(chǔ)的數(shù)據(jù)執(zhí)行操作。數(shù)據(jù)結(jié)構(gòu)在計(jì)算機(jī)科學(xué)和軟件工程領(lǐng)域具有廣泛而多樣的用途。
幾乎所有已開發(fā)的程序或軟件系統(tǒng)都使用數(shù)據(jù)結(jié)構(gòu)。此外,數(shù)據(jù)結(jié)構(gòu)屬于計(jì)算機(jī)科學(xué)和軟件工程的基礎(chǔ)。當(dāng)涉及軟件工程面試問題時(shí),這是一個(gè)關(guān)鍵主題。因此,作為開發(fā)人員,我們必須對(duì)數(shù)據(jù)結(jié)構(gòu)有充分的了解。
在本文中,我將簡(jiǎn)要解釋每個(gè)程序員必須知道的8種常用數(shù)據(jù)結(jié)構(gòu)。
1.數(shù)組
數(shù)組是固定大小的結(jié)構(gòu),可以容納相同數(shù)據(jù)類型的項(xiàng)目。它可以是整數(shù)數(shù)組,浮點(diǎn)數(shù)數(shù)組,字符串?dāng)?shù)組或什至是數(shù)組數(shù)組(例如二維數(shù)組)。數(shù)組已建立索引,這意味著可以進(jìn)行隨機(jī)訪問。
Fig 1. Visualization of basic Terminology of Arrays
數(shù)組運(yùn)算
遍歷:遍歷所有元素并進(jìn)行打印。
插入:將一個(gè)或多個(gè)元素插入數(shù)組。
刪除:從數(shù)組中刪除元素
搜索:在數(shù)組中搜索元素。您可以按元素的值或索引搜索元素
更新:在給定索引處更新現(xiàn)有元素的值
數(shù)組的應(yīng)用
用作構(gòu)建其他數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ),例如數(shù)組列表,堆,哈希表,向量和矩陣。
用于不同的排序算法,例如插入排序,快速排序,冒泡排序和合并排序。
2.鏈表
鏈表是一種順序結(jié)構(gòu),由相互鏈接的線性順序項(xiàng)目序列組成。因此,您必須順序訪問數(shù)據(jù),并且無法進(jìn)行隨機(jī)訪問。鏈接列表提供了動(dòng)態(tài)集的簡(jiǎn)單靈活的表示形式。
讓我們考慮以下有關(guān)鏈表的術(shù)語(yǔ)。您可以通過參考圖2來獲得一個(gè)清晰的主意。
鏈表中的元素稱為節(jié)點(diǎn)。
每個(gè)節(jié)點(diǎn)都包含一個(gè)密鑰和一個(gè)指向其后繼節(jié)點(diǎn)(稱為next)的指針。
名為head的屬性指向鏈接列表的第一個(gè)元素。
鏈表的最后一個(gè)元素稱為尾。
Fig 2. Visualization of basic Terminology of Linked Lists
以下是可用的各種類型的鏈表。
單鏈列表—只能沿正向遍歷項(xiàng)目。
雙鏈表-可以在前進(jìn)和后退方向上遍歷項(xiàng)目。節(jié)點(diǎn)由一個(gè)稱為上一個(gè)的附加指針組成,指向上一個(gè)節(jié)點(diǎn)。
循環(huán)鏈接列表—鏈接列表,其中頭的上一個(gè)指針指向尾部,尾號(hào)的下一個(gè)指針指向頭。
鏈表操作
搜索:通過簡(jiǎn)單的線性搜索在給定的鏈表中找到鍵為k的第一個(gè)元素,并返回指向該元素的指針
插入:在鏈接列表中插入一個(gè)密鑰。插入可以通過3種不同的方式完成; 在列表的開頭插入,在列表的末尾插入,然后在列表的中間插入。
刪除:從給定的鏈表中刪除元素x。您不能單步刪除節(jié)點(diǎn)。刪除可以通過3種不同方式完成; 從列表的開頭刪除,從列表的末尾刪除,然后從列表的中間刪除。
鏈表的應(yīng)用
用于編譯器設(shè)計(jì)中的符號(hào)表管理。
用于在使用Alt Tab(使用循環(huán)鏈表實(shí)現(xiàn))的程序之間進(jìn)行切換。
3.堆棧
堆棧是一種LIFO(后進(jìn)先出-最后放置的元素可以首先訪問)結(jié)構(gòu),該結(jié)構(gòu)通常在許多編程語(yǔ)言中都可以找到。該結(jié)構(gòu)被稱為"堆棧",因?yàn)樗愃朴谡鎸?shí)世界的堆棧-板的堆棧。
堆棧操作
下面給出了可以在堆棧上執(zhí)行的2個(gè)基本操作。請(qǐng)參考圖3,以更好地了解堆棧操作。
Push 推送:在堆棧頂部插入一個(gè)元素。
Pop 彈出:刪除最上面的元素并返回。
Fig 3. Visualization of basic Operations of Stacks
此外,為堆棧提供了以下附加功能,以檢查其狀態(tài)。
Peep 窺視:返回堆棧的頂部元素而不刪除它。
isEmpty:檢查堆棧是否為空。
isFull:檢查堆棧是否已滿。
堆棧的應(yīng)用
用于表達(dá)式評(píng)估(例如:用于解析和評(píng)估數(shù)學(xué)表達(dá)式的調(diào)車場(chǎng)算法)。
用于在遞歸編程中實(shí)現(xiàn)函數(shù)調(diào)用。
4.隊(duì)列
隊(duì)列是一種FIFO(先進(jìn)先出-首先放置的元素可以首先訪問)結(jié)構(gòu),該結(jié)構(gòu)通常在許多編程語(yǔ)言中都可以找到。該結(jié)構(gòu)被稱為"隊(duì)列",因?yàn)樗愃朴诂F(xiàn)實(shí)世界中的隊(duì)列-人們?cè)陉?duì)列中等待。
隊(duì)列操作
下面給出了可以在隊(duì)列上執(zhí)行的2個(gè)基本操作。請(qǐng)參考圖4,以更好地了解堆棧操作。
進(jìn)隊(duì):將元素插入隊(duì)列的末尾。
出隊(duì):從隊(duì)列的開頭刪除元素。
Fig 4. Visualization of Basic Operations of Queues
隊(duì)列的應(yīng)用
用于管理多線程中的線程。
用于實(shí)施排隊(duì)系統(tǒng)(例如:優(yōu)先級(jí)隊(duì)列)。
5.哈希表
哈希表是一種數(shù)據(jù)結(jié)構(gòu),用于存儲(chǔ)具有與每個(gè)鍵相關(guān)聯(lián)的鍵的值。此外,如果我們知道與值關(guān)聯(lián)的鍵,則它有效地支持查找。因此,無論數(shù)據(jù)大小如何,插入和搜索都非常有效。
當(dāng)存儲(chǔ)在表中時(shí),直接尋址使用值和鍵之間的一對(duì)一映射。但是,當(dāng)存在大量鍵值對(duì)時(shí),此方法存在問題。該表將具有很多記錄,并且非常龐大,考慮到典型計(jì)算機(jī)上的可用內(nèi)存,該表可能不切實(shí)際甚至無法存儲(chǔ)。為避免此問題,我們使用哈希表。小編整理了2GB程序員相關(guān)資料,關(guān)注公眾號(hào)“程序員Style”回復(fù)“程序員”免費(fèi)領(lǐng)取!若有其他問題,歡迎給小編留言交流。
哈希函數(shù)
名為哈希函數(shù)(h)的特殊函數(shù)用于克服直接尋址中的上述問題。
在直接訪問中,帶有密鑰k的值存儲(chǔ)在插槽k中。使用哈希函數(shù),我們可以計(jì)算出每個(gè)值都指向的表(插槽)的索引。使用給定鍵的哈希函數(shù)計(jì)算的值稱為哈希值,它表示該值映射到的表的索引。
h:哈希函數(shù)
k:應(yīng)確定其哈希值的鍵
m:哈希表的大小(可用插槽數(shù))。一個(gè)不接近2的精確乘方的素?cái)?shù)是m的一個(gè)不錯(cuò)的選擇。
Fig 5. Representation of a Hash Function
1→1→1
5→5→5
23→23→3
63→63→3
從上面給出的最后兩個(gè)示例中,我們可以看到,當(dāng)哈希函數(shù)為多個(gè)鍵生成相同的索引時(shí),就會(huì)發(fā)生沖突。我們可以通過選擇合適的哈希函數(shù)h并使用鏈接和開放式尋址等技術(shù)來解決沖突。
哈希表的應(yīng)用
用于實(shí)現(xiàn)數(shù)據(jù)庫(kù)索引。
用于實(shí)現(xiàn)關(guān)聯(lián)數(shù)組。
用于實(shí)現(xiàn)"設(shè)置"數(shù)據(jù)結(jié)構(gòu)。
6.樹
樹是一種層次結(jié)構(gòu),其中數(shù)據(jù)按層次進(jìn)行組織并鏈接在一起。此結(jié)構(gòu)與鏈接列表不同,而在鏈接列表中,項(xiàng)目以線性順序鏈接。
在過去的幾十年中,已經(jīng)開發(fā)出各種類型的樹木,以適合某些應(yīng)用并滿足某些限制。一些示例是二叉搜索樹,B樹,紅黑樹,展開樹,AVL樹和n元樹。
二叉搜索樹
顧名思義,二進(jìn)制搜索樹(BST)是一種二進(jìn)制樹,其中數(shù)據(jù)以分層結(jié)構(gòu)進(jìn)行組織。此數(shù)據(jù)結(jié)構(gòu)按排序順序存儲(chǔ)值,我們將在本課程中詳細(xì)研究這些值。
二叉搜索樹中的每個(gè)節(jié)點(diǎn)都包含以下屬性。
key:存儲(chǔ)在節(jié)點(diǎn)中的值。
left:指向左孩子的指針。
右:指向正確孩子的指針。
p:指向父節(jié)點(diǎn)的指針。
二叉搜索樹具有獨(dú)特的屬性,可將其與其他樹區(qū)分開。此屬性稱為binary-search-tree屬性。
令x為二叉搜索樹中的一個(gè)節(jié)點(diǎn)。
如果y是x左子樹中的一個(gè)節(jié)點(diǎn),則y.key≤x.key
如果y是x的右子樹中的節(jié)點(diǎn),則y.key≥x.key
Fig 6. Visualization of Basic Terminology of Trees.
樹的應(yīng)用
二叉樹:用于實(shí)現(xiàn)表達(dá)式解析器和表達(dá)式求解器。
二進(jìn)制搜索樹:用于許多不斷輸入和輸出數(shù)據(jù)的搜索應(yīng)用程序中。
堆:由JVM(Java虛擬機(jī))用來存儲(chǔ)Java對(duì)象。
Trap:用于無線網(wǎng)絡(luò)。
7.堆
堆是二叉樹的一種特殊情況,其中將父節(jié)點(diǎn)與其子節(jié)點(diǎn)的值進(jìn)行比較,并對(duì)其進(jìn)行相應(yīng)排列。
讓我們看看如何表示堆。堆可以使用樹和數(shù)組表示。圖7和8顯示了我們?nèi)绾问褂枚鏄浜蛿?shù)組來表示二叉堆。
Fig 7. Binary Tree Representation of a Heap
Fig 8. Array Representation of a Heap
堆可以有2種類型。
最小堆-父項(xiàng)的密鑰小于或等于子項(xiàng)的密鑰。這稱為min-heap屬性。根將包含堆的最小值。
最大堆數(shù)-父項(xiàng)的密鑰大于或等于子項(xiàng)的密鑰。這稱為max-heap屬性。根將包含堆的最大值。
堆的應(yīng)用
用于實(shí)現(xiàn)優(yōu)先級(jí)隊(duì)列,因?yàn)榭梢愿鶕?jù)堆屬性對(duì)優(yōu)先級(jí)值進(jìn)行排序。
可以在O(log n)時(shí)間內(nèi)使用堆來實(shí)現(xiàn)隊(duì)列功能。
用于查找給定數(shù)組中k個(gè)最小(或最大)的值。
用于堆排序算法。
8.圖
一個(gè)圖由一組有限的頂點(diǎn)或節(jié)點(diǎn)以及一組連接這些頂點(diǎn)的邊組成。
圖的順序是圖中的頂點(diǎn)數(shù)。圖的大小是圖中的邊數(shù)。
如果兩個(gè)節(jié)點(diǎn)通過同一邊彼此連接,則稱它們?yōu)橄噜徆?jié)點(diǎn)。
有向圖
如果圖形G的所有邊緣都具有指示什么是起始頂點(diǎn)和什么是終止頂點(diǎn)的方向,則稱該圖形為有向圖。
我們說(u,v)從頂點(diǎn)u入射或離開頂點(diǎn)u,然后入射到或進(jìn)入頂點(diǎn)v。
自環(huán):從頂點(diǎn)到自身的邊。
無向圖
如果圖G的所有邊緣均無方向,則稱其為無向圖。它可以在兩個(gè)頂點(diǎn)之間以兩種方式傳播。
如果頂點(diǎn)未連接到圖中的任何其他節(jié)點(diǎn),則稱該頂點(diǎn)為孤立的。
Fig 9. Visualization of Terminology of Graphs
圖的應(yīng)用
用于表示社交媒體網(wǎng)絡(luò)。每個(gè)用戶都是一個(gè)頂點(diǎn),并且在用戶連接時(shí)會(huì)創(chuàng)建一條邊。
用于表示搜索引擎的網(wǎng)頁(yè)和鏈接。互聯(lián)網(wǎng)上的網(wǎng)頁(yè)通過超鏈接相互鏈接。每頁(yè)是一個(gè)頂點(diǎn),兩頁(yè)之間的超鏈接是一條邊。用于Google中的頁(yè)面排名。
用于表示GPS中的位置和路線。位置是頂點(diǎn),連接位置的路線是邊。用于計(jì)算兩個(gè)位置之間的最短路徑。