開源嵌入式數(shù)據(jù)庫BericeleyDB和SQLite的比較
摘 要; 深入分析、比較Berkeley DB和sQLite。Berkel ey DB和sQLite是源碼開放的嵌入式數(shù)據(jù)庫管理系統(tǒng),無需安裝,體積小巧,速度又很快;可以很方便地應(yīng)用在掌上電腦、PDA、車載設(shè)備、移動電話等MySQL、SQL Server這些大中型數(shù)據(jù)庫不可實現(xiàn)的嵌入式設(shè)備上。關(guān)鍵詞Berkeley DB; SOL,ite; 嵌入式數(shù)據(jù)庫1 嵌入式數(shù)據(jù)庫; 通常,我們采用數(shù)據(jù)庫來實現(xiàn)對數(shù)據(jù)的存儲、檢索等功能。像MySQL這類基于C/S結(jié)構(gòu)的關(guān)系型數(shù)據(jù)庫系統(tǒng),雖然代表著目前數(shù)據(jù)庫應(yīng)用的主流,卻并不能滿足所有應(yīng)用場合的需要。很多的應(yīng)用,僅僅利用到了這些數(shù)據(jù)庫產(chǎn)品的基本特性而已。有時我們需要的可能只是一個簡單的基于磁盤文件的數(shù)據(jù)庫系統(tǒng),這樣就不必安裝龐大的數(shù)據(jù)庫服務(wù)器,以簡化數(shù)據(jù)庫應(yīng)用程序的設(shè)計。在某些特殊應(yīng)用場合,比如在嵌入式系統(tǒng)中,由于系統(tǒng)的硬件軟件資源都有限,這些數(shù)據(jù)庫產(chǎn)品就明顯有一些臃腫,甚至是不可實現(xiàn)的。在這些情況下,嵌入式數(shù)據(jù)庫的優(yōu)勢就特別明顯了。嵌入式數(shù)據(jù)庫通常與操作系統(tǒng)和具體應(yīng)用集成在一起,無須獨立運行的數(shù)據(jù)庫引擎,由程序直接調(diào)用相應(yīng)的API去實現(xiàn)對數(shù)據(jù)的存取操作。更直白地講,嵌入式數(shù)據(jù)庫是一種具備了基本數(shù)據(jù)庫特性的數(shù)據(jù)文件。嵌入式數(shù)據(jù)庫與其它數(shù)據(jù)庫產(chǎn)品的區(qū)別是,前者是程序驅(qū)動式,而后者是引擎響應(yīng)式。嵌入式數(shù)據(jù)庫的一個很重要的特點是它們的體積非常小,編譯后的產(chǎn)品也不過幾十KB,在一些移動設(shè)備上極具競爭力。從目前嵌入式應(yīng)用的發(fā)展趨勢來看,嵌入式數(shù)據(jù)庫的實現(xiàn)必須充分體現(xiàn)系統(tǒng)的可定制性,即系統(tǒng)選擇的技術(shù)路線要面向具體的行業(yè)應(yīng)用,因而研究源碼開放的嵌入式數(shù)據(jù)庫具有特殊意義。2 Berkeley DB和SQLite DBkeley DB是一款健壯的、高速的工業(yè)級開放源代碼的嵌入式數(shù)據(jù)庫管理系統(tǒng)。應(yīng)用它,程序員只需要調(diào)用一些簡單的API就可以完成對數(shù)據(jù)的訪問和管理。Berkeley DB的源代碼有C和Java兩種,函數(shù)庫本身只有300KB左右,但卻能夠用來管理多達256TB的數(shù)據(jù)。Berkeley DB作為一種嵌入式數(shù)據(jù)庫系統(tǒng)在許多方面有著獨特的優(yōu)勢。首先,由于其應(yīng)用程序和數(shù)據(jù)庫管理系統(tǒng)運行在相同的進程空間當(dāng)中,進行數(shù)據(jù)操作時可以避免繁瑣的進程間通信,因此耗費在通信上的開銷自然也就降低到了極低程度。其次,Berkeley DB使用簡單的函數(shù)調(diào)用接口來完成所有的數(shù)據(jù)庫操作,而不是在數(shù)據(jù)庫系統(tǒng)中經(jīng)常用到的SQL語言,避免了對結(jié)構(gòu)化查詢語言進行解析和處理所需的開銷。SQLite的源代碼是C,其源代碼完全開放。SQLite第一個Alpha版本誕生于2000年5月。今年5月,SQLite又迎來了一個新的里程一SOLite 3。SQLite有以下特性:支持ACID事務(wù);零配置一無需安裝和管理配置;儲存在單一磁盤文件中的一個完整的數(shù)據(jù)庫;數(shù)據(jù)庫文件可以在不同字節(jié)順序的機器間自由共享;支持?jǐn)?shù)據(jù)庫大小至2TB;足夠小,全部源碼大致3萬行c代碼,250KB;比目前流行的大多數(shù)數(shù)據(jù)庫對數(shù)據(jù)的操作要快;提供了對事務(wù)功能和并發(fā)處理的支持,應(yīng)用Transaction既保證了數(shù)據(jù)的完整性,也會提高運行速度,因為多條語句一起提交給數(shù)據(jù)庫的速度會比一條一條的提交方式更快;獨立,沒有額外依賴。目前,對Berkeley DB的研究開發(fā)工作主要是美國的sleepycat公司在進行,在國內(nèi)幾乎沒有關(guān)于這方面的研究;而SQLite在國內(nèi)也是鮮有人問津。2.1; Berkeley DB和SOLite的數(shù)據(jù)庫操作與常用的數(shù)據(jù)庫管理系統(tǒng)(如MySQL和Oracle等)有所不同,在Berkeley DB中并沒有數(shù)據(jù)庫服務(wù)器的概念。應(yīng)用程序不需要事先同數(shù)據(jù)庫服務(wù)建立起網(wǎng)絡(luò)連接,而是通過內(nèi)嵌在程序中的Berkeley DB函數(shù)庫來完成對數(shù)據(jù)的保存、查詢、修改和刪除等操作。所有與數(shù)據(jù)庫相關(guān)的操作都由函數(shù)庫負責(zé)統(tǒng)一完成,這樣無論是系統(tǒng)中的多個進程,或者是相同進程中的多個線程,都可以在同一時間調(diào)用訪問數(shù)據(jù)庫的函數(shù);而底層的數(shù)據(jù)加鎖、事務(wù)日志和存儲管理等都在Berkeley DB函數(shù)庫中實現(xiàn)。它們對應(yīng)用程序來講是完全透明的。Berkeley DB不是關(guān)系型的數(shù)據(jù)庫,不能應(yīng)用標(biāo)準(zhǔn)的SQL語句對數(shù)據(jù)庫操作,對它的操作要調(diào)用專用的API實現(xiàn)。這些API提供了查詢、插入、刪除等功能。比如com.sleepycat.db.Db類代表數(shù)據(jù)庫對象。Db類的put( )方法完成的是插入功能;get( )方法完成的是讀出數(shù)據(jù)的功能;com.sleepycat.db.Dbc是Berkeley DB的游標(biāo)類,提供了遍歷數(shù)據(jù)庫記錄的功能。使用Berkeley DB提供的函數(shù)來進行數(shù)據(jù)庫的訪問和管理并不復(fù)雜。在大多數(shù)場合下,只需按照統(tǒng)一的接口標(biāo)準(zhǔn)進行調(diào)用就可以完成最基本的操作,Berkeley DBEnvironment為一組數(shù)據(jù)庫同時提供參數(shù)設(shè)置。更為重要的是,如果要應(yīng)用更高級的特性,必須要使用Environment功能,比如在要對保存的數(shù)據(jù)進行加密存儲、利用其Transaction、數(shù)據(jù)加密