當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]本文通過對多種壓縮算法作進一步研究對比后發(fā)現(xiàn),LZO壓縮算法是一種被稱為實時無損壓縮的算法,LZO壓縮算法在保證實時壓縮速率的優(yōu)點的同時提供適中的壓縮率。如圖1(A)給出

本文通過對多種壓縮算法作進一步研究對比后發(fā)現(xiàn),LZO壓縮算法是一種被稱為實時無損壓縮的算法,LZO壓縮算法在保證實時壓縮速率的優(yōu)點的同時提供適中的壓縮率。如圖1(A)給出了Linux操作系統(tǒng)下常見開源壓縮算法的壓縮速率的測試結(jié)果,LZO壓縮算法速率極快;如圖1(B)給出了Gzip壓縮算法和LZO壓縮算法的壓縮率測試結(jié)構(gòu),從圖中可以看出,LZO壓縮算法可以提供平均約50%的壓縮率。


1 LZO壓縮算法基本原理分析
1.1 LZO壓縮算法壓縮原理
LZO壓縮算法采用(重復(fù)長度L,指回距離D)代替當(dāng)前已經(jīng)在歷史字符串中出現(xiàn)過的字符串,其中,重復(fù)長度是指,后出現(xiàn)的字符串與先出現(xiàn)的字符串中連續(xù)相同部分的長度;指回距離是指,先后兩個相同字符串之間相隔的距離(每個字節(jié)為一個單位);如果沒出現(xiàn)過(定義為新字符),則首先輸出新字符的個數(shù),再輸出新字符。例如,待處理的字符串為“ABCDEFGHABCDEFJKLM”,壓縮算法逐個處理字符,處理ABCDEFGH時沒發(fā)現(xiàn)重復(fù)字符;處理到ABCDEF時發(fā)現(xiàn)這些字符在歷史字符串中已經(jīng)出現(xiàn)過,計算重復(fù)長度為6,指回距離(當(dāng)前A離歷史A的距離)為8,則用(6,8)代替ABCDEF;處理到JKLM時沒發(fā)現(xiàn)重復(fù)字符,字符串到此處理完畢,則整個字符串被壓縮成:(08)h ABCDEFGH(6,8)(04)h JKLM,其中h表示16進制。
1.2 LZO壓縮算法編碼
LZO壓縮后的數(shù)據(jù)需要經(jīng)過特定的格式進行編碼,如圖2所示, LZO壓縮算法這樣做的目的有兩方面:調(diào)整LZO壓縮率,使得LZO適合壓縮重復(fù)長度短,但指回距離較長的數(shù)據(jù);使得解壓縮過程更加簡單,解壓縮速度更快,且不需要額外的內(nèi)存。


2 LZO壓縮算法硬件設(shè)計與加速方案
2.1 LZO壓縮算法硬件結(jié)構(gòu)
如圖3(A)給出了一種LZO壓縮算法的硬件結(jié)構(gòu),其中輸入緩存模塊:用于緩存DMA傳輸?shù)拇龎嚎s數(shù)據(jù),為高速緩存模塊提供數(shù)據(jù)源用以進行壓縮操作;高速緩存模塊:臨時緩存待壓縮數(shù)據(jù),為LZSS壓縮模塊提供待壓縮數(shù)據(jù),初始化時提前寫入一定量的數(shù)據(jù);LZSS模塊:對待壓縮數(shù)據(jù)進行壓縮處理;字典模塊:存儲壓縮過程中產(chǎn)生的壓縮信息,例如歷史字符串的索引信息,這樣便可為后續(xù)數(shù)據(jù)壓縮提供歷史字符串信息;LZO編碼模塊:對LZSS壓縮后的數(shù)據(jù)按照LZO編碼格式進行編碼,并將編碼數(shù)據(jù)組包成固定長度的數(shù)據(jù)包,方便總線通訊;輸出緩存模塊:緩存編碼后的數(shù)據(jù),為DMA讀操作提供壓縮后的數(shù)據(jù)源;Avalon總線接口:按照Avalon總線規(guī)范對LZO壓縮算法模塊進行封裝,為后續(xù)集成SOPC提供準(zhǔn)備。


2.2 LZO壓縮算法硬件加速方案
(1)分離雙端口RAM
為了加速LZO壓縮算法字符串的比對過程,本文提出如圖3(B)所示的分離雙端口RAM的結(jié)構(gòu),圖中的多路選擇器1用于將待壓縮數(shù)據(jù)交替式寫入雙端口RAM1和雙端口RAM2之一中,多路選擇器2用于將讀取的數(shù)據(jù)交替式輸出。例如,現(xiàn)有字符ABCDEFGHIJ要存入雙端口RAM中,具體如下:ABCD通過多路選擇器1被寫入RAM1中的data1處,EFGH通過多路選擇器1被寫入RAM2中的data2處,IJ通過多路選擇1被寫入data3,此時LZO壓縮算法模塊需要讀取字符串BCDE,則在讀取RAM1中data1處的BCD的同時讀取RAM2中data2處的E,即給RAM1讀地址的同時可以給RAM2讀地址,這樣同一時刻可以讀2處地址對應(yīng)的內(nèi)容。相比于一般性雙端口RAM結(jié)構(gòu),本結(jié)構(gòu)可以實現(xiàn)一次完成讀取操作。做進一步擴展可得出如下結(jié)論:若RAM的寬度為W,則讀取字符數(shù)在2W以內(nèi)時,采用分離雙端口RAM結(jié)構(gòu)可以一次完成讀取操作;則讀取字符數(shù)在2~2W以內(nèi)時,采用一般性雙端口RAM結(jié)構(gòu)可能要讀兩次。當(dāng)然,不僅RAM的寬度可以增加,RAM的個數(shù)也可以增加,當(dāng)RAM的寬度和RAM個數(shù)越大時,完成讀操作只需一次的可能性就越大。
(2)塊標(biāo)記
LZO壓縮算法在壓縮每個數(shù)據(jù)塊之前都要對字典模塊進行初始化為0的操作,即對RAM進行寫0操作,然而寫0操作會耗費若干個周期。若字典模塊深度為16K,即RAM的深度為16K,當(dāng)進行寫0操作時至少花費16K個周期。通常解決此類問題的一種方法是采用乒乓操作的方式,即用兩個字典來交替處理。為了解決初始化帶來的時間花費和資源消耗的問題,本文提出一種如圖3(C)所示的塊標(biāo)記字典結(jié)構(gòu),該結(jié)構(gòu)主要包括:LZSS壓縮控制模塊,用于產(chǎn)生壓縮信息,即字符索引及字符所對應(yīng)的Hash值;flag產(chǎn)生模塊,用于產(chǎn)生0或者1兩種flag標(biāo)識,表示是當(dāng)前數(shù)據(jù)塊還是歷史數(shù)據(jù)塊;信息合并模塊,用于將字符索引和flag標(biāo)識進行合并,然后存入字典模塊。整個結(jié)構(gòu)的工作原理可歸納如下:flag標(biāo)識0或1表示是當(dāng)前數(shù)據(jù)塊或歷史數(shù)據(jù)塊,如壓縮第一個數(shù)據(jù)塊時標(biāo)識為0,壓縮第二個數(shù)據(jù)塊時標(biāo)識為1,壓縮第三個數(shù)據(jù)塊時標(biāo)識為0,壓縮第四個數(shù)據(jù)塊時標(biāo)識為1,如此進行反復(fù);LZSS壓縮控制模塊產(chǎn)生字符索引然后與flag進行合并共同存入通過字符計算出的Hash值對應(yīng)的地址處。例如,現(xiàn)假設(shè)已經(jīng)壓縮到第二個數(shù)據(jù)塊,則根據(jù)上面的工作原理可知,當(dāng)前的標(biāo)識應(yīng)該為1,在壓縮時取出字典中的信息并判斷第一個bit位,如果第一個bit位為0則說明該壓縮信息是歷史數(shù)據(jù)塊,壓縮信息無效;如果第一個bit位為1則說明可能是當(dāng)前數(shù)據(jù)塊(因為也有可能是很久以前的數(shù)據(jù)塊),根據(jù)壓縮信息取出相應(yīng)字符進行比對確認。
綜上所述,塊標(biāo)記字典結(jié)構(gòu)具有如下特點:無需初始化操作,避免了初始化過程帶來的時間花費;摒棄了乒乓操作的思想,節(jié)省了乒乓操作帶來的大量資源的消耗;該結(jié)構(gòu)在片上資源緊缺的情況下是最優(yōu)的選擇。
(3)字典分離
軟件在實現(xiàn)LZO壓縮算法過程中,當(dāng)碰撞發(fā)生時,LZO壓縮算法會進行第二次Hash操作,該次Hash操作在第一次Hash操作的基礎(chǔ)上進行偏移。為了提升LZO壓縮算法的壓縮率,本文提出一種如圖3(D)所示的字典分離的結(jié)構(gòu),當(dāng)Hash碰撞發(fā)生時,LZO壓縮算法進行第二次Hash操作,但第二次Hash操作對應(yīng)的字符串索引不再存入第一個字典中,而是單獨開辟一塊RAM空間進行存儲。字典分離結(jié)構(gòu)的總存儲空間增加了字典2的大小,這樣在壓縮文件的過程中,文件的壓縮信息量也會增加??梢?,該結(jié)構(gòu)可以改進LZO壓縮算法的壓縮率。
3 LZO壓縮系統(tǒng)集成與測試驗證
3.1 LZO壓縮系統(tǒng)硬件結(jié)構(gòu)
如圖4(A)為LZO壓縮系統(tǒng)SOPC硬件結(jié)構(gòu),內(nèi)層虛線表示FPGA,虛線內(nèi)的模塊有相應(yīng)的代碼或硬件電路構(gòu)成,外層虛線表示DE2開發(fā)板,開發(fā)板提供了相應(yīng)的資源。圖中:PC機通過下載線將待壓縮的數(shù)據(jù)傳送至DE2開發(fā)板上的SDRAM,數(shù)據(jù)經(jīng)壓縮后再經(jīng)下載線回傳至PC機;Nios II處理器負責(zé)與用戶交互,對待壓縮數(shù)據(jù)進行管理,控制整個SOPC的正常工作;JTAG-UART用于設(shè)計過程中的軟件和硬件調(diào)試;DMA控制器用于高速數(shù)據(jù)傳輸,它將片外SDRAM中的待壓縮數(shù)據(jù)傳送到LZO壓縮算法模塊,將LZO壓縮算法模塊中被壓縮后的數(shù)據(jù)傳送到片外SDRAM中;LZO壓縮算法模塊用于對用戶傳輸過來的數(shù)據(jù)進行壓縮,它與片外SRAM進行通訊;LCD控制器用于控制LCD的顯示,LCD可顯示LZO壓縮文件開始與結(jié)束,增加用戶交互的可視性,例如顯示待壓縮文件的大小,壓縮后的文件大小等;PIO控制LED指示燈的亮與滅,LED燈可用于指示LZO壓縮文件開始與結(jié)束,增加用戶交互的可視性;On-chip memory用于存儲系統(tǒng)啟動時的軟硬件配置等信息;SDRAM控制器用于控制SDRAM與系統(tǒng)數(shù)據(jù)的交換;SDRAM用于存儲指令和數(shù)據(jù);SRAM用于存儲LZO壓縮算法過程中產(chǎn)生的壓縮信息,在硬件設(shè)計中扮演字典的角色,采用片外SRAM的原因是考慮到FPGA片內(nèi)資源可能不夠使用;以上所有涉及到的模塊均采用Avalon總線規(guī)范進行數(shù)據(jù)通信,它們共同掛載到數(shù)據(jù)總線上,Avalon總線具有自身的仲裁結(jié)構(gòu)、地址分析等功能,易于用戶集成開發(fā)。


3.2 開發(fā)板簡介
測試與驗證平臺如圖4(B)所示的DE2開發(fā)板,該開發(fā)板上的核心芯片為Altera公司的Cyclone II EP2C35 FPGA。選擇該開發(fā)板作為測試平臺主要基于以下考慮:擁有足夠的片外存儲資源(SDRAM 8MB、SRAM 512KB);擁有較豐富的片上邏輯資源(35K LEs);擁有豐富的可用于調(diào)試的外設(shè)(LCD、7-segment-displays);支持 Nios II嵌入式軟核;成本較低。
3.3 測試結(jié)果及對比
針對LZO壓縮算法模塊和集成后的系統(tǒng)進行板級測試,一方面驗證算法模塊及集成后的系統(tǒng)的功能正確性,另一方面測試分析算法模塊及集成后系統(tǒng)的性能。測試內(nèi)容包括:數(shù)據(jù)壓縮率(壓縮后的文件大小/壓縮前的文件大小),數(shù)據(jù)壓縮速率(單個周期內(nèi)處理的字節(jié)數(shù))。
通過圖5(A)可知,壓縮率提升最大的是1.pdf文件,提升最小的是7.mp3文件(音頻文件已經(jīng)采用音頻壓縮算法壓縮過了),除去最大值和最小值后取平均值,則壓縮率提升為1.37%;通過圖5(B)不難發(fā)現(xiàn),壓縮速率提升最快的為2.txt文件,提升最慢的為10.dll文件,除去最大值和最小值后取平均值,則壓縮速率提升為4.81倍。

2次

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉