基于DPCM算法的測井?dāng)?shù)據(jù)壓縮
摘要:由于現(xiàn)實中測井?dāng)?shù)據(jù)數(shù)據(jù)量大,數(shù)據(jù)傳輸實時性強,這就要求傳輸效率要盡可能地高。但是目前大多數(shù)油田仍采用直接傳輸采樣數(shù)據(jù)的方式。因此提出了一種基于DPCM算法的測井?dāng)?shù)據(jù)傳輸方式。針對編碼方式的特點,設(shè)計了編碼流程圖。對測井?dāng)?shù)據(jù)進行了相關(guān)的預(yù)處理,再進行編碼實現(xiàn)。經(jīng)仿真實驗后發(fā)現(xiàn),差值編碼能夠有效地去除數(shù)據(jù)之間的冗余,在保證編碼壓縮后的測井?dāng)?shù)據(jù)與原始測井?dāng)?shù)據(jù)誤差不超過5%的情況下,經(jīng)壓縮后的測井?dāng)?shù)據(jù)量為原始測井?dāng)?shù)據(jù)量的1/2,因此測井?dāng)?shù)據(jù)的傳輸效率提高到了2倍。
關(guān)鍵詞:差分脈沖編碼調(diào)制;Matlab;測井?dāng)?shù)據(jù);數(shù)據(jù)壓縮
0 引言
在隨鉆測井系統(tǒng)中,測井?dāng)?shù)據(jù)的實時傳輸是非常重要的環(huán)節(jié)。隨鉆測量對數(shù)據(jù)傳輸?shù)膶崟r性要求很高,目前最常用的信號上傳方式主要有鉆井液脈沖與電磁波這2種。鉆井液脈沖信號的傳輸方式主要利用了鉆井液脈沖信號將數(shù)據(jù)傳輸至地面,可靠性好,傳輸距離遠。而電磁波傳輸方式在傳輸過程中受到底層的影響大,傳輸衰減嚴(yán)重,一般主要用于較淺的地層中。在現(xiàn)代測井技術(shù)中,越來越精確的地層信息使測井?dāng)?shù)據(jù)量成倍地增加,但有限的傳輸帶寬卻限制了數(shù)據(jù)傳輸?shù)男?。因此提高測井?dāng)?shù)據(jù)的傳輸效率已經(jīng)是現(xiàn)在隨鉆測量技術(shù)發(fā)展的重點。
為了提高測井?dāng)?shù)據(jù)的傳輸效率,發(fā)達國家已經(jīng)將數(shù)據(jù)壓縮技術(shù)運用在測井?dāng)?shù)據(jù)的傳輸中。例如,斯倫貝謝公司利用圖像壓縮技術(shù)已經(jīng)成功地將井下井眼成像圖像壓縮50倍后傳輸至地面。這樣不僅解決了測井?dāng)?shù)據(jù)的傳輸效率問題,還兼顧實時性,使數(shù)據(jù)更快地傳輸至地面。與發(fā)達國家相比,我國的隨鉆測井整體技術(shù)還處于發(fā)展階段,并且研究方向主要集中在信號的信道編碼與信道建模等方面,對信息源的壓縮的研究相對來說比較少,因此提出一種有效的測井?dāng)?shù)據(jù)壓縮技術(shù)是非常有必要的。本文根據(jù)測井?dāng)?shù)據(jù)的相關(guān)性特點,提出了一種基于差值編碼(DPCM)的壓縮編碼傳輸方式,并給出了仿真結(jié)果。
1 DPCM編碼原理
1.1 DPCM基本原理
差值編碼(Differential Pulse Code Modulation,DPCM)又稱為預(yù)測編碼,是對信號抽樣的差值進行量化編碼的調(diào)制方式。DPCM是用已經(jīng)過去的抽樣值來預(yù)測當(dāng)前的抽樣值,對它們的差值進行編碼(見圖1)。由于所需編碼的數(shù)據(jù)中存在大量的冗余,使用這種編碼方法能有效地減少數(shù)據(jù)冗余,實現(xiàn)數(shù)據(jù)壓縮的目的。其中,s(n)為輸入的原始數(shù)據(jù)信號;s’(n)為輸出的解碼信號。
1.2 零極點預(yù)測器
DPCM編碼中最重要的是預(yù)測器,預(yù)測器的選擇直接影響誤碼率,本文選擇零極點預(yù)測器來預(yù)測當(dāng)前的抽樣值。零極點預(yù)測器是由零點預(yù)測器與極點預(yù)測器組合得到的。
2 測井?dāng)?shù)據(jù)的預(yù)處理
在測井?dāng)?shù)據(jù)傳輸過程中,計算機是嚴(yán)格地按照各個采樣點的數(shù)據(jù)值進行計算傳輸?shù)模虼藴y井?dāng)?shù)據(jù)的準(zhǔn)確性是保證測井?dāng)?shù)據(jù)傳輸有意義的重要因素。但是由于受到井下惡劣環(huán)境的影響,即使采用嚴(yán)格的技術(shù)措施,測井?dāng)?shù)據(jù)曲線幅度難免會產(chǎn)生錯誤,因此有必要在進行編碼前對測井?dāng)?shù)據(jù)進行預(yù)處理。
2.1 剔除異常值
所謂異常值,就是在測量過程中,測量結(jié)果大大偏離正常范圍的數(shù)值。異常值的存在,擴大了測井?dāng)?shù)據(jù)的量化范圍,給編碼時的數(shù)據(jù)預(yù)測與量化帶來了困難。在實際編碼過程前,應(yīng)首先剔除異常值。本文采用在統(tǒng)計學(xué)中的3δ準(zhǔn)則來進行異常值的檢測與剔除。依據(jù)3δ準(zhǔn)則,若采樣數(shù)據(jù)的值處于平均值的3倍標(biāo)準(zhǔn)差之外,則被稱為異常值。其標(biāo)準(zhǔn)差公式為。式中:為x的平均值。采樣值中正常值為x±3δ內(nèi)的數(shù)值,超過即為異常值。
2.2 數(shù)據(jù)曲線的濾波處理
測井曲線上的毛刺干擾,主要是由于井下儀器在測井過程中的不穩(wěn)定所產(chǎn)生的。這些測井?dāng)?shù)據(jù)的失真,會給之后的地質(zhì)參數(shù)計算帶來嚴(yán)重的干擾,在本文中采用五點三次平滑法對測井?dāng)?shù)據(jù)曲線進行平滑處理。
五點三次平滑法是利用最小二乘法原理對離散數(shù)據(jù)進行三次最小二乘多項式平滑的方法,五點三次平滑法計算公式為:
3 測井?dāng)?shù)據(jù)編碼壓縮仿真實現(xiàn)
在實際編碼過程中測井?dāng)?shù)據(jù)首先經(jīng)過異常值的處理,剔除不正常的數(shù)值,然后在經(jīng)過濾波算法,取消毛刺干擾后送入DPCM編碼器,在經(jīng)過信道傳輸后進行DPCM解碼,得到解碼后的數(shù)據(jù)(見圖2)。
本文選取聲波時差測井曲線作為測試數(shù)據(jù),仿真軟件采用Matlab軟件。Matlab擁有高效的數(shù)值計算及符號計算功能,具有完善的數(shù)據(jù)處理功能,能夠?qū)崿F(xiàn)計算結(jié)果與編程的可視化。測試結(jié)束后可以看出,經(jīng)過剔除異常值與濾波處理后,突變值被剔除,曲線保留了原始曲線的變化特征,并且較原始曲線相比明顯平滑(見圖3)。在編碼過程中,對聲波時差測井?dāng)?shù)據(jù)采用4 b編碼,相對于原來的8 b編碼,數(shù)據(jù)能夠得到有效的壓縮,壓縮率達到了50%。經(jīng)過DPCM解碼后,解碼曲線與原始測井曲線相比,曲線趨勢保持一致。計算的出編碼失真度為0.036 4,小于5%(見圖4)。
4 結(jié)語
本文提出并設(shè)計了基于DPCM算法的測井?dāng)?shù)據(jù)編碼壓縮。編寫了相關(guān)的程序代碼,并用實際的數(shù)據(jù)對該算法進行了仿真驗證。
實驗證明,經(jīng)過DPCM算法的編碼壓縮,使測井?dāng)?shù)據(jù)在誤差度不超過5%的情況下?lián)碛辛己玫膲嚎s比,提高數(shù)據(jù)傳輸?shù)膶崟r性,且算法結(jié)構(gòu)簡單,易實現(xiàn),對于井下作業(yè)來說擁有很大的優(yōu)勢。傳統(tǒng)的提高測井數(shù)據(jù)傳輸實時性主要通過改善鉆井液脈沖傳輸能力來實現(xiàn)。
本文從信息源的角度出發(fā),通過壓縮數(shù)據(jù)來提高傳輸?shù)膶崟r性,與傳統(tǒng)方法相比較,更加簡單,并可與傳統(tǒng)的方法相結(jié)合使用。