基于DPCM算法的測井?dāng)?shù)據(jù)壓縮
掃描二維碼
隨時(shí)隨地手機(jī)看文章
摘要:由于現(xiàn)實(shí)中測井?dāng)?shù)據(jù)數(shù)據(jù)量大,數(shù)據(jù)傳輸實(shí)時(shí)性強(qiáng),這就要求傳輸效率要盡可能地高。但是目前大多數(shù)油田仍采用直接傳輸采樣數(shù)據(jù)的方式。因此提出了一種基于DPCM算法的測井?dāng)?shù)據(jù)傳輸方式。針對編碼方式的特點(diǎn),設(shè)計(jì)了編碼流程圖。對測井?dāng)?shù)據(jù)進(jìn)行了相關(guān)的預(yù)處理,再進(jìn)行編碼實(shí)現(xiàn)。經(jīng)仿真實(shí)驗(yàn)后發(fā)現(xiàn),差值編碼能夠有效地去除數(shù)據(jù)之間的冗余,在保證編碼壓縮后的測井?dāng)?shù)據(jù)與原始測井?dāng)?shù)據(jù)誤差不超過5%的情況下,經(jīng)壓縮后的測井?dāng)?shù)據(jù)量為原始測井?dāng)?shù)據(jù)量的1/2,因此測井?dāng)?shù)據(jù)的傳輸效率提高到了2倍。
關(guān)鍵詞:差分脈沖編碼調(diào)制;Matlab;測井?dāng)?shù)據(jù);數(shù)據(jù)壓縮
0 引言
在隨鉆測井系統(tǒng)中,測井?dāng)?shù)據(jù)的實(shí)時(shí)傳輸是非常重要的環(huán)節(jié)。隨鉆測量對數(shù)據(jù)傳輸?shù)膶?shí)時(shí)性要求很高,目前最常用的信號上傳方式主要有鉆井液脈沖與電磁波這2種。鉆井液脈沖信號的傳輸方式主要利用了鉆井液脈沖信號將數(shù)據(jù)傳輸至地面,可靠性好,傳輸距離遠(yuǎn)。而電磁波傳輸方式在傳輸過程中受到底層的影響大,傳輸衰減嚴(yán)重,一般主要用于較淺的地層中。在現(xiàn)代測井技術(shù)中,越來越精確的地層信息使測井?dāng)?shù)據(jù)量成倍地增加,但有限的傳輸帶寬卻限制了數(shù)據(jù)傳輸?shù)男?。因此提高測井?dāng)?shù)據(jù)的傳輸效率已經(jīng)是現(xiàn)在隨鉆測量技術(shù)發(fā)展的重點(diǎn)。
為了提高測井?dāng)?shù)據(jù)的傳輸效率,發(fā)達(dá)國家已經(jīng)將數(shù)據(jù)壓縮技術(shù)運(yùn)用在測井?dāng)?shù)據(jù)的傳輸中。例如,斯倫貝謝公司利用圖像壓縮技術(shù)已經(jīng)成功地將井下井眼成像圖像壓縮50倍后傳輸至地面。這樣不僅解決了測井?dāng)?shù)據(jù)的傳輸效率問題,還兼顧實(shí)時(shí)性,使數(shù)據(jù)更快地傳輸至地面。與發(fā)達(dá)國家相比,我國的隨鉆測井整體技術(shù)還處于發(fā)展階段,并且研究方向主要集中在信號的信道編碼與信道建模等方面,對信息源的壓縮的研究相對來說比較少,因此提出一種有效的測井?dāng)?shù)據(jù)壓縮技術(shù)是非常有必要的。本文根據(jù)測井?dāng)?shù)據(jù)的相關(guān)性特點(diǎn),提出了一種基于差值編碼(DPCM)的壓縮編碼傳輸方式,并給出了仿真結(jié)果。
1 DPCM編碼原理
1.1 DPCM基本原理
差值編碼(Differential Pulse Code Modulation,DPCM)又稱為預(yù)測編碼,是對信號抽樣的差值進(jìn)行量化編碼的調(diào)制方式。DPCM是用已經(jīng)過去的抽樣值來預(yù)測當(dāng)前的抽樣值,對它們的差值進(jìn)行編碼(見圖1)。由于所需編碼的數(shù)據(jù)中存在大量的冗余,使用這種編碼方法能有效地減少數(shù)據(jù)冗余,實(shí)現(xiàn)數(shù)據(jù)壓縮的目的。其中,s(n)為輸入的原始數(shù)據(jù)信號;s’(n)為輸出的解碼信號。
1.2 零極點(diǎn)預(yù)測器
DPCM編碼中最重要的是預(yù)測器,預(yù)測器的選擇直接影響誤碼率,本文選擇零極點(diǎn)預(yù)測器來預(yù)測當(dāng)前的抽樣值。零極點(diǎn)預(yù)測器是由零點(diǎn)預(yù)測器與極點(diǎn)預(yù)測器組合得到的。
2 測井?dāng)?shù)據(jù)的預(yù)處理
在測井?dāng)?shù)據(jù)傳輸過程中,計(jì)算機(jī)是嚴(yán)格地按照各個(gè)采樣點(diǎn)的數(shù)據(jù)值進(jìn)行計(jì)算傳輸?shù)?,因此測井?dāng)?shù)據(jù)的準(zhǔn)確性是保證測井?dāng)?shù)據(jù)傳輸有意義的重要因素。但是由于受到井下惡劣環(huán)境的影響,即使采用嚴(yán)格的技術(shù)措施,測井?dāng)?shù)據(jù)曲線幅度難免會產(chǎn)生錯(cuò)誤,因此有必要在進(jìn)行編碼前對測井?dāng)?shù)據(jù)進(jìn)行預(yù)處理。
2.1 剔除異常值
所謂異常值,就是在測量過程中,測量結(jié)果大大偏離正常范圍的數(shù)值。異常值的存在,擴(kuò)大了測井?dāng)?shù)據(jù)的量化范圍,給編碼時(shí)的數(shù)據(jù)預(yù)測與量化帶來了困難。在實(shí)際編碼過程前,應(yīng)首先剔除異常值。本文采用在統(tǒng)計(jì)學(xué)中的3δ準(zhǔn)則來進(jìn)行異常值的檢測與剔除。依據(jù)3δ準(zhǔn)則,若采樣數(shù)據(jù)的值處于平均值的3倍標(biāo)準(zhǔn)差之外,則被稱為異常值。其標(biāo)準(zhǔn)差公式為。式中:為x的平均值。采樣值中正常值為x±3δ內(nèi)的數(shù)值,超過即為異常值。
2.2 數(shù)據(jù)曲線的濾波處理
測井曲線上的毛刺干擾,主要是由于井下儀器在測井過程中的不穩(wěn)定所產(chǎn)生的。這些測井?dāng)?shù)據(jù)的失真,會給之后的地質(zhì)參數(shù)計(jì)算帶來嚴(yán)重的干擾,在本文中采用五點(diǎn)三次平滑法對測井?dāng)?shù)據(jù)曲線進(jìn)行平滑處理。
五點(diǎn)三次平滑法是利用最小二乘法原理對離散數(shù)據(jù)進(jìn)行三次最小二乘多項(xiàng)式平滑的方法,五點(diǎn)三次平滑法計(jì)算公式為:
3 測井?dāng)?shù)據(jù)編碼壓縮仿真實(shí)現(xiàn)
在實(shí)際編碼過程中測井?dāng)?shù)據(jù)首先經(jīng)過異常值的處理,剔除不正常的數(shù)值,然后在經(jīng)過濾波算法,取消毛刺干擾后送入DPCM編碼器,在經(jīng)過信道傳輸后進(jìn)行DPCM解碼,得到解碼后的數(shù)據(jù)(見圖2)。
本文選取聲波時(shí)差測井曲線作為測試數(shù)據(jù),仿真軟件采用Matlab軟件。Matlab擁有高效的數(shù)值計(jì)算及符號計(jì)算功能,具有完善的數(shù)據(jù)處理功能,能夠?qū)崿F(xiàn)計(jì)算結(jié)果與編程的可視化。測試結(jié)束后可以看出,經(jīng)過剔除異常值與濾波處理后,突變值被剔除,曲線保留了原始曲線的變化特征,并且較原始曲線相比明顯平滑(見圖3)。在編碼過程中,對聲波時(shí)差測井?dāng)?shù)據(jù)采用4 b編碼,相對于原來的8 b編碼,數(shù)據(jù)能夠得到有效的壓縮,壓縮率達(dá)到了50%。經(jīng)過DPCM解碼后,解碼曲線與原始測井曲線相比,曲線趨勢保持一致。計(jì)算的出編碼失真度為0.036 4,小于5%(見圖4)。
4 結(jié)語
本文提出并設(shè)計(jì)了基于DPCM算法的測井?dāng)?shù)據(jù)編碼壓縮。編寫了相關(guān)的程序代碼,并用實(shí)際的數(shù)據(jù)對該算法進(jìn)行了仿真驗(yàn)證。
實(shí)驗(yàn)證明,經(jīng)過DPCM算法的編碼壓縮,使測井?dāng)?shù)據(jù)在誤差度不超過5%的情況下?lián)碛辛己玫膲嚎s比,提高數(shù)據(jù)傳輸?shù)膶?shí)時(shí)性,且算法結(jié)構(gòu)簡單,易實(shí)現(xiàn),對于井下作業(yè)來說擁有很大的優(yōu)勢。傳統(tǒng)的提高測井數(shù)據(jù)傳輸實(shí)時(shí)性主要通過改善鉆井液脈沖傳輸能力來實(shí)現(xiàn)。
本文從信息源的角度出發(fā),通過壓縮數(shù)據(jù)來提高傳輸?shù)膶?shí)時(shí)性,與傳統(tǒng)方法相比較,更加簡單,并可與傳統(tǒng)的方法相結(jié)合使用。