基于神經(jīng)網(wǎng)絡(luò)的電子鼻肺癌早期診斷系統(tǒng)
掃描二維碼
隨時隨地手機(jī)看文章
肺癌是目前全世界最常見的惡性腫瘤之一,其發(fā)病率和死亡率不斷上升。究其原因是肺癌病因不明,發(fā)病時間短、轉(zhuǎn)移快、惡性程度高,早期不易診斷,到中、晚期失去了手術(shù)機(jī)會,患者五年生存率僅為15%左右。早期發(fā)現(xiàn)可使患者五年內(nèi)生存率提高到70%~80%。所以早期發(fā)現(xiàn)、早期診斷、早期治療是提高肺癌生存率和降低死亡率的關(guān)鍵。肺癌早期通常無特殊癥狀,幾乎不被醫(yī)生和病人警覺,并且常用診斷方法難以做到早期發(fā)現(xiàn)、早期定性診斷。
目前,基于電子鼻的疾病診斷研究主要集中在有關(guān)腎病、糖尿病的早期診斷和一些細(xì)菌的類型與生長階段的識別。電子鼻的疾病診斷作為醫(yī)學(xué)診斷無損化的重要方向之一,已經(jīng)取得了很多成果,但目前還未有通過認(rèn)證的呼吸診斷儀器的報(bào)道。如何進(jìn)一步改進(jìn)肺癌的診斷技術(shù)、提高各種治療的療效等,已經(jīng)成為近期全世界腫瘤研究領(lǐng)域的重中之重。我國也把肺癌列為全國重點(diǎn)攻關(guān)課題。尋找一種更先進(jìn)的儀器和技術(shù)在局部組織發(fā)生癌變時即能發(fā)現(xiàn)和診斷,即是本電子鼻系統(tǒng)所要完成的工作。本文從相關(guān)病理的呼吸氣體的偵測和收集、氣體傳感器陣列的選取及優(yōu)化設(shè)計(jì)和模式識別技術(shù)的選擇等方面對電子鼻肺癌早期診斷系統(tǒng)進(jìn)行了關(guān)鍵技術(shù)的設(shè)計(jì),取得了良好的效果。
1 電子鼻肺癌早期診斷系統(tǒng)結(jié)構(gòu)
電子鼻是利用氣體傳感器陣列的響應(yīng)圖案來識別氣體的電子系統(tǒng)。電子鼻主要由氣體取樣操作器、氣體傳感器陣列和信號處理系統(tǒng)三種功能器件組成。電子鼻識別氣體的主要機(jī)理是在陣列中的每個傳感器對被測氣體都有不同的靈敏度,整個傳感器陣列對不同氣體的響應(yīng)圖案不同。正是這種區(qū)別,才使系統(tǒng)能根據(jù)傳感器的響應(yīng)圖案識別氣味。
電子鼻典型的工作流程是:首先,利用呼吸氣體收集裝置(經(jīng)過呼吸氣體凈化和流量控制)把呼吸氣體吸取至裝有電子傳感器陣列的小容器室中;接著,把已初始化的傳感器陣列暴露到被測氣體中,當(dāng)揮發(fā)性化合物(VOC)與傳感器活性材料表面接觸時,產(chǎn)生瞬時響應(yīng),這種響應(yīng)被記錄并傳送到信號處理單元進(jìn)行分析,與數(shù)據(jù)庫中存儲的大量VOC圖案進(jìn)行比較、鑒別,以確定氣體類型;最后,清洗氣沖洗傳感器活性材料表面以去除測畢的氣體混合物。在進(jìn)入下一輪新的測量之前,傳感器仍需再次初始化(即工作之前,每個傳感器都需用干燥氣或某些其他參考?xì)怏w清洗,以達(dá)到基準(zhǔn)狀態(tài))。電子鼻肺癌早期診斷系統(tǒng)結(jié)構(gòu)如圖1所示。
2 電子鼻肺癌早期診斷系統(tǒng)的設(shè)計(jì)
本文從肺癌患者的呼吸氣體中與疾病有較大相關(guān)性的有病理意義的氣體的偵測、呼吸氣體收集裝置的設(shè)計(jì)、氣體傳感器陣列的選取及優(yōu)化設(shè)計(jì)和模式識別技術(shù)的選擇等方面進(jìn)行了關(guān)鍵技術(shù)的設(shè)計(jì)。
2.1 呼吸氣體的偵測
大約有200種以上的化合物已在人類的呼氣中被偵測出,其中某些氣體與肺癌相關(guān),因此利用呼氣檢測疾病是可行的方法。其優(yōu)點(diǎn)是非侵入式、簡單、快速,故具有極高的應(yīng)用發(fā)展?jié)摿?。與醫(yī)院結(jié)合,選取合適的氣敏傳感器與檢測方法,檢測肺癌患者的呼出氣體中苯乙烯、癸烷、十一烷等22種有機(jī)揮發(fā)性(VOCs)特征氣體的濃度是很有前景的肺癌無創(chuàng)傷診斷與監(jiān)護(hù)方法。
2.2 呼吸氣體收集裝置的設(shè)計(jì)
由于呼氣中所產(chǎn)生與肺癌相關(guān)的氣體濃度很低(通常在ppb層級),而傳統(tǒng)的呼氣檢測方式是根據(jù)標(biāo)準(zhǔn)的呼氣采樣程序后,再以氣相色譜質(zhì)譜分析儀判定化合物種類,其分析過程必須將大量的呼氣樣品(約需3L的呼氣樣品)濃縮后,才可達(dá)到儀器能偵測的極限值。此方法不僅儀器昂貴、耗時且需大量的樣品檢體。而電子鼻所需的分析成本不高,且所需呼氣樣品量僅10ml左右,操作簡單、反應(yīng)快速(數(shù)分鐘)。呼吸氣體的收集在電子鼻的肺癌早期診斷系統(tǒng)中占有極其重要的地位,氣體收集裝置的結(jié)構(gòu)如圖2所示。
圖2中箭頭表示清洗氣和呼吸氣體的流動方向。整個氣體收集裝置經(jīng)過氣體清洗后,通過吹氣口將測試者的呼吸氣體呼入。經(jīng)過一系列的水分和無關(guān)氣體的清除后,通過流量計(jì)控制氣體的流速和微處理器的定時采集,再經(jīng)過加熱器除去非活性氣體。
2.3 氣體傳感器陣列的選取和優(yōu)化設(shè)計(jì)
在該電子鼻系統(tǒng)中,氣體傳感器陣列是關(guān)鍵因素。影響氣敏傳感器性能的主要因素有材料及成模技術(shù)、應(yīng)用溶凝膠技術(shù)制備敏感模、工作狀態(tài)及工作環(huán)境等。此外,還要考慮初始過程響應(yīng)和氧分壓對氣敏傳感器特性的影響。
氣體傳感器陣列的性能直接決定了系統(tǒng)的識別能力、識別范圍、使用壽命等,因而如何構(gòu)成陣列以提高電子鼻系統(tǒng)的性能成為重要的研究課題。傳感器陣列的參數(shù)選擇主要是:陣列規(guī)模、傳感器類型及其選擇性、穩(wěn)定性、噪聲水平以及熱敏特性等。
電子鼻系統(tǒng)中的傳感器陣列可以是單片集成陣列,也可以由多個分立元件構(gòu)成。當(dāng)使用的陣列單元較多時,單片集成的陣列顯示出尺寸小、功耗低的優(yōu)點(diǎn);另一方面,分立器件的性能也在不斷得到提高。不論采用哪種陣列,陣列的規(guī)模和尺寸都非常重要。適當(dāng)增加陣列單元數(shù)目,會得到更好的系統(tǒng)識別能力,但有時陣列單元的增加并不能改善系統(tǒng)的識別效果,并且較大規(guī)模的陣列,其功耗也較大,單元之間的熱干擾也比較嚴(yán)重,這將增加系統(tǒng)集成的難度。構(gòu)成陣列時,還要考慮陣列各單元的選擇性。如果各單元對于特定氣體具有較好的選擇性,則陣列對這些氣體及其混合氣體的識別能力就比較強(qiáng),但其能夠識別的氣體種類就會減少,對于更多成分的復(fù)雜混合氣體的識別能力就比較弱。在構(gòu)造傳感器陣列時可以采用選擇性不強(qiáng)、具有較寬的響應(yīng)范圍的傳感器件,通過模式識別技術(shù)提升系統(tǒng)選擇性和精度,同時針對不同的識別對象,加入個別選擇性較好的單元,以簡化陣列。在陣列單元選擇方面,有采用測試結(jié)果的正態(tài)分布特性、相對標(biāo)準(zhǔn)方差分析、相關(guān)系數(shù)分析等方法。本系統(tǒng)中,交叉響應(yīng)特性、陣列穩(wěn)定性是傳感器陣列單元選擇的主要目標(biāo)。
2.4 模式識別技術(shù)的選擇
利用陣列中氣體傳感器的交叉選擇性對被測介質(zhì)形成高維響應(yīng)模式,結(jié)合模式識別技術(shù),可以對單一氣體進(jìn)行定性分析或確定混合氣體中的特定分量。氣體傳感器的響應(yīng)通常具有較強(qiáng)的非線性,所以常規(guī)的模式識別方法,如主成分分析法、偏最小二乘回歸法、歐幾里德聚類分析法等受到限制(大多數(shù)常規(guī)分類法是線性方法,假設(shè)響應(yīng)向量位于歐幾里德空間,被測對象的濃度與傳感器的響應(yīng)呈線性關(guān)系。只有當(dāng)氣體和氣味的濃度很低時,情況才如此)。而人工神經(jīng)網(wǎng)絡(luò)能夠處理非線性數(shù)據(jù),能夠容忍傳感器的漂移和噪聲,魯棒性好,預(yù)報(bào)正確率也比常規(guī)方法高。
由于傳感器的響應(yīng)值與所測氣體成分之間的關(guān)系非常復(fù)雜,很難用明確的數(shù)學(xué)關(guān)系表達(dá),因此采用神經(jīng)網(wǎng)絡(luò)技術(shù)建立傳感器陣列響應(yīng)信號與測量氣體之間的映射關(guān)系。徑向基函數(shù)RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)在一定程度上可克服局部最小和效率低等問題,在函數(shù)逼近方面與BP神經(jīng)網(wǎng)絡(luò)相比有著明顯的優(yōu)勢。綜合以上分析,本系統(tǒng)采用RBF神經(jīng)網(wǎng)絡(luò)模式識別方法。圖3是RBF神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。
RBF神經(jīng)網(wǎng)絡(luò)由輸入層、中間層(隱層) 和輸出層組成。在此, 輸入層僅對數(shù)據(jù)信息進(jìn)行傳遞,而不進(jìn)行任何變換。隱層神經(jīng)元的核函數(shù)(或稱作用函數(shù))取為高斯函數(shù),對輸入信息進(jìn)行空間映射變換。輸出層神經(jīng)元的作用函數(shù)為Sigmoid函數(shù),對隱層神經(jīng)元輸出的信息進(jìn)行線性加權(quán)后輸出,作為網(wǎng)絡(luò)的輸出結(jié)果。采用監(jiān)督學(xué)習(xí)的方法訓(xùn)練神經(jīng)網(wǎng)絡(luò),以確定網(wǎng)絡(luò)的中心、寬度和調(diào)節(jié)權(quán)重。從測試樣本中,隨機(jī)抽取80個樣本中的60個為訓(xùn)練集,其余20個為測試集,在不同的溫度和濕度條件下,分別做三次實(shí)驗(yàn)。
網(wǎng)絡(luò)訓(xùn)練參數(shù)動量因子α=0.09,學(xué)習(xí)因子η=10.12,最大訓(xùn)練次數(shù)為20 000次,目標(biāo)誤差為0.01,訓(xùn)練時間約3min,網(wǎng)絡(luò)達(dá)到目標(biāo)誤差要求。將訓(xùn)練好的網(wǎng)絡(luò)對樣本進(jìn)行測試,結(jié)果如表1所示。對于三次實(shí)驗(yàn),正確的判別結(jié)果達(dá)到了90%以上。這樣的結(jié)果是令人滿意的,說明本應(yīng)用可以及早發(fā)現(xiàn)肺癌患者。
本文建立了一套能快速準(zhǔn)確地診斷肺癌的電子鼻系統(tǒng)。該電子鼻系統(tǒng)由傳感器陣列組成。在數(shù)據(jù)處理中,對所得的傳感器數(shù)據(jù)采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行模式識別處理,選取不同的溫度和濕度條件,進(jìn)行了三次實(shí)驗(yàn)。整個測試過程除了樣本放入時需要頂空氣體穩(wěn)定2 min左右和采集傳感器與樣本氣體反應(yīng)數(shù)據(jù)需要2 min左右外,其他數(shù)據(jù)處理幾乎不到半分鐘,因此測試一個樣本的時間不超過5 min。但由于所研制的電子鼻還處于實(shí)驗(yàn)室階段,仍有許多需要進(jìn)一步研究的問題,如在裝置上,如何改進(jìn)現(xiàn)有裝置、優(yōu)化傳感器陣列;在數(shù)據(jù)處理方面,特征值的提取、模式識別算法的改進(jìn)等。