高速公路流量檢測數(shù)據(jù)的預(yù)處理方法研究
掃描二維碼
隨時(shí)隨地手機(jī)看文章
李 陽
(長安大學(xué),陜西 西安 710064)
引 言
交通流數(shù)據(jù)主要包括車流量、車速、車間距、車輛類型、道路占有率等信息,其一般采用車輛檢測器檢測,車輛檢測器是高速公路交通監(jiān)控系統(tǒng)中不可缺少的組成部分,在智能交通系統(tǒng)中占有重要的地位,其檢測數(shù)據(jù)的有效利用能很大程度上提高交通監(jiān)控系統(tǒng)的管理水平。但是,由于車檢器的老化程度各有差異,受到路面交通狀況、惡劣環(huán)境等因素的影響程度也不同,車檢器也會存在不同程度的間歇性工作故障,流量檢測數(shù)據(jù)也會有不同程度的缺失與錯(cuò)誤,若直接將有質(zhì)量問題的數(shù)據(jù)應(yīng)用到交通流狀態(tài)辨識及后續(xù)應(yīng)用中,必將對應(yīng)用結(jié)果帶來不良影響,甚至直接影響科學(xué)決策的正確性 [1]。因此,為獲得高效精益化的交通流數(shù)據(jù),數(shù)據(jù)篩選與修補(bǔ)顯得尤為重要。目前,錯(cuò)誤數(shù)據(jù)的判別算法中的閾值方法、基于交通流機(jī)理的方法應(yīng)用較為廣泛,修補(bǔ)算法中加權(quán)平均法、BP 神經(jīng)網(wǎng)絡(luò)等方法也均有應(yīng)用[2]。而本研究采用的閾值法與交通流理論相結(jié)合的數(shù)據(jù)篩選方法,與已有的方法相比篩選規(guī)則更加精細(xì),篩選流程更加清晰有據(jù),且數(shù)據(jù)修補(bǔ)算法較為簡便易懂,便于實(shí)際運(yùn)用[3]。本文通過設(shè)計(jì)科學(xué)合理的算法對高速公路車檢器流量檢測數(shù)據(jù)的質(zhì)量給予評估,過濾掉錯(cuò)誤的數(shù)據(jù),并再此基礎(chǔ)上將錯(cuò)誤數(shù)據(jù)修補(bǔ)成較為真實(shí)的數(shù)據(jù),為車檢器檢測數(shù)據(jù)在ITS 應(yīng)用領(lǐng)域發(fā)揮更好與更大的效能提供基礎(chǔ)[4]。
1 流量檢測數(shù)據(jù)的篩選
車檢器檢測數(shù)據(jù)表現(xiàn)了高速公路的交通運(yùn)行狀態(tài)特征, 可提供總交通量、大中小分車型交通量、車輛占有率、速度等參數(shù)。其中,占有率、總交通量與速度間具有密切的聯(lián)系(在交通流量較小的情況下,單位時(shí)間內(nèi)通過檢測器的車輛數(shù)較小,且由于車速較高,導(dǎo)致時(shí)間占有率比較低。隨著交通量增加,單位時(shí)間內(nèi)通過檢測器的車輛數(shù)增加,而且車速有所降低,因此檢測器被車輛占用的時(shí)間增加,時(shí)間占有率會顯著增加。當(dāng)出現(xiàn)交通擁擠時(shí),通過檢測器的交通量雖然可能降低, 但由于車速明顯下降,使得時(shí)間占有率仍然處在一個(gè)較高的水平。)當(dāng)檢測數(shù)據(jù)中三者的關(guān)系符合其正常關(guān)系時(shí),總交通量符合真實(shí)值,反之,則可認(rèn)定其錯(cuò)誤。然而,在判斷總交通量正確的情況下,并不能反映出分車型流量的正誤,如圖 1 所示。當(dāng)分車型流量與總流量之間有一條數(shù)據(jù)不符合實(shí)際情況,那么此條數(shù)據(jù)就為錯(cuò)誤數(shù)據(jù)。
1.1 總交通量的篩選方法
利用占有率、交通量與速度之間的密切聯(lián)系,把交通流三參數(shù)作為一個(gè)整體考慮,有利于更好地利用其內(nèi)在的規(guī)律進(jìn)行篩選。表 1 是交通流三參數(shù)九種不同情況取值的組合,通過對這些組合的分析,可以對交通流三參數(shù)做一個(gè)基本的判斷,篩選出明顯錯(cuò)誤的數(shù)據(jù)[5,6],其中,v 代表車檢器采集到的速度值,o 表示車檢器采集到的占有率,q 表示車檢器采集到的總流量。
通過上述研究可得,除了被認(rèn)為數(shù)據(jù)錯(cuò)誤的 5 種情況被直接過濾掉外,另外 4 種情況將進(jìn)一步制定判別方法判斷流量檢測數(shù)據(jù)是否為真實(shí)值或錯(cuò)誤值,本研究主要運(yùn)用閾值法,閾值篩選是指交通量、速度和占有率不能超過一定的閾值。
針對交通量不為零的情況(情況 8 和情況 9,在交通低峰時(shí)期,車速快,車輛檢測器有時(shí)會出現(xiàn)靈敏度不夠的情況,占有率就會顯示為零),可通過最大閾值法排除檢測交通量數(shù)值超過道路通行能力的情況。道路通行能力是指道路上某一地點(diǎn)、某一車道或某斷面處,單位時(shí)間內(nèi)可能通過的最大的交通實(shí)體(車輛或行人)數(shù),估算單車道的道路通行能力的公式為 [7]:
根據(jù)道路通行能力的估算,定義交通量的取值范圍 q的合理范圍為:0 ≤ q≤ C·T/60·f。其中:C為道路通行能力(veh/h); v 為小客車的行車速度(km/h);T為數(shù)據(jù)采集的時(shí)間間隔(min),一般為 5min;l0為車頭最小間隔 ;lc為小客車的長度(km);la為車輛間的安全間距(km);f為修正系數(shù),一般取 1.3~1.5。
針對交通量為零,占有率約為 1的情況,可通過前 5分鐘和后 5 分鐘的數(shù)據(jù)判斷是否出現(xiàn)停車或擁堵狀況,如果前后三項(xiàng)數(shù)據(jù)基本一致則正確,否則將此條數(shù)據(jù)視為錯(cuò)誤數(shù)據(jù)。針對交通量和占有率均為 0 的情況,可能是因?yàn)榱璩苛髁枯^低,也可能是數(shù)據(jù)傳輸中斷造成丟失。這里可以對不同天數(shù)同一時(shí)段的交通流量的數(shù)據(jù)進(jìn)行比較,如果前后兩天的流量接近 0,則數(shù)據(jù)為真實(shí)值 ;否則為錯(cuò)誤數(shù)據(jù)。
1.2 分車型流量數(shù)據(jù)的篩選方法
將總流量有錯(cuò)誤的數(shù)據(jù)過濾掉后,需要判斷分車型流量數(shù)據(jù)是否有錯(cuò)誤。當(dāng)總流量為真值時(shí),分車型流量的和與總流量相比相差過大也是不對的。分車型流量的篩選通過以下公式判斷:
其中:qi 為分車型流量的值(i=1,2,3,分別表示大、中、小型車的檢測流量值);Q 為總交通量 ;δ% 為設(shè)定誤差,通常根據(jù)車檢器的精度參數(shù)進(jìn)行設(shè)定。
如果總交通量的值與分車型流量的和之間的相對誤差在規(guī)定范圍內(nèi),可視為數(shù)據(jù)為真實(shí)值 ;否則本條數(shù)據(jù)錯(cuò)誤,需要過濾掉。
2流量檢測數(shù)據(jù)的修補(bǔ)
將保留下來的車檢器流量檢測數(shù)據(jù)(包括小、中、大型車和總流量的檢測數(shù)據(jù))根據(jù)殘缺度,還原成完整度為 1 的數(shù)值,作為車檢器全天正常工作時(shí)檢測到的數(shù)據(jù)。車檢器一天中某缺失時(shí)段的總交通量的修補(bǔ)值根據(jù)對應(yīng)缺失時(shí)段的前15 天的總交通量檢測數(shù)據(jù)與后 15 天的總交通量檢測數(shù)據(jù)計(jì)算
得出,公式如下:
其中:kn 為車檢器第n 天缺失時(shí)段的總流量修補(bǔ)值。針對大、中、小、型車的檢測數(shù)據(jù)的修補(bǔ)方法,與總流量數(shù)據(jù)的修補(bǔ)方法相同。
結(jié) 語
本研究利用閾值法和數(shù)理統(tǒng)計(jì)知識對車檢器流量檢測數(shù)據(jù)的錯(cuò)誤數(shù)值的篩選提供了思路和依據(jù),并將其修補(bǔ)為正確性高,完整率為 1 的檢測數(shù)據(jù)。該方法的使用可以為高速公路管理部門提供質(zhì)量更好的流量檢測數(shù)據(jù),使車檢器數(shù)據(jù)發(fā)揮出更好的效能。