高速公路流量檢測數(shù)據(jù)的預處理方法研究
掃描二維碼
隨時隨地手機看文章
李 陽
(長安大學,陜西 西安 710064)
引 言
交通流數(shù)據(jù)主要包括車流量、車速、車間距、車輛類型、道路占有率等信息,其一般采用車輛檢測器檢測,車輛檢測器是高速公路交通監(jiān)控系統(tǒng)中不可缺少的組成部分,在智能交通系統(tǒng)中占有重要的地位,其檢測數(shù)據(jù)的有效利用能很大程度上提高交通監(jiān)控系統(tǒng)的管理水平。但是,由于車檢器的老化程度各有差異,受到路面交通狀況、惡劣環(huán)境等因素的影響程度也不同,車檢器也會存在不同程度的間歇性工作故障,流量檢測數(shù)據(jù)也會有不同程度的缺失與錯誤,若直接將有質(zhì)量問題的數(shù)據(jù)應用到交通流狀態(tài)辨識及后續(xù)應用中,必將對應用結(jié)果帶來不良影響,甚至直接影響科學決策的正確性 [1]。因此,為獲得高效精益化的交通流數(shù)據(jù),數(shù)據(jù)篩選與修補顯得尤為重要。目前,錯誤數(shù)據(jù)的判別算法中的閾值方法、基于交通流機理的方法應用較為廣泛,修補算法中加權(quán)平均法、BP 神經(jīng)網(wǎng)絡等方法也均有應用[2]。而本研究采用的閾值法與交通流理論相結(jié)合的數(shù)據(jù)篩選方法,與已有的方法相比篩選規(guī)則更加精細,篩選流程更加清晰有據(jù),且數(shù)據(jù)修補算法較為簡便易懂,便于實際運用[3]。本文通過設(shè)計科學合理的算法對高速公路車檢器流量檢測數(shù)據(jù)的質(zhì)量給予評估,過濾掉錯誤的數(shù)據(jù),并再此基礎(chǔ)上將錯誤數(shù)據(jù)修補成較為真實的數(shù)據(jù),為車檢器檢測數(shù)據(jù)在ITS 應用領(lǐng)域發(fā)揮更好與更大的效能提供基礎(chǔ)[4]。
1 流量檢測數(shù)據(jù)的篩選
車檢器檢測數(shù)據(jù)表現(xiàn)了高速公路的交通運行狀態(tài)特征, 可提供總交通量、大中小分車型交通量、車輛占有率、速度等參數(shù)。其中,占有率、總交通量與速度間具有密切的聯(lián)系(在交通流量較小的情況下,單位時間內(nèi)通過檢測器的車輛數(shù)較小,且由于車速較高,導致時間占有率比較低。隨著交通量增加,單位時間內(nèi)通過檢測器的車輛數(shù)增加,而且車速有所降低,因此檢測器被車輛占用的時間增加,時間占有率會顯著增加。當出現(xiàn)交通擁擠時,通過檢測器的交通量雖然可能降低, 但由于車速明顯下降,使得時間占有率仍然處在一個較高的水平。)當檢測數(shù)據(jù)中三者的關(guān)系符合其正常關(guān)系時,總交通量符合真實值,反之,則可認定其錯誤。然而,在判斷總交通量正確的情況下,并不能反映出分車型流量的正誤,如圖 1 所示。當分車型流量與總流量之間有一條數(shù)據(jù)不符合實際情況,那么此條數(shù)據(jù)就為錯誤數(shù)據(jù)。
1.1 總交通量的篩選方法
利用占有率、交通量與速度之間的密切聯(lián)系,把交通流三參數(shù)作為一個整體考慮,有利于更好地利用其內(nèi)在的規(guī)律進行篩選。表 1 是交通流三參數(shù)九種不同情況取值的組合,通過對這些組合的分析,可以對交通流三參數(shù)做一個基本的判斷,篩選出明顯錯誤的數(shù)據(jù)[5,6],其中,v 代表車檢器采集到的速度值,o 表示車檢器采集到的占有率,q 表示車檢器采集到的總流量。
通過上述研究可得,除了被認為數(shù)據(jù)錯誤的 5 種情況被直接過濾掉外,另外 4 種情況將進一步制定判別方法判斷流量檢測數(shù)據(jù)是否為真實值或錯誤值,本研究主要運用閾值法,閾值篩選是指交通量、速度和占有率不能超過一定的閾值。
針對交通量不為零的情況(情況 8 和情況 9,在交通低峰時期,車速快,車輛檢測器有時會出現(xiàn)靈敏度不夠的情況,占有率就會顯示為零),可通過最大閾值法排除檢測交通量數(shù)值超過道路通行能力的情況。道路通行能力是指道路上某一地點、某一車道或某斷面處,單位時間內(nèi)可能通過的最大的交通實體(車輛或行人)數(shù),估算單車道的道路通行能力的公式為 [7]:
根據(jù)道路通行能力的估算,定義交通量的取值范圍 q的合理范圍為:0 ≤ q≤ C·T/60·f。其中:C為道路通行能力(veh/h); v 為小客車的行車速度(km/h);T為數(shù)據(jù)采集的時間間隔(min),一般為 5min;l0為車頭最小間隔 ;lc為小客車的長度(km);la為車輛間的安全間距(km);f為修正系數(shù),一般取 1.3~1.5。
針對交通量為零,占有率約為 1的情況,可通過前 5分鐘和后 5 分鐘的數(shù)據(jù)判斷是否出現(xiàn)停車或擁堵狀況,如果前后三項數(shù)據(jù)基本一致則正確,否則將此條數(shù)據(jù)視為錯誤數(shù)據(jù)。針對交通量和占有率均為 0 的情況,可能是因為凌晨流量較低,也可能是數(shù)據(jù)傳輸中斷造成丟失。這里可以對不同天數(shù)同一時段的交通流量的數(shù)據(jù)進行比較,如果前后兩天的流量接近 0,則數(shù)據(jù)為真實值 ;否則為錯誤數(shù)據(jù)。
1.2 分車型流量數(shù)據(jù)的篩選方法
將總流量有錯誤的數(shù)據(jù)過濾掉后,需要判斷分車型流量數(shù)據(jù)是否有錯誤。當總流量為真值時,分車型流量的和與總流量相比相差過大也是不對的。分車型流量的篩選通過以下公式判斷:
其中:qi 為分車型流量的值(i=1,2,3,分別表示大、中、小型車的檢測流量值);Q 為總交通量 ;δ% 為設(shè)定誤差,通常根據(jù)車檢器的精度參數(shù)進行設(shè)定。
如果總交通量的值與分車型流量的和之間的相對誤差在規(guī)定范圍內(nèi),可視為數(shù)據(jù)為真實值 ;否則本條數(shù)據(jù)錯誤,需要過濾掉。
2流量檢測數(shù)據(jù)的修補
將保留下來的車檢器流量檢測數(shù)據(jù)(包括小、中、大型車和總流量的檢測數(shù)據(jù))根據(jù)殘缺度,還原成完整度為 1 的數(shù)值,作為車檢器全天正常工作時檢測到的數(shù)據(jù)。車檢器一天中某缺失時段的總交通量的修補值根據(jù)對應缺失時段的前15 天的總交通量檢測數(shù)據(jù)與后 15 天的總交通量檢測數(shù)據(jù)計算
得出,公式如下:
其中:kn 為車檢器第n 天缺失時段的總流量修補值。針對大、中、小、型車的檢測數(shù)據(jù)的修補方法,與總流量數(shù)據(jù)的修補方法相同。
結(jié) 語
本研究利用閾值法和數(shù)理統(tǒng)計知識對車檢器流量檢測數(shù)據(jù)的錯誤數(shù)值的篩選提供了思路和依據(jù),并將其修補為正確性高,完整率為 1 的檢測數(shù)據(jù)。該方法的使用可以為高速公路管理部門提供質(zhì)量更好的流量檢測數(shù)據(jù),使車檢器數(shù)據(jù)發(fā)揮出更好的效能。