幾秒鐘預測整個美國的降水量!Google發(fā)布神經(jīng)網(wǎng)絡天氣模型
準確預測未來幾分鐘到幾周的天氣是一項基本的科學挑戰(zhàn),它可以對社會的許多方面產(chǎn)生廣泛影響。
很多氣象機構目前采用的預報是基于大氣的物理模型。盡管在過去幾十年有很大的改進,但這些模型本身受到計算要求的限制。并且,它們對物理定律的近似值非常敏感。
另一種能夠克服這些限制的天氣預報方法是使用深神經(jīng)網(wǎng)絡(DNNs)。DNNs 在強大的專用硬件(如 GPU 和 TPU)上使用并行計算,發(fā)現(xiàn)數(shù)據(jù)中的模式,并學習從輸入到所需輸出的復雜轉(zhuǎn)換。
近日,在先前對降水量預報的研究基礎上,Google 提出了 MetNet,這是一種用于降水預報的神經(jīng)天氣模型。這種 DNN 能夠在未來 8 小時內(nèi)以 1km 的分辨率預報降水量,時間間隔為 2 分鐘。MetNet 的預測時間比 NOAA 目前使用的最先進的基于物理的模型提前了 7-8 小時。它可以在幾秒鐘內(nèi)對整個美國的降水量進行預測,而 NOAA 需要花費一小時。
網(wǎng)絡的輸入來自雷達站和衛(wèi)星網(wǎng)絡,無需人工標注。模型輸出是一個概率分布,Google 用它來推斷每個地理區(qū)域的降水率和相關的不確定性。下圖提供了該網(wǎng)絡對美國大陸的預測示例。
MetNet 模型預測結果與 NOAA 多雷達/多傳感器系統(tǒng)(MRMS)測量的地面真實值進行了比較。MetNet 模型(上圖頂部)顯示了從 2 分鐘到 480 分鐘前預測的每小時 1 毫米降水的概率,而 MRMS 數(shù)據(jù)(上圖底部)顯示了在同一時間段內(nèi)接收到至少每小時 1 毫米降水的區(qū)域。
神經(jīng)天氣模型
MetNet 不依賴于大氣動力學領域的物理定律,它是通過反向傳播學習,直接從觀測數(shù)據(jù)中預測天氣。該網(wǎng)絡使用由多雷達/多傳感器系統(tǒng)(MRMS)組成的地面雷達站,以及提供大氣中云層自頂向下的視圖的衛(wèi)星系統(tǒng)測量得出的降水量估計值。這兩個數(shù)據(jù)源均覆蓋美國大陸,并提供可由網(wǎng)絡有效處理的圖像類輸入。
該模型每 64km*64km 執(zhí)行一次,覆蓋整個美國,其分辨率為 1 km。然而,與這些輸出區(qū)域相比,輸入數(shù)據(jù)的實際物理覆蓋范圍要大得多,因為它必須考慮到在進行預測的時間段內(nèi)云和降水場的可能運動。
例如,假設云以每小時 60km 的速度移動,為了作出可靠的預測,捕捉到 8 小時前的大氣時間動態(tài),模型需要 60*8=480km 的全方位空間背景。因此,要達到這個程度,需要 1024km*1024km 區(qū)域中的信息來對中心 64km*64km 補丁進行預測。
包含衛(wèi)星和雷達圖像(1024 *1024 平方公里)的輸入補丁和輸出預測雷達圖像(64*64 平方公里)
由于以全分辨率處理 1024km*1024km 的區(qū)域需要大量內(nèi)存,因此研究人員使用空間下采樣器,通過減少輸入面片的空間維度來減少內(nèi)存消耗。同時,在輸入中查找并保留相關的天氣模式。然后沿降采樣輸入數(shù)據(jù)的時間維度應用時間編碼器,對 90 分鐘輸入數(shù)據(jù)的 7 個快照進行編碼,編碼片段長度為 15 分鐘。時間編碼器采用卷積 LSTM 實現(xiàn),該卷積 LSTM 特別適合于圖像序列。
然后,時間編碼器的輸出被傳遞到空間聚集器,空間聚集器使用軸向自關注,有效地捕獲數(shù)據(jù)中的長距離空間依賴性,并基于輸入目標時間使用可變數(shù)量的上下文,以在 64km*64km 的輸出上進行預測。
這種結構的輸出是一個離散的概率分布,估計美國大陸每平方公里的給定降水率的概率。
神經(jīng)氣象模型 MetNet 的結構
結果
研究人員根據(jù)一個降水率預測基準對 MetNet 進行評估,并將結果與兩個基線進行比較:NOAA 高分辨率快速刷新 HRRR 系統(tǒng),這是目前在美國運行的物理天氣預測模型;一個估計降水場運動(即光流)的基線模型,它是一種在預測時間少于 2 小時時,表現(xiàn)也很好的方法。
Google 的神經(jīng)天氣模型的一個顯著優(yōu)點是,它是為密集并行計算而優(yōu)化的,并且非常適合在專用硬件(如 TPU)上運行。無論是針對紐約市這樣的特定地點還是針對整個美國,預測可以在幾秒鐘內(nèi)并行進行。而像 HRRR 這樣的物理模型在超級計算機上的運行時間約為一小時。
在下面的圖表中,研究人員量化了 MetNet、HRRR 和光流基線模型之間的性能差異。這里展示了這三個模型所取得的性能,在降水率閾值為 1.0mm/h(相當于小雨)時使用 F1 分數(shù)進行評估。MetNet 神經(jīng)天氣模型能夠在 8 小時內(nèi)超過 NOAA-HRRR 系統(tǒng),并且始終優(yōu)于基于流量的模型。
1.0 mm/h 降水率(越高越好)下的 F1 得分評估性能。神經(jīng)天氣模型(MetNet)比目前在美國運行的基于物理的模型(HRRR)的時間尺度要提前 8 小時。
由于大氣的隨機性,未來天氣狀況的不確定性隨著預測時間的延長而增加。
MetNet 是一個概率模型,隨著預測時間的延長,預測的不確定性在可視化中表現(xiàn)為預測的日益平滑。相反,HRRR 并不直接進行概率預測,而是會對未來的降水情況進行單一的預測。下圖比較了 MetNet 模型和 HRRR 模型的輸出。
從 NOAA MRMS 系統(tǒng)獲得的 MetNet(上)和 HRRR(下)到地面真值(中)的輸出之間的比較。注意,雖然 HRRR 模型預測的結構似乎更接近于基本事實,但預測的結構可能嚴重錯誤。
與 MetNet 模型相比,HRRR 物理模型的預測更清晰、更結構化。但其結構,特別是預測結構的準確時間和位置的精度較低。這是由于初始情況和模型參數(shù)的不確定性造成的。
HRRR(左)從許多可能的結果中預測單個潛在的未來結果(紅色),而 MetNet(右)通過分配未來結果的概率直接解釋不確定性。
未來方向
Google 正在積極研究如何改進全球天氣預報模型,尤其是在氣候快速變化很大的地區(qū)的準確性。雖然上文展示了美國大陸目前的 MetNet 模型,但它可以擴展到任何有足夠雷達和光學衛(wèi)星數(shù)據(jù)的地區(qū)。本文提出的工作是這一努力的一個小小的墊腳石,Google 希望通過今后與氣象界的合作,能夠帶來更大的改進。