首個神經(jīng)網(wǎng)絡工控系統(tǒng)的應用在谷歌上線了
即便深度學習和其它機器學習方法近幾年已經(jīng)取得了不小的發(fā)展,但是把它們直接應用在真實工業(yè)場景中、讓它們直接控制工業(yè)系統(tǒng)還未曾見到。深度學習本身缺乏魯棒性、面對新狀況難以預測行為等一些特性固然是重要的掣肘之處,如何讓算法逐步提高控制范圍、協(xié)調(diào)與人類的協(xié)作方式也是難題。DeepMind 和谷歌最近就做出了新一步嘗試,取得了不小的成功,然后在 DeepMind 博客上進行了介紹。雷鋒網(wǎng) AI 科技評論編譯如下。
我們?nèi)祟惿鐣鎸Φ脑S多緊迫問題中,有許多問題還在變得越來越復雜,所有人都急切地想要找到好的解決方法。對于 DeepMind 和谷歌來說,他們相信如果人類可以把 AI 作為探尋新知識的工具加以利用,找到解決方法就會容易得多。
最近,DeepMind 把這個系統(tǒng)升級到了一個全新的級別上:不再像原來的系統(tǒng)那樣向人類推薦一些動作,然后由人類去完成,AI 系統(tǒng)現(xiàn)在會直接控制數(shù)據(jù)中心的冷卻系統(tǒng),當然了它也仍然受到數(shù)據(jù)中心運營人員的專業(yè)監(jiān)控。這是首個基于云的控制系統(tǒng),已經(jīng)在多個谷歌的數(shù)據(jù)中心中安靜地運行、持續(xù)地節(jié)省能源。
每隔 5 分鐘,這個基于云的 AI 會從數(shù)據(jù)中心的數(shù)千個傳感器中采集數(shù)據(jù),獲得數(shù)據(jù)中心冷卻系統(tǒng)的狀態(tài)快照,然后把它輸入深度神經(jīng)網(wǎng)絡。這個網(wǎng)絡會預測各種可能的操作的不同組合會如何影響數(shù)據(jù)中心的能量消耗。然后 AI 就會就會在滿足魯棒安全性限制的條件下判斷出一組能夠最小化能源消耗的動作。這些動作的判斷結(jié)果接下來會被發(fā)回給數(shù)據(jù)中心,由本地的控制系統(tǒng)驗證并執(zhí)行。
這種系統(tǒng)運行的想法其實來自于在數(shù)據(jù)中心使用原來那個 AI 推薦系統(tǒng)的操作人員。他們告訴 DeepMind 的研究人員們,雖然系統(tǒng)給他們教了一些最新最好的操作技巧,比如讓冷卻介質(zhì)覆蓋更多的設(shè)備,而不是更少,但是實現(xiàn)這些推薦操作其實需要花費非常多的操作精力和長期規(guī)劃。所以他們自然地就很想知道,能不能不需要人來出力就達到類似的能源節(jié)省效果。
谷歌的數(shù)據(jù)中心里一般都有上千臺服務器,它們支撐著谷歌搜索、Gmail、YouTube 等用戶們每天都會使用的服務。確保這些服務可以可靠、高效地運行是最關(guān)鍵的一件事。DeepMind 和谷歌一起設(shè)計 AI 智能體以及背后的控制界面時,都是帶著安全、可靠的思維從頭設(shè)計的,還使用了 8 種不同的機制確保系統(tǒng)能夠總是能夠按照預期行動。
他們使用的方法里,其中一種較為簡單的是估計不確定性。對于總計上億個可能的動作中的每一種,AI 智能體都需要計算自己認為這是一個好的動作的信心。估計出來信心太低的動作就不去考慮了。
另一個方法是兩層驗證。AI 計算出的最優(yōu)行動首先需要根據(jù)一個內(nèi)置的、由數(shù)據(jù)中心運營人員們制定的安全限制清單做檢查。計算的結(jié)果通過檢查、從云端發(fā)送到實際的數(shù)據(jù)中心之后,當?shù)氐目刂葡到y(tǒng)還會再次把指令根據(jù)自己的一套安全限制清單再檢查一遍。這種冗余設(shè)計的檢查流程確保了系統(tǒng)的運行總是在當?shù)氐南拗浦畠?nèi)的,操作人員們也總是對操作的邊界有完全的控制。
最重要的是,谷歌的數(shù)據(jù)中心總是會受到人類的完全控制的,人類隨時可以選擇退出 AI 控制模式。這時候,控制系統(tǒng)會自動從 AI 控制無縫地切換到基于現(xiàn)代自動化工業(yè)使用的基于現(xiàn)場規(guī)則的以及啟發(fā)式設(shè)計的控制系統(tǒng)。連續(xù)監(jiān)控、自動錯誤重啟、平滑切換、兩層驗證、不間斷通訊、不確定性估計、規(guī)則與啟發(fā)式設(shè)計的備用控制系統(tǒng)、人類指令優(yōu)先
相比于原來的動作推薦系統(tǒng)需要操作人員自己檢查以及實施推薦的動作,新的 AI 控制系統(tǒng)是自己直接實現(xiàn)這些動作的。DeepMind 和谷歌的研究人員在開發(fā)它時也有有意識地把系統(tǒng)的優(yōu)化邊界設(shè)定到了一個更窄更小的策略中,讓它把安全和可靠作為首要目標,也就是說對于節(jié)約能源的目標來說,它需要在過于節(jié)約導致的不穩(wěn)定風險和優(yōu)化不足的低反饋之間找到平衡。
雖然只上線了幾個月時間,這個系統(tǒng)已經(jīng)可以穩(wěn)定地節(jié)約平均 30% 左右的能源,而且他們還期待系統(tǒng)未來可以改善更多。這是因為隨著數(shù)據(jù)更多,系統(tǒng)的優(yōu)化判斷能力也會變得更強,如下圖。隨著技術(shù)越來越成熟,DeepMind 和谷歌的研究人員未來也會把系統(tǒng)的優(yōu)化邊界設(shè)置得寬松一些,來達到更好的能源節(jié)約效果。
這個 AI 直接控制的系統(tǒng)時不時找到一些新的方法管理冷卻系統(tǒng),有一些方法甚至讓數(shù)據(jù)庫操作人員覺得驚訝。與這個系統(tǒng)緊密協(xié)作的一位谷歌數(shù)據(jù)中心運營人員就驚訝道:「這個 AI 會利用冬天外面比較冷的特點,產(chǎn)生比平時更冷的冷卻水,然后減少了給數(shù)據(jù)中心降溫所需的能源消耗。規(guī)則是不會自己變得越來越好的,但是 AI 可以啊?!?/p>
對于已經(jīng)安全運行、獨立運行、降低能耗的 AI 直接控制系統(tǒng),DeepMind 和谷歌都覺得非常激動。不過,在數(shù)據(jù)中心中使用這樣的系統(tǒng)才僅僅是個開始。在長遠的未來,他們認為還有很多的潛力把這樣的技術(shù)運用在其他工業(yè)場景中,也就可以在更大的規(guī)模上幫助對抗氣候變化。