人工智能助力抗疫的背后秘密是什么
隨著人工智能技術(shù)的發(fā)展,在一些場景的應(yīng)用也越來越成熟,人工智能正在逐步滲透進人們生活的各個角落,甚至在這次的抗擊新冠疫情中也扮演了重要角色。
新技術(shù)的應(yīng)用
對比2003年的非典,此次新冠疫情在癥狀上潛伏期更長,傳染性更強,而且還碰上了流感爆發(fā)以及春運流動的節(jié)點,因此病情人數(shù)不斷上升,在防治上面臨了更大的困難。
正因如此,在大規(guī)模傳染之后,現(xiàn)有的醫(yī)療資源難以滿足不斷增長的病患用戶。為了實現(xiàn)更好的管控防治效果,提高效率,不少企業(yè)紛紛應(yīng)用諸多技術(shù)手段來抗擊疫情。比如有些地方推出了智能機器人,通過語音識別、自然語義理解等技術(shù),針對疫情問題、就醫(yī)注意、防護措施進行回答。對于正常用戶、輕癥用戶來說,人工智能可以起到一定的答疑作用,避免醫(yī)療資源緊缺以及交叉感染的風險。
其實,人工智能還被應(yīng)用于疫苗研發(fā),比如使用深度學(xué)習技術(shù),可以協(xié)助科研人員進行數(shù)據(jù)分析、快速篩選文獻以及相應(yīng)的測試工作。此外,人工智能還可以應(yīng)用于建立模型以觀察疫情傳播。早前,國內(nèi)基于AI和大數(shù)據(jù)的流感實時預(yù)測模型便登上了《柳葉刀》的子刊,為傳染病預(yù)測提供了更加精準的邏輯框架。
神奇的算法
人工智能技術(shù)為何能發(fā)揮出如此大的作用,魔力的來源究竟是什么?
人工智能在這些年的快速發(fā)展主要得益于算力提升、數(shù)據(jù)積累和算法創(chuàng)新。其中,算法是人工智能的靈魂,是魔力的主要來源,今天我們就一起來看一看這些算法的本來模樣。
算法(Algorithm)這個概念比較抽象,是指一個準確而完整的關(guān)于解題方案的描述,用系統(tǒng)的方法描述解決問題的策略。簡單地說,算法就是解決問題的處理步驟,一個生活中的例子就是我們烹飪的時候往往需要食譜的幫助,食譜描述了美味料理的制作方法,對制作料理這個問題給出了方案,并將操作步驟規(guī)范地描述出來。
算法一詞來源已久,截止目前,網(wǎng)上不完全統(tǒng)計有2000多個算法,如果考慮到每個算法的各類變種,數(shù)量極其巨大。但是這些算法按照模型訓(xùn)練方法的差異,總體上可以分為四個類別:有監(jiān)督學(xué)習(Supervised Learning)、無監(jiān)督學(xué)習(UnsupervisedLearning)、半監(jiān)督學(xué)習(Semi-supervised Learning)和強化學(xué)習(Reinforcement Learning)。這些算法是如何讓機器具備了“智能”,它們作用的原理是什么?今天,我們嘗試用幾個樣例來揭開背后的秘密。
1、有監(jiān)督學(xué)習
有監(jiān)督學(xué)習被稱為“有老師的學(xué)習”,所謂的老師就是標簽。通過標注好的樣本(即訓(xùn)練樣本以及其對應(yīng)的目標)訓(xùn)練得到一個最優(yōu)模型,再利用這個模型對輸入的數(shù)據(jù)進行判斷給出結(jié)果,從而具備對未知數(shù)據(jù)進行預(yù)測的能力。
在建立預(yù)測模型的時候,監(jiān)督式學(xué)習建立一個學(xué)習過程,將預(yù)測結(jié)果與“訓(xùn)練數(shù)據(jù)”的實際結(jié)果進行比較,不斷的調(diào)整預(yù)測模型,直到模型的預(yù)測結(jié)果達到一個預(yù)期的準確率。這也比較符合我們的認知習慣,比如我們通過圖片或?qū)嵨飳W(xué)習什么是貓、什么是狗等。
經(jīng)典的有監(jiān)督學(xué)習算法有:反向傳播神經(jīng)網(wǎng)絡(luò)、波爾茲曼機、卷積神經(jīng)網(wǎng)絡(luò)、多層感知器、循環(huán)神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、高斯貝葉斯、多項樸素貝葉斯、分類和回歸樹、ID3算法、C4.5算法、C5.0算法、隨機森林、線性回歸、邏輯回歸、支持向量機等。
這些專業(yè)名稱不重要,我們以大名鼎鼎的AlphaGo為例來了解一下有監(jiān)督學(xué)習的原理。從2016年到2017年,這個圍棋機器人在多種場合以絕對優(yōu)勢戰(zhàn)勝了數(shù)十位頂尖的人類棋手。圍棋界公認AlphaGo圍棋的棋力已經(jīng)超過人類職業(yè)圍棋頂尖水平,在GoRatings網(wǎng)站公布的世界職業(yè)圍棋排名中,其等級分曾超過排名人類第一的棋手。
AlphaGo為了解決圍棋的復(fù)雜問題,結(jié)合了有監(jiān)督學(xué)習和強化學(xué)習的優(yōu)勢,通過標注數(shù)據(jù)訓(xùn)練形成一個策略網(wǎng)絡(luò),將棋盤上的當前棋子的布局狀態(tài)作為輸入信息,對所有可能的下一步落子位置生成一個概率分布。以 -1(對手勝利)到1(AlphaGo勝利)為標準,預(yù)測所有落子位置的得分。也就是說,針對每個棋盤狀態(tài)定義了一個學(xué)習目標,如此大量的循環(huán)往復(fù),模型學(xué)會了應(yīng)對不同的棋盤布局能夠預(yù)測最佳落子位置,最終取得令人矚目的成果。
2、無監(jiān)督學(xué)習
無監(jiān)督學(xué)習被稱為“沒有老師的學(xué)習”,相比有監(jiān)督學(xué)習的不同之處在于,不使用事先標注的訓(xùn)練樣本,沒有訓(xùn)練的過程,而是直接拿無標注的數(shù)據(jù)進行建模分析,通過機器學(xué)習自行學(xué)習探索,從數(shù)據(jù)集中發(fā)現(xiàn)和總結(jié)模式或者結(jié)構(gòu)。
典型的無監(jiān)督學(xué)習算法包括:生成對抗網(wǎng)絡(luò)(GAN)、前饋神經(jīng)網(wǎng)絡(luò)、邏輯學(xué)習機、自組織映射、Apriori算法、Eclat算法、DBSCAN算法、期望最大化、模糊聚類、k-means算法等。
這里以k-means算法為例來看看無監(jiān)督學(xué)習背后的運行機制,這是一種用來計算數(shù)據(jù)聚類的算法。
例如,對上圖中的A、B、C、D、E五個點聚類,主要方法是不斷地設(shè)定并調(diào)整種子點的位置,計算離種子點最近的均值,最終根據(jù)距離聚成群。灰色的是開始時設(shè)定的種子點,首先,計算五個點與種子點之間直接的距離,然后,將種子點逐步移動到點群的中心。最終,A、B、C和D、E分別根據(jù)離種子點的距離聚類為點群。
這個方法看上去很簡單,但是應(yīng)用的范圍非常廣泛,包括給網(wǎng)頁文本進行主題分類;分析一個公司的客戶分類,對不同的客戶使用不同的商業(yè)策略;電子商務(wù)中分析商品相似度,歸類商品,從而得出不同的銷售策略等。
曾有人做過一個有趣的分析,給亞洲15支足球隊的2005年到2010年的戰(zhàn)績做了一個表,然后用k-Means把球隊歸類,得出了下面的結(jié)果,來,感覺一下是否靠譜?
亞洲一流:日本、韓國、伊朗、沙特;
亞洲二流:烏茲別克斯坦、巴林、朝鮮;
亞洲三流:中國、伊拉克、卡塔爾、阿聯(lián)酋、泰國、越南、阿曼、印尼。
3、半監(jiān)督學(xué)習
半監(jiān)督學(xué)習,處在有監(jiān)督學(xué)習和無監(jiān)督學(xué)習的中間帶,其輸入數(shù)據(jù)的一部分是有標簽的,另一部分沒有標簽,而沒標簽數(shù)據(jù)的數(shù)量往往遠大于有標簽數(shù)據(jù)數(shù)量(這也是符合現(xiàn)實情況的)。常見的半監(jiān)督學(xué)習類算法包含:生成模型、低密度分離、基于圖形的方法、聯(lián)合訓(xùn)練等。
4、強化學(xué)習
強化學(xué)習,主要是讓機器從一個狀態(tài)轉(zhuǎn)變到另一個狀態(tài),當完成任務(wù)時獲得高分獎勵,但是沒有完成任務(wù)時,得到的是低分懲罰,這也是強化學(xué)習的核心思想。常見的強化學(xué)習類算法包含:Q學(xué)習、狀態(tài)-行動-獎勵-狀態(tài)-行動(SARSA)、DQN、策略梯度算法、基于模型強化學(xué)習、時序差分學(xué)習等。
強化學(xué)習是近些年大家研究的一個重點,我們以Q學(xué)習為例說明(此處,引用了McCullock一個非常好的樣例)。假設(shè)一個房子有五個房間,房間之間通過門連接,從0到4編號,屋外視為一個單獨的房間,編號為5,如下方左圖。
我們把左面的圖轉(zhuǎn)換一下,房間作為節(jié)點,如果兩個房間有門相連,則中間用一條邊表示,得到上方右圖。
假設(shè)我們的目標是從屋內(nèi)任意一個房間走到屋外,即編號5,2號房間是起點,每條邊設(shè)定獎勵值,指向5的為100,其他為0,可以發(fā)現(xiàn),通過得分獎勵,從2到3,再到1或4,最終路線會收斂到5。
相對于以往的算法,強化學(xué)習更符合人類學(xué)習的習慣,在近年來被寄予了很高的期望,特別是隨著DeepMind 和 AlphaGo 的成功,強化學(xué)習日益受到關(guān)注。
榮光和局限
人工智能技術(shù)在這次疫情防控中的應(yīng)用,離不開大量的算法工作。比如谷歌用AI技術(shù)幫助科學(xué)家研究病毒特征,亞馬遜探索用疫苗等方式來治愈普通感冒等。
當然,人們也不需要把人工智能奉為神明,如果仔細研究一下上文列舉的例子就會發(fā)現(xiàn),人工智能擅長處理的是在有限、透明規(guī)則、特定任務(wù)下的問題,因而在以計算為主要特征的領(lǐng)域取得了不錯的效果,但是對于其他問題,比如自然語言理解、圖像理解等仍然面臨較多的挑戰(zhàn)。