人工智能有著怎樣的思考
掃描二維碼
隨時隨地手機(jī)看文章
中央電視一臺“機(jī)智過人”節(jié)目播出關(guān)于杭州靈隱寺每天入園游客人數(shù)預(yù)測的人工智能與人工智慧的競賽。競賽的一方為“智慧大腦”的人工智能計算,另一方為靈隱寺管理人員的經(jīng)驗判斷。結(jié)果是:1)按時間段(上午10點和下午 3點),人工智能的計算誤差太大,超過30%,而經(jīng)驗判斷的誤差為 3%左右,因此被部分評委認(rèn)為是“技不如人”;2)按一天(至下午6點閉園),人工智能的計算誤差小于5%,勝出(被評為“機(jī)智過人” )。
據(jù)介紹,該人工智能的計算算法是經(jīng)過交叉檢驗,其方法是在三年的入園游客的統(tǒng)計中,隨機(jī)去掉一天,并以計算數(shù)據(jù)插入,對比誤差應(yīng)小于 5%。而對于在競賽中時間段上所出現(xiàn)的計算大誤差現(xiàn)象則被解釋為,是由于即時獲取入園游客的數(shù)據(jù)與計算算法在時間上存在偏差,屬于人為錯誤。
然而,事實上,在對“人工智能”的研究和應(yīng)用中,類似于“‘機(jī)’智過人”之命題正是目前普遍存在的一個挑戰(zhàn)(或態(tài)勢與感知)。觀察及思考如下:
1)數(shù)據(jù)及其相關(guān)的關(guān)聯(lián)性
以靈隱寺的“機(jī)智過人”算法為例,其基礎(chǔ)數(shù)據(jù)來源于三年的每天入園游客數(shù)量統(tǒng)計,應(yīng)是極為精準(zhǔn)。但是,數(shù)據(jù)的主要來源單一(門票銷售量),而每天入園游客數(shù)量必然受到當(dāng)時客觀條件和環(huán)境的影響,例如,天氣、突發(fā)事件或活動、周一到周日的出行習(xí)慣等等。因此,門票銷售數(shù)量僅僅是個基準(zhǔn)線(且可以近似為線性連續(xù)),而在三年間每天出現(xiàn)的客觀因素則是動態(tài)的、離散的,且缺少參考數(shù)據(jù)以及可量化的分析,亦即數(shù)據(jù)分析一旦缺失對多維數(shù)據(jù)的關(guān)聯(lián),該算法是“脆弱”的,以至于難以避免計算結(jié)果出現(xiàn)(必然的)較大隨機(jī)誤差。
2)數(shù)據(jù)的預(yù)處理與檢驗
一般而言,“人工智能”由三個部分組成:1)輸入,2)計算,3)輸出。其中,“計算”包括建模和算法;輸入的是量化數(shù)據(jù);輸出的是計算結(jié)果。
通常,任何算法都需要通過對輸入數(shù)據(jù)的循環(huán)學(xué)習(xí),不斷地深度優(yōu)化,力求所輸出結(jié)果的精準(zhǔn)或達(dá)到預(yù)期的參考效果。
因此,對輸入數(shù)據(jù)的預(yù)處理對算法存在直接影響;而對計算算法的檢驗、判定計算算法輸出的置信度,也與輸入數(shù)據(jù)直接相關(guān),不可或缺。
顯然,對輸入數(shù)據(jù)的預(yù)處理至關(guān)重要,其要素包括(但不限于):
(1)數(shù)據(jù)來源的場景(環(huán)境)以及數(shù)據(jù)采集的方式(模式);
(2)數(shù)據(jù)的分類、標(biāo)識以及定性和量化的表征;
(3)數(shù)據(jù)的常規(guī)、常態(tài)、涌現(xiàn)、隨機(jī)的特點特性特征的差分;
(4)數(shù)據(jù)的時序,以及相應(yīng)的回歸、歸納、溯源、甄別;
(5)數(shù)據(jù)的多元多源的相關(guān)性和關(guān)聯(lián)性。
因而,計算模型和算法應(yīng)提供其輸入數(shù)據(jù)特征及屬性調(diào)整和變化的接口,既保證算法復(fù)雜性的可收斂(如輸入數(shù)據(jù)的降維),又必須具備魯棒性和彈性。
3)數(shù)據(jù)預(yù)處理的問題及挑戰(zhàn)
在大數(shù)據(jù)的環(huán)境中,必然存在著“已知”、“已知的未知”、“未知的未知”。例如,對靈隱寺的“機(jī)智過人”算法,已知三年中每天入園游客數(shù);已知的未知是三年中每天曾發(fā)生過什么客觀事件(外部的環(huán)境因素);未知的未知是這些客觀事件對入園游客數(shù)的影響程度、概率及其關(guān)聯(lián)性。
因而,挑戰(zhàn)是:如何發(fā)現(xiàn)“已知的未知”;困難是:如何應(yīng)對“未知的未知”;尤其是,當(dāng)預(yù)測預(yù)判未來,如何假設(shè)“已知的未知”和“未知的未知”。
對此,深度的研究必須依賴于理論基礎(chǔ),當(dāng)且僅當(dāng)理論與具體實踐相結(jié)合,“人工智能”(或“智慧大腦”)才能得以持續(xù)發(fā)展,緩解“慣性”使然。
“人工智能”是數(shù)字現(xiàn)代化的發(fā)展必然和應(yīng)用趨勢,而且是一個通用的術(shù)語。但是,必須注意到,“人工智能”在不同的應(yīng)用場景具有不同的內(nèi)涵和目標(biāo)目的、方式方法、模式形式,以及不同的問題和挑戰(zhàn)。例如:
谷歌的阿爾法圍棋(AlphaGo)是第一個擊敗人類職業(yè)圍棋選手、第一個戰(zhàn)勝圍棋世界冠軍的人工智能機(jī)器人,其主要工作原理是“深度學(xué)習(xí)”(從16萬場人類對弈的圍棋比賽中學(xué)習(xí)數(shù)百萬棋譜),且至少存在三個顯著的特點:
(1)邊界明確,即對弈的規(guī)則。雖然只有兩個非常簡單的規(guī)則,而其復(fù)雜性卻是難以想象的,一共有 10170(10 的 170 次方)種可能性,沒有辦法窮舉出圍棋所有的可能結(jié)果。(觀點:規(guī)則作為邊界,規(guī)則越簡單,狀態(tài)復(fù)雜性越高。)
(2)沒有噪音。對弈的范圍清晰,棋盤上有縱橫各 19 條直線將棋盤分成 361 個交叉點;黑白二色圓形棋子,勝者沒有直接明確的目標(biāo),完全是憑直覺。(觀點:確定的和不確定的環(huán)境因素,都將直接影響目標(biāo)定位的復(fù)雜性。)
(3)贏在全局。幾乎沒有一個合適的評價函數(shù)來定義誰是贏家,圍棋作為建設(shè)性的游戲,開始的時候,棋盤是空的,慢慢的下棋雙方把棋盤填滿,每一個棋子都對棋局有著“牽一發(fā)而動全身”的影響,而且必須評估未來可能會發(fā)生什么才能評估當(dāng)前局勢。(觀點:事前是通過數(shù)值網(wǎng)絡(luò)的預(yù)測;事后是通過決策網(wǎng)絡(luò)的歸納;事中是預(yù)測和歸納的綜合)。
由此可見,對于“人工智能”:人工智慧是充分條件(即算法是由人設(shè)計和操控,且理論是基礎(chǔ)),應(yīng)用場景是必要條件(即數(shù)據(jù)的采集、分類及其關(guān)聯(lián))。