深度神經(jīng)網(wǎng)絡(luò)會和人腦神經(jīng)網(wǎng)絡(luò)一樣產(chǎn)生人的智能么?
深度學(xué)習(xí)在近年的進(jìn)展又一次點(diǎn)燃了各界對人工神經(jīng)網(wǎng)絡(luò)的熱情。這一技術(shù)在圖像識別、語音識別、棋類游戲等領(lǐng)域的成效出人意料,而且更多應(yīng)用領(lǐng)域也正在被開拓出來。“深度學(xué)習(xí)是否有效”已經(jīng)不是問題,現(xiàn)在的問題是在哪些問題上有效,尤其是這條研究路線是否是達(dá)到通用智能的最佳途徑。我在前面幾篇短文中涉及到了這個話題,但均未展開談。關(guān)于人工神經(jīng)網(wǎng)絡(luò)的工作原理和這項(xiàng)研究的歷史沉浮,有關(guān)介紹已有很多,這里不再重復(fù)。主要想討論幾個被普遍忽視或誤解的概念問題。
此網(wǎng)絡(luò)非彼網(wǎng)絡(luò)在實(shí)現(xiàn)“像人一樣的智能”的諸多可能途徑中,人工神經(jīng)網(wǎng)絡(luò)似乎具有天然的合理性和說服力。我們都知道人的智能來自人腦,而人腦是個神經(jīng)網(wǎng)絡(luò),不是嗎?
當(dāng)然沒這么簡單。所謂“人工神經(jīng)網(wǎng)絡(luò)”和人腦中的“神經(jīng)網(wǎng)絡(luò)”只有非常有限的共同點(diǎn),而不同點(diǎn)則要多得多。我們不能僅僅因?yàn)樗鼈兠Q上的相似性就斷定它們會有相同的功能。
深度神經(jīng)網(wǎng)絡(luò):
這類網(wǎng)絡(luò)由若干層組成,每層中的人工神經(jīng)元與相鄰層中的神經(jīng)元相連接。網(wǎng)絡(luò)中的底層接受輸入信號,頂層生成輸出信號,中間層將下層的輸出值做加權(quán)求和后經(jīng)一個“激活函數(shù)”產(chǎn)生成本層輸出值,以供上層之用。這樣,每層將一個“向量”(即一串?dāng)?shù)值)變成另一個向量,而整個網(wǎng)絡(luò)則代表了一個從輸入層到輸出層的“向量函數(shù)”。這里的輸入可以是各種感知信號,中間層代表信號的概括和抽象,而輸出則代表系統(tǒng)的認(rèn)知結(jié)果或應(yīng)對行為。
說這種系統(tǒng)能“學(xué)習(xí)”,是指在構(gòu)建網(wǎng)絡(luò)時,設(shè)計(jì)者只需選定神經(jīng)元模型(如激活函數(shù)的公式)和網(wǎng)絡(luò)結(jié)構(gòu)(如一共幾層,每層多少神經(jīng)元)等,而將各個連接上的權(quán)值作為待定“參數(shù)”。在網(wǎng)絡(luò)的“訓(xùn)練”過程中,一個“學(xué)習(xí)算法”根據(jù)已知數(shù)據(jù)對這些參數(shù)反復(fù)進(jìn)行調(diào)整,直到整個網(wǎng)絡(luò)達(dá)到某種預(yù)定的標(biāo)準(zhǔn)為止。這時我們就說這個網(wǎng)絡(luò)“學(xué)會了”如何識別、區(qū)分或應(yīng)對這種輸入信號。如我在《機(jī)器是如何被騙并騙人的?》中所解釋的,這種網(wǎng)絡(luò)就是個通用函數(shù)擬合器。
這種網(wǎng)絡(luò)結(jié)構(gòu)在三十年前就已經(jīng)以“PDP模型”的名稱廣為流傳了,只是那時的網(wǎng)絡(luò)一般只有一個中間層。“深度學(xué)習(xí)”的貢獻(xiàn)就是增加其“深度”,即中間層的數(shù)量。更多的中間層使得系統(tǒng)的行為更復(fù)雜,這是顯而易見的,但以前無法有效的訓(xùn)練這種系統(tǒng)。深度神經(jīng)網(wǎng)絡(luò)成功的原因公認(rèn)有三個:(1)大量的訓(xùn)練數(shù)據(jù)(否則無法確定那么多參數(shù)),(2)改進(jìn)了的學(xué)習(xí)算法(否則無法有效利用這些數(shù)據(jù)),(3)強(qiáng)有力的硬件支持(否則無法足夠快地完成計(jì)算)。
這種人工神經(jīng)網(wǎng)絡(luò)的確是從人腦得到了靈感,但并不是以嚴(yán)格模擬后者為目標(biāo)的。首先,人工神經(jīng)元忽略了人腦神經(jīng)元的很多重要特征,比如說激活的時間模式等。其次,人腦中的神經(jīng)元有很多種,互相的連接方式也遠(yuǎn)比上述模型中的要復(fù)雜。最后,人腦的學(xué)習(xí)過程不是通過反復(fù)調(diào)整權(quán)值而“收斂”于一個特定的輸入輸出關(guān)系的,所以不能被簡化為函數(shù)擬合。
當(dāng)然,前面提到的人工神經(jīng)網(wǎng)絡(luò)只是現(xiàn)有諸多模型之一,其它模型在某些方面可能更像人腦一些。盡管如此,目前的各種人工神經(jīng)網(wǎng)絡(luò)和人腦中的神經(jīng)網(wǎng)絡(luò)仍有巨大差別。僅僅因?yàn)橐粋€計(jì)算機(jī)中用了這樣一個網(wǎng)絡(luò),就期待它能像人腦一樣工作,這未免太天真了。實(shí)際上這種網(wǎng)絡(luò)的設(shè)計(jì)者主要關(guān)心的是其實(shí)用性,并非是否像人腦。
智能難以一“網(wǎng)”打盡試圖嚴(yán)格模擬人的神經(jīng)網(wǎng)絡(luò)的另有人在,只不過他們的目的主要不是為了實(shí)現(xiàn)人工智能,而只是想了解人腦的工作過程。有些研究者已經(jīng)把“全腦仿真”(whole pain emulaTIon)作為目標(biāo)了。這項(xiàng)工作當(dāng)然是很有意義的,因?yàn)?ldquo;模擬”是我們認(rèn)識一個對象或過程的有效手段。一般說來,只要我們能精確地描述一個過程,我們就可能編寫計(jì)算機(jī)程序來模擬它。但即使我們真能精確地模擬人腦中神經(jīng)網(wǎng)絡(luò)的工作過程,這也離完整地實(shí)現(xiàn)人類智能有相當(dāng)遠(yuǎn)的距離。
首先,人腦不僅僅是個對電信號進(jìn)行處理的神經(jīng)網(wǎng)絡(luò)。比如說神經(jīng)遞質(zhì)在神經(jīng)元之間擔(dān)當(dāng)了“信使”的作用,而其中的活動是化學(xué)過程。甚至人腦中的生物過程和物理過程都可能對思維產(chǎn)生影響,比如腦供血不足和劇烈運(yùn)動后的眩暈現(xiàn)象。
即使在理論上說人腦中的上述過程也都能模擬,這事也還沒有完。近年來認(rèn)知科學(xué)越來越強(qiáng)調(diào)軀體在思維中的作用(所謂“embodied cogniTIon”,即“具身認(rèn)知”),就是說大腦之外的軀體部分(如外周神經(jīng)系統(tǒng)、感覺器官、運(yùn)動器官等等)也在思維活動中扮演著不可或缺的角色。比如說,很多抽象概念的意義都是基于軀體活動的(如“接受”批評、“推動”發(fā)展、“提高”覺悟等),那么要完整理解這些概念,一個系統(tǒng)大概也需要真能“接”、“推”、“提”才行。
“模擬派”的追隨者可能會說人體也是可以用軟硬件模擬的。這“在原則上”自然是正確的,但如果神經(jīng)網(wǎng)絡(luò)之外的部分對實(shí)現(xiàn)智能是必須的,那么單靠人工神經(jīng)網(wǎng)絡(luò)來完整再現(xiàn)智能大概就是不可能的了。為實(shí)現(xiàn)“像人一樣的智能”,我們需要的不再是“人工神經(jīng)網(wǎng)絡(luò)”,而是包括這樣一個網(wǎng)絡(luò)的“人造人”。
就算一個“人造人”被制成了,它大概也不會是所有人心目中的“人工智能”。對那些以“圖靈測試”為智能標(biāo)準(zhǔn)的人而言,“智能”意味著在外部行為上和人不可區(qū)分。大部分人都同意完全靠預(yù)先設(shè)計(jì)所有可能的答案來通過這個測試是不大現(xiàn)實(shí)的,而通過“學(xué)習(xí)”才有希望。但這就意味著只有類人的軀體還不夠,系統(tǒng)還需要類人的經(jīng)驗(yàn)。這就不再僅僅是個技術(shù)問題了。因?yàn)槲覀兊慕?jīng)驗(yàn)中的很大一部分是社會經(jīng)驗(yàn),只有當(dāng)人造人完全被當(dāng)作人來對待時,它才能得到人類經(jīng)驗(yàn),進(jìn)而獲得人類行為。而這將會在倫理、法律、政治、社會等領(lǐng)域造成大量問題。
“忠實(shí)復(fù)制”不是好主意上面討論的是用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)像人一樣的通用智能的可能性,其結(jié)論是:遠(yuǎn)沒有看上去那么有希望,盡管不是完全不可能。但這條路線比可能性更大的問題是其合理性和必要性。
人工智能的基本理論預(yù)設(shè)是把人類智能看作“智能”的一種形式,而試圖在計(jì)算機(jī)中實(shí)現(xiàn)其另一種形式。根據(jù)這個看法,“人工智能”和“人類智能”不是在細(xì)節(jié)上完全一樣,而是在某個抽象描述中體現(xiàn)著同一個“智能”。如果智能所需的某個機(jī)制在計(jì)算機(jī)里有更好的實(shí)現(xiàn)方式,那我們沒必要用人腦的辦法。這方面的一個例子就是四則運(yùn)算。
當(dāng)我們?yōu)橐粋€對象或過程建立模型時,我們總是希望這個模型越簡單越好。只有當(dāng)我們可以在忽略了大量細(xì)節(jié)的情況下仍然可以準(zhǔn)確地刻畫一個過程,我們才算是真正理解了它。因此,如果最后發(fā)現(xiàn)我們只有在嚴(yán)格復(fù)制人腦、人體及人類經(jīng)驗(yàn)的情況下才能再現(xiàn)智能,那么人工智能應(yīng)當(dāng)算是失敗了,而非成功了,因?yàn)檫@說明智能只有一種存在方式,而“智能”和“人類智能”其實(shí)是一回事。
出于這種考慮,很多人工智能研究者有意識地和人腦的細(xì)節(jié)保持距離。在從人腦的工作方式中得到靈感的同時,他們會考慮在計(jì)算機(jī)里是否有更簡單的辦法來實(shí)現(xiàn)同樣的功能。計(jì)算機(jī)畢竟不是個生物體,所以沒必要模仿人腦的那些純生物特征。同理,對深度神經(jīng)網(wǎng)絡(luò)的研究者來說,他們的網(wǎng)絡(luò)在某些方面不像人腦,這不是個問題,只要這種差別不帶來功能缺失就行。
這個問題是所有走“仿生”路線的技術(shù)都要面對的,包括近來大熱的“類腦智能”、“類腦計(jì)算”等。在有關(guān)討論中,一些人只是強(qiáng)調(diào)“像人腦那樣”的可能的好處,但完全不提這種模仿的限度。只有當(dāng)我們能清楚地說明哪些東西不用模仿時,我們才算真正說清了哪些東西需要模仿。只是說“人腦是這樣的”尚不能成為“計(jì)算機(jī)也必須這樣”的充分理由。
這里一個常被提到的例子就是飛機(jī)和鳥的關(guān)系。飛機(jī)的初始設(shè)計(jì)的確借鑒了鳥類,但顯然不是越像鳥越好。這里自然有可能性的考慮,但更重要的是要飛機(jī)完全像鳥既不合理也無必要。我們當(dāng)前的課題也同樣。嚴(yán)格說來,“人工神經(jīng)網(wǎng)絡(luò)”、“人工大腦”、“人造人”和“人工智能”各是不同的研究目標(biāo),各有各的價值和意義。盡管它們之間有聯(lián)系,仍然不能混為一談,因?yàn)樵O(shè)計(jì)目標(biāo)和最佳實(shí)現(xiàn)方法均不同。
如何“取長補(bǔ)短”在人工智能歷史上,以神經(jīng)網(wǎng)絡(luò)為代表的“聯(lián)結(jié)主義”和以推理系統(tǒng)為代表的“符號主義”已經(jīng)競爭了多年,彼此地位的消長也經(jīng)歷了幾次反轉(zhuǎn)了,這有點(diǎn)像光的“粒子說”與“波動說”的斗爭史。時至今日,大部分人都會承認(rèn)這兩個傳統(tǒng)各有長處和短處。在這種情形下,把二者結(jié)合起來就是個自然的想法了。
問題是怎么“結(jié)合”。一個常見的辦法是把兩個基于不同傳統(tǒng)的子系統(tǒng)整合在一起,讓它們各自完成自己擅長的工作,并彼此協(xié)作來完成整個任務(wù)。盡管具體做法不同,在這個方向上的探索成果已經(jīng)不少了。
方案是把這兩個傳統(tǒng)以一種更密切的方式統(tǒng)一起來。認(rèn)為聯(lián)結(jié)主義的哲學(xué)假定更正確,但技術(shù)手段太單一;與其相反,符號主義的技術(shù)手段更豐富,但哲學(xué)假定陳舊呆板。其結(jié)果就是我的“納思”在理論預(yù)設(shè)和宏觀戰(zhàn)略上更接近于聯(lián)結(jié)主義傳統(tǒng),如假定知識和資源不足,容忍多種不確定性,通過學(xué)習(xí)獲得領(lǐng)域知識和技能等;而納思在描述框架和微觀戰(zhàn)術(shù)上更接近于符號主義傳統(tǒng),如用語言表達(dá)知識,靠概念組織經(jīng)驗(yàn),依邏輯進(jìn)行推理等。納思不是把這兩個傳統(tǒng)“嫁接”在一起,而是把它們“雜交”成了一個全新的“神經(jīng)(網(wǎng)絡(luò)式的)邏輯”。
納思也可以被看成一個網(wǎng)絡(luò),但它和人腦的相似性不是在神經(jīng)元層面上,而是在概念層面上。這個網(wǎng)絡(luò)的運(yùn)行方式和現(xiàn)有的人工神經(jīng)網(wǎng)絡(luò)根本不同,盡管其中的概念關(guān)系也支持多層抽象。那樣的話,納思到底是個邏輯還是個網(wǎng)絡(luò)呢?都是。對象只有一個,但對它的描述可以使用不同的術(shù)語,以捕捉其不同的側(cè)面。這和光的波-粒二相性不乏類似之處。
總而言之,我不認(rèn)為深度神經(jīng)網(wǎng)絡(luò)會產(chǎn)生通用智能,或是通向這一目標(biāo)的有效途徑,盡管這種技術(shù)有巨大實(shí)用價值,并可以為通用智能的研究貢獻(xiàn)想法。