人工智能你認(rèn)為復(fù)雜嗎?
是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué),所涉及的領(lǐng)域也非常廣泛。因此,一說到人工智能,可能會有很多人認(rèn)為它是一項(xiàng)比較復(fù)雜的技術(shù),但事實(shí)上它要比我們想象的簡單。
我們需要多少信息來構(gòu)建一個人,更具體地說是一個人的大腦?
畢竟,我們是迄今為止地球上最復(fù)雜的物種。為了解決這個問題,我們的一些大腦認(rèn)為我們的大腦是宇宙中最復(fù)雜的結(jié)構(gòu)!
然而,番茄比人類具有更多的基因,準(zhǔn)確地說是7000多。
查看我們的基因,我們很難弄清我們所有復(fù)雜性的編碼位置。
大約只有20000個基因開始,其中大約有一半與其他事物有關(guān),例如建立手腳和重要器官。
從數(shù)學(xué)上講,我們的基因組在無損存儲后僅攜帶了2500萬字節(jié)的大腦設(shè)計信息壓縮。
成年人在新皮層中所具有的10的15次方個連接,新皮層是大腦的最新部分,僅存在于靈長類動物中,并且在智人中異常大。如果我們對基因的理解不完全錯位,那么假設(shè)我們的大部分知識和能力直接在基因中編碼是不合理的。
唯一的選擇是,需要一種更簡單、更有效的方法來定義我們的大腦和新皮質(zhì)的藍(lán)圖。
并以此構(gòu)建原型智能系統(tǒng)。
統(tǒng)一的腦功能理論
杰夫?霍金斯(Jeff Hawkins)在他的《關(guān)于智力的書》中抱怨說,大腦的普遍圖片由高度專業(yè)化的區(qū)域組成。
他將這種情況與19世紀(jì)的生物學(xué)家越來越詳細(xì)地研究了各種各樣的物種而沒有留意生命背后的統(tǒng)一原理進(jìn)行了比較。直到道金斯(Dawkins)提出了他的進(jìn)化論之前,還沒有人知道如何用一種籠統(tǒng)的敘述來描述自然世界的多重表象。
同樣,大腦看起來可能由許多不同的高度專業(yè)化的大腦區(qū)域組成,但是它們明顯的專業(yè)化不應(yīng)使我們得出結(jié)論,即它們可能并非全部基于相同的解剖學(xué)和算法原理而工作。
實(shí)際上,我們觀察到新皮層的解剖結(jié)構(gòu)具有令人驚訝的同質(zhì)性。神經(jīng)可塑性表明,大多數(shù)大腦區(qū)域可以輕松承擔(dān)以前由其他大腦區(qū)域執(zhí)行的任務(wù),從而在其設(shè)計原理后面顯示出一定的通用性。
諾曼?道奇(Norman Doidge)在暢銷書《改變自身的大腦》中講述了令人印象深刻的故事,講述了患者將整個感覺系統(tǒng)重新映射到大腦的新部分的過程,例如人們通過用相機(jī)記錄的視覺刺激,直接將視覺刺激映射到嘴里來學(xué)會用舌頭觀察。
對中風(fēng)患者的研究同樣表明,中風(fēng)喪失的能力通常是由新的大腦區(qū)域重新獲得的,而聾啞人可以重新繪制其Broca區(qū)域(負(fù)責(zé)語言處理)以控制其手部動作,并通過手語進(jìn)行交流,而不是他們的嘴巴運(yùn)動,以便與他們說話。
大腦發(fā)揮不可思議的能力和靈活性來學(xué)習(xí)新事物。大多數(shù)人可以學(xué)習(xí)與他們一起成長的任何一種語言,或者選擇在以后的生活中學(xué)習(xí)一種新的語言,也可以學(xué)習(xí)他們選擇的任何一種工具(公認(rèn)地獲得了不同的成功),依此類推。
可塑性和靈活學(xué)習(xí)的事實(shí)可以解釋為,根據(jù)我們基因中信息的稀疏性,指向了新皮層的生物學(xué)設(shè)置及其所使用的學(xué)習(xí)算法所基于的通用結(jié)構(gòu)。
思想的結(jié)構(gòu)
很難將概念本身概念化,但是存在某些結(jié)構(gòu)和模式,并且這些結(jié)構(gòu)和模式深深地貫穿了我們認(rèn)知的各個方面。
正如雷?庫茲韋爾(Ray Kurzweil)在他的《如何創(chuàng)造思維》一書中所解釋的那樣:
我們以一種分層的方式來感知世界,這種方式由復(fù)雜度不斷提高的簡單模式組成。他認(rèn)為,模式識別是所有思想的基礎(chǔ),從最原始的模式到高度抽象和復(fù)雜的概念。
以語言和寫作為例。細(xì)線構(gòu)成了我們可以識別為字母的模式。各種字母組成單詞,然后是句子。句子形成段落,整篇文章。最后,從以高度特定的方式排列的少量最小模式中,出現(xiàn)了敘事和意義。
模式識別生物學(xué)
現(xiàn)代神經(jīng)影像學(xué)數(shù)據(jù)表明,新皮層由稱為皮質(zhì)柱的結(jié)構(gòu)的均勻組合組成。每個人都由大約100個神經(jīng)元組成。
Kurzweil提出,這些列構(gòu)成了他所謂的最小模式識別器。通過將模式識別器的各層彼此連接起來,可以創(chuàng)建概念層次結(jié)構(gòu),每個模式識別器都專門根據(jù)許多可能的感官模式(如眼睛,耳朵,鼻子)的輸入來識別單個模式。
在基本特征提?。ɡ鐧z測視覺刺激中的邊緣或識別音調(diào))的基礎(chǔ)上,這些模式會疊加起來以形成越來越復(fù)雜的模式。
分層檢測視覺數(shù)據(jù)中復(fù)雜程度不斷提高的模式,從而導(dǎo)致諸如"大象"或"企鵝"之類的抽象標(biāo)簽。
模式識別器不限于處理視覺或聽覺刺激。它可以將各種信號作為輸入處理,并根據(jù)輸入中包含的結(jié)構(gòu)生成輸出。學(xué)習(xí)意味著連接模式識別器并學(xué)習(xí)其權(quán)重結(jié)構(gòu),基本上是他們對彼此輸入的反應(yīng)有多強(qiáng),以及它們彼此之間有多少相互聯(lián)系,類似于學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)時所做的。
但是,大腦在善于解決許多不同任務(wù)的同時又如何如此均質(zhì)呢?答案可能在于神經(jīng)科學(xué)和計算機(jī)科學(xué)的交集。
信息的作用
視覺,聽覺和感覺信息有什么共同點(diǎn)?顯而易見的答案是,這些都是某種信息。
坦率地說,信息的定義有些棘手,并且在信息時代被扔得太多了,但在大腦進(jìn)行信息處理的背景下,它具有技術(shù)意義。要了解這種體系結(jié)構(gòu)如何對我們?nèi)绱擞行?,就要邁出第一步,那就是要意識到可以將大腦視為一種信息處理設(shè)備。
神經(jīng)元(神經(jīng)計算的基礎(chǔ)貨幣)的輸入有很多統(tǒng)一性。大腦正在處理的任何信號,總是由神經(jīng)元的時空激發(fā)模式組成。我們在外部世界中觀察到的每種模式都在我們的感覺器官中編碼為神經(jīng)激發(fā)模式,然后根據(jù)庫茲韋爾的說法,模式識別器的層次結(jié)構(gòu)會向上和向下流動,直到成功提取含義為止。
神經(jīng)科學(xué)證據(jù)得到計算機(jī)科學(xué)思想的支持。佩德羅?多明戈斯(Pedro Domingos)在他的《大師算法》一書中提出,我們可能會找到一種通用算法,只要有正確的數(shù)據(jù),該算法就可以使我們學(xué)習(xí)到幾乎所有我們能想到的東西。
這種通用學(xué)習(xí)算法甚至可以由已經(jīng)存在的學(xué)習(xí)算法(例如貝葉斯網(wǎng)絡(luò)、連接論或符號論方法、進(jìn)化算法,支持向量機(jī)等)的混合組成。
盡管我們還不確定如何從算法的角度學(xué)習(xí)大腦,但是大腦也可能使用類似于該通用算法的東西。作為最基本的例子,當(dāng)然有希伯來語學(xué)習(xí),它已在某種程度上發(fā)生在大腦中。對于更復(fù)雜的算法,研究人員一直在嘗試尋找生物學(xué)上可行的機(jī)制來在大腦中實(shí)現(xiàn)反向傳播,以及其他許多方面。
但是很明顯,大腦非常擅長學(xué)習(xí),并且需要以一種原則上可以理解并且很可能在計算機(jī)上建模的方式來做到這一點(diǎn)。
神經(jīng)網(wǎng)絡(luò)中的信息丟失
識別模式的訣竅是對其進(jìn)行解碼,以解析隱藏在信號內(nèi)部的相關(guān)信息。了解大腦的行為方式可能是了解智力如何運(yùn)作的關(guān)鍵步驟之一。
On Intelligence的作者Jeff Hawkins抱怨我們在研究信息在大腦中的作用時工具的匱乏,但是在理解計算體系結(jié)構(gòu)中的信息流方面取得了越來越多的進(jìn)步。
今年夏天,以色列神經(jīng)科學(xué)家納夫塔利?提什比(Naftali Tishby)關(guān)于信息瓶頸方法的兩次演講。他以閃閃發(fā)光的眼睛和熱情吸引著整個人群,他解釋了當(dāng)深度神經(jīng)網(wǎng)絡(luò)從輸入數(shù)據(jù)中提取相關(guān)特征時如何過濾信息。
該理論闡明了信息在深度神經(jīng)網(wǎng)絡(luò)中的流動方式,并提供了一個很好的理由,說明深度網(wǎng)絡(luò)往往比淺層網(wǎng)絡(luò)工作得更好。
當(dāng)我們從300x300像素的圖片中識別出人臉時,我們就有90000像素包含信息,但是如果你知道通常由什么構(gòu)成的人臉,則人臉信息的特征就少得多(例如,相關(guān)特征,例如眼睛、嘴巴的寬度、鼻子的位置等)。
例如,在一些深層次的生成模型中使用了此概念,在該模型中,學(xué)習(xí)了數(shù)據(jù)的潛在低維表示形式,然后將其用于生成高維,輸出逼真的外觀。
神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,例如隨機(jī)梯度下降,使網(wǎng)絡(luò)可以通過有效地從輸入中拋出所有不相關(guān)的信息來過濾出相關(guān)的模式,例如Ian Goodfellow在他的著作《深層》中指出的那樣,在對照片中的物體進(jìn)行分類時忽略了照片的背景。
TIshby將其與從瓶子底部流到頂部的水進(jìn)行比較:瓶頸變得越來越緊密,信息流通的越來越少。但是,如果瓶頸設(shè)置得當(dāng),到達(dá)頂部的水最終將攜帶所有必要的信息。
之所以提出這一點(diǎn),是因?yàn)槲艺J(rèn)為這種信息理論的觀點(diǎn)可以幫助我們理解由模式識別器組成的新皮層的概念。
模式識別器從數(shù)據(jù)中提取模式。這些模式僅構(gòu)成輸入的一小部分,因此,實(shí)質(zhì)上,大腦的模式識別器被設(shè)置為從我們的感知數(shù)據(jù)中提取與我們的生存相關(guān)的信息,并將此提取的數(shù)據(jù)分類為知識層次結(jié)構(gòu)。然后,我們可以使用這些命令將秩序帶入混亂的世界,增加我們生存的機(jī)會。
這是大腦的工作。它的核心是不斷地從數(shù)據(jù)中學(xué)習(xí)有用模式的信息過濾和排序設(shè)備。
這很可能是我們所認(rèn)為的智能的核心,因此在構(gòu)建自己的智能系統(tǒng)時,我們不妨從中學(xué)到一些東西(就像我們已經(jīng)學(xué)過的一樣)。
為什么智慧可能比我們想象的要簡單
在我們"解決"智能之前,有許多問題需要解決。正如Yann LeCun指出的那樣,推斷因果關(guān)系或一般常識知識結(jié)構(gòu)是一個大問題,并且在算法中建立世界的預(yù)測模型在許多其他必要步驟中可能是必要的下一步。
在訓(xùn)練機(jī)器人智能地執(zhí)行任務(wù)時,在會遇到其他與更好的目標(biāo)功能相關(guān)的懸而未決的問題。聰明意味著解決問題,而其中的一個主要方面是找出定義目標(biāo)然后實(shí)現(xiàn)這些目標(biāo)的最佳方法,在大腦中,這種作用被認(rèn)為是基底神經(jīng)節(jié)發(fā)揮的作用。
因此,僅堆疊模式識別器就不會突然帶來像人類一樣在推理周圍運(yùn)轉(zhuǎn)的機(jī)器人。
我仍然認(rèn)為,由新證據(jù)支持的遺傳密碼中所包含的信息稀疏性,證明了新皮層及其學(xué)習(xí)算法的簡單性和通用性,應(yīng)該讓我們停下來,并抓住機(jī)會在不久的將來建造高度智能的機(jī)器,庫茲韋爾預(yù)測機(jī)器將在2029年通過圖靈測試,并在2045年通過人類水平的AI。
正如安德森(PW Anderson)在其有關(guān)科學(xué)層次的所說,如果我們找到正確的方法來擴(kuò)大簡單事物的使用范圍,更多的事情就會有所不同,并且更多的可能來自于簡單事物的使用。在深度學(xué)習(xí)的最新成功中,其中一些已經(jīng)很明顯,深度學(xué)習(xí)與擴(kuò)大可用數(shù)據(jù)和計算能力緊密相關(guān)。
對我來說,理解和建立自己的智慧絕對是令人振奮的前景。
但是,正如許多人強(qiáng)調(diào)的那樣,人工智能的興起可能對整個人類產(chǎn)生重大影響,應(yīng)將其視為一個問題。即使我們高估了這個問題,我們也應(yīng)該比后悔更安全。
因?yàn)楫吘勾笞匀煌ㄟ^進(jìn)化的盲目產(chǎn)生了智力。看來我們可能很快也會提出類似人類的人工智能。
? ? ? ?