當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀] 2014年,Ian Goodfellow提出生成對(duì)抗網(wǎng)絡(luò)(GAN)的概念, 從那之后,生成對(duì)抗網(wǎng)絡(luò)就一直是學(xué)術(shù)界的研究熱點(diǎn), Yann LeCun還稱之為”過(guò)去十年間,機(jī)器學(xué)習(xí)領(lǐng)域最

2014年,Ian Goodfellow提出生成對(duì)抗網(wǎng)絡(luò)(GAN)的概念, 從那之后,生成對(duì)抗網(wǎng)絡(luò)就一直是學(xué)術(shù)界的研究熱點(diǎn), Yann LeCun還稱之為”過(guò)去十年間,機(jī)器學(xué)習(xí)領(lǐng)域最讓人激動(dòng)的點(diǎn)子”。GAN目前的發(fā)展如何,能做到什么,未來(lái)又有哪些展望?本文編譯自hackernoon的原題為“The New Neural Internet is Coming”的文章。

GAN是什么 - 生成對(duì)抗網(wǎng)絡(luò)的發(fā)展過(guò)程

神經(jīng)網(wǎng)絡(luò)是最近很流行的科技熱詞,其核心用途是分類。分類器是自動(dòng)對(duì)輸入值進(jìn)行分類的機(jī)器。分類器輸入的是一個(gè)數(shù)值向量,叫做特征(向量)。分類器的輸出也是數(shù)值,代表分類的結(jié)果。分類器的目標(biāo)就是讓正確分類的比例盡可能高。而生成對(duì)抗網(wǎng)絡(luò)(GAN)由一個(gè)生成網(wǎng)絡(luò)與一個(gè)判別網(wǎng)絡(luò)組成,通過(guò)讓兩個(gè)神經(jīng)網(wǎng)絡(luò)相互博弈的方式進(jìn)行學(xué)習(xí)。是非監(jiān)督式學(xué)習(xí)的一種方法。

生成網(wǎng)絡(luò)從潛在空間(latent space)中隨機(jī)采樣作為輸入,其輸出結(jié)果需要盡量模仿訓(xùn)練集里的真實(shí)樣本。

判別網(wǎng)絡(luò)的輸入則為真實(shí)樣本或生成網(wǎng)絡(luò)的輸出,其目的是將生成網(wǎng)絡(luò)的輸出從真實(shí)樣本中盡可能分辨出來(lái)。

生成網(wǎng)絡(luò)則要盡可能地欺騙判別網(wǎng)絡(luò)。

兩個(gè)網(wǎng)絡(luò)相互對(duì)抗、不斷調(diào)整參數(shù),最終目的是使判別網(wǎng)絡(luò)無(wú)法判斷生成網(wǎng)絡(luò)的輸出結(jié)果是否真實(shí)(直至達(dá)到納什均衡)。

如果我們將典型的神經(jīng)網(wǎng)絡(luò)(如圖像分類器)當(dāng)作神經(jīng)網(wǎng)絡(luò)“大腦”的左半球,那么生成對(duì)抗網(wǎng)絡(luò)就類似大腦的右半球 ——負(fù)責(zé)創(chuàng)造力的一個(gè)半球。

GAN是培養(yǎng)神經(jīng)網(wǎng)絡(luò)“創(chuàng)造力”的第一步。典型的GAN從隨機(jī)噪聲或者潛在變量中,根據(jù)特定的關(guān)鍵字生成圖像。目前,GAN生成的圖像質(zhì)量不好,分辨率也有限。但最近NVIDIA取得了新進(jìn)展:在高分辨率下生成逼真的圖像是可以實(shí)現(xiàn)的,他們開(kāi)放了這項(xiàng)技術(shù)的權(quán)限。

條件GAN和變分自編碼器

GAN種類繁多,復(fù)雜程度、架構(gòu)和簡(jiǎn)稱各有不同。人們最感興趣的是條件GAN和變分自編碼器。條件GAN不僅能夠模仿“臥室”,“臉”,“狗”等大分類的圖像,它生成的圖像分類還可以更細(xì)。例如,Text2Image網(wǎng)絡(luò)能將對(duì)圖像的文字描述,轉(zhuǎn)換成圖像。

GAN生成的“假房間”、“假狗 ”、“假名人 ”和“假藝術(shù)品 ”結(jié)果

通過(guò)設(shè)置“含義”向量的隨機(jī)種子,我們能夠產(chǎn)生無(wú)限個(gè)匹配描述的鳥(niǎo)類圖像。

輸入文字描述“這只小鳥(niǎo)有白色的胸部、淺灰色的頭、黑色的翅膀和尾巴”文字轉(zhuǎn)化為向量加入隨機(jī)種子完成訓(xùn)練的GAN給出結(jié)果

我們眼前的機(jī)遇

想像一下兩年后的世界。NVIDIA這樣的公司會(huì)將GAN技術(shù)發(fā)展到成熟的行業(yè)水準(zhǔn),就像現(xiàn)在我們能看到的名人頭像生成那樣。這也就意味著,GAN隨時(shí)可以按照要求生成任何圖像,你只需要給出文字描述就行了。那么很多攝影和設(shè)計(jì)相關(guān)的產(chǎn)業(yè)就會(huì)過(guò)時(shí)。請(qǐng)看下圖分解。

給出不同的隨機(jī)種子,這個(gè)神經(jīng)網(wǎng)絡(luò)能生成無(wú)限個(gè)圖像結(jié)果。

左邊為輸入的文字描述,右邊為GAN生成的結(jié)果。

輸入“我需要牛和海豚合體的照片。 ” 得到圖一。

輸入“我需要牛和海豚分開(kāi)的照片。” 得到圖二。

輸入“我需要牛和海豚分開(kāi),享受生活的照片。 ” 得到圖三。

超級(jí)個(gè)性化

讓人寒毛直豎的地方在于,這樣的一個(gè)網(wǎng)絡(luò)不僅輸入它需要生成的目標(biāo)的描述,還能接收到一個(gè)用來(lái)描述你,目標(biāo)消費(fèi)者,的向量。這個(gè)廣告能深度描繪出你的個(gè)性,你的網(wǎng)頁(yè)瀏覽歷史、最近的交易記錄和地理位置。所以GAN一次性生成的結(jié)果,是為你專門打造的。用戶點(diǎn)擊率一定會(huì)爆棚。

輸入“穿著我們品牌服裝的女孩兒 ”+金發(fā)、加州、夢(mèng)幻紅色法拉利、優(yōu)先白色,結(jié)果是左下角的圖。輸入“穿著我們品牌服裝的女孩兒 ”+紅棕色頭發(fā)、最近搜索過(guò)香奈兒、計(jì)劃去摩納哥旅行,結(jié)果是右下角的圖。

“測(cè)量”你的反應(yīng)之后,神經(jīng)網(wǎng)絡(luò)會(huì)進(jìn)行調(diào)整,讓廣告越來(lái)越準(zhǔn)確的符合你的品味,刺激讓你最興奮的點(diǎn)。

泡沫趨勢(shì)

所以,總有一天,網(wǎng)絡(luò)上會(huì)到處都是完全個(gè)性化定制的內(nèi)容。

所有人看到的內(nèi)容,都是結(jié)合自己生活方式、觀點(diǎn)看法和個(gè)人歷史,經(jīng)過(guò)個(gè)性化調(diào)整的。在美國(guó)總統(tǒng)大選中,我們已經(jīng)目睹了這種泡沫格局的激化,但未來(lái)的情況只會(huì)越來(lái)越糟。GAN可以將為個(gè)人生成各種內(nèi)容,且不受媒體的限制 -從簡(jiǎn)單的圖像廣告,到機(jī)器生成的復(fù)雜觀點(diǎn),帖子和出版作品,從而創(chuàng)建出一個(gè)持續(xù)的反饋循環(huán),根據(jù)人機(jī)交互不斷改進(jìn)。不同的GAN之間會(huì)出現(xiàn)競(jìng)爭(zhēng)——全面的自動(dòng)化戰(zhàn)爭(zhēng),而我們?nèi)祟惥褪菓?zhàn)場(chǎng)。 這一趨勢(shì)背后的驅(qū)動(dòng)力非常簡(jiǎn)單——利潤(rùn)。

這可不是什么嚇唬人的末日言論,戰(zhàn)爭(zhēng)的號(hào)角早已吹響,只是我們還沒(méi)看到硝煙。

是好是壞?

我不知道。 但是有些事情已經(jīng)刻不容緩:這種技術(shù)的到來(lái)已經(jīng)不可避免,必須展開(kāi)廣泛的公眾討論,以及做好喊停的準(zhǔn)備。 所以,我們最好現(xiàn)在就開(kāi)始思考 - 如何能夠在對(duì)抗這個(gè)過(guò)程的同時(shí),從中受益?

技術(shù)方面

出于某些技術(shù)上的限制,以上描述的未來(lái)還沒(méi)有成真。 目前,由GAN生成的圖像質(zhì)量還很差,很容易被發(fā)現(xiàn)是假的。 但NVIDIA已經(jīng)向世界展示,生成1024x1024的逼真面孔是可行的。 如果技術(shù)要進(jìn)一步發(fā)展,我們需要更快,更大型的GPU,更多關(guān)于GAN的理論研究,更多的訓(xùn)練GAN的巧妙方法,更多的標(biāo)記數(shù)據(jù)集...

注意: 我們不需要新的能源,量子處理器(但這可能有幫助)或者人工智能,來(lái)幫我們實(shí)現(xiàn)技術(shù)進(jìn)步。 我們所需要的資源在幾年內(nèi)就能完成,而一些大公司可能已經(jīng)擁有這些資源。

另外,我們需要更智能的神經(jīng)網(wǎng)絡(luò)。GAN的進(jìn)展會(huì)首先應(yīng)用于超分辨率技術(shù),給超分辨率技術(shù)的進(jìn)步帶來(lái)極大的好處。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉