細(xì)數(shù)神經(jīng)網(wǎng)絡(luò)的四大弊端
掃描二維碼
隨時(shí)隨地手機(jī)看文章
深度學(xué)習(xí)受到大規(guī)模的炒作,人們恨不得在各個(gè)地方都使用神經(jīng)網(wǎng)絡(luò),但確實(shí)在每一個(gè)地方都適用么?我們將在下面的章節(jié)中進(jìn)行討論,閱讀完它后,您將知道神經(jīng)網(wǎng)絡(luò)的主要缺點(diǎn),并且當(dāng)您為當(dāng)前的機(jī)器學(xué)習(xí)問(wèn)題選擇正確類(lèi)型的算法時(shí),您將有一個(gè)粗略的指導(dǎo)原則。您還將了解我們現(xiàn)在面臨的機(jī)器學(xué)習(xí)中的主要問(wèn)題。
為什么深度學(xué)習(xí)受到炒作?深度學(xué)習(xí)有目前正在進(jìn)行炒作的四個(gè)主要原因,包括數(shù)據(jù)、計(jì)算能力、算法本身和市場(chǎng)營(yíng)銷(xiāo)。我們將在下面的章節(jié)中討論它們中的每一個(gè)。
1.數(shù)據(jù)
增加深度學(xué)習(xí)的受歡迎程度的一個(gè)因素是2018年可用的大量數(shù)據(jù),這些數(shù)據(jù)是在過(guò)去幾年和幾十年中收集的。這使得神經(jīng)網(wǎng)絡(luò)能夠真正發(fā)揮他們的潛力,因?yàn)樗麄儷@得的數(shù)據(jù)越多越好。
相比之下,傳統(tǒng)的機(jī)器學(xué)習(xí)算法肯定會(huì)達(dá)到一個(gè)水平,更多的數(shù)據(jù)不會(huì)提高其性能。下面的圖表說(shuō)明了這一點(diǎn):
2.計(jì)算能力
另一個(gè)非常重要的原因是現(xiàn)在可用的計(jì)算能力,這使我們能夠處理更多的數(shù)據(jù)。根據(jù)人工智能的領(lǐng)先人物Ray Kurzweil的說(shuō)法,計(jì)算能力在每個(gè)時(shí)間單位會(huì)乘以一個(gè)常數(shù)因子(例如,每年增加一倍),而不是逐漸增加。這意味著計(jì)算能力呈指數(shù)增長(zhǎng)。
3.算法
提高Deep Learning流行度的第三個(gè)因素是算法本身的進(jìn)步。算法開(kāi)發(fā)中的出現(xiàn)最近的突破主要是由于使它們比以前運(yùn)行得更快,這使得使用越來(lái)越多的數(shù)據(jù)成為可能。
4.營(yíng)銷(xiāo)
營(yíng)銷(xiāo)可能也是一個(gè)很重要的因素。神經(jīng)網(wǎng)絡(luò)幾十年來(lái)(第一次在1944年提出),已經(jīng)經(jīng)歷了一些炒作,但過(guò)去處于沒(méi)有人想相信和投資的時(shí)代。 “深度學(xué)習(xí)”這個(gè)詞組給了它一個(gè)新的花哨的名字,這使得新的炒作成為可能,這也是許多人錯(cuò)誤地認(rèn)為深度學(xué)習(xí)是一個(gè)新創(chuàng)造的領(lǐng)域的原因。
此外,其他因素也促成了深度學(xué)習(xí)的營(yíng)銷(xiāo),例如漢森機(jī)器人技術(shù)的“人形”機(jī)器人Sophia,在大眾中引起了廣泛的爭(zhēng)議,以及機(jī)器學(xué)習(xí)主要領(lǐng)域的幾項(xiàng)突破,使其成為大眾媒體等等。
神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)算法當(dāng)你應(yīng)該使用神經(jīng)網(wǎng)絡(luò)或傳統(tǒng)的機(jī)器學(xué)習(xí)算法,這是一個(gè)難以回答的問(wèn)題,因?yàn)樗艽蟪潭壬先Q于你試圖解決的問(wèn)題。這也是由于“沒(méi)有免費(fèi)的午餐定理”,它大致表明沒(méi)有“完美”的機(jī)器學(xué)習(xí)算法,在任何問(wèn)題上都能表現(xiàn)出色。對(duì)于每一個(gè)問(wèn)題,一個(gè)特定的方法是適合的,能取得良好的效果,而另一種方法或許會(huì)失敗,但這可能是機(jī)器學(xué)習(xí)最有趣的部分之一。
這也是您需要精通幾種算法的原因,以及為什么通過(guò)練習(xí)獲得優(yōu)秀機(jī)器學(xué)習(xí)工程師或數(shù)據(jù)科學(xué)家的較好的方法。在這篇文章中會(huì)為您提供一些指導(dǎo)方針,幫助您更好地理解何時(shí)應(yīng)使用哪種類(lèi)型的算法。
神經(jīng)網(wǎng)絡(luò)的主要優(yōu)勢(shì)在于其幾乎超越了其他所有機(jī)器學(xué)習(xí)算法的能力,但是這有一些缺點(diǎn),我們將在本文中討論并重點(diǎn)關(guān)注。就像我之前提到的那樣,決定是否應(yīng)該使用深度學(xué)習(xí)主要取決于您正在嘗試解決的問(wèn)題。例如,在癌癥檢測(cè)中,高性能至關(guān)重要,因?yàn)樾阅茉胶?,可以治療的人越多。但也有機(jī)器學(xué)習(xí)問(wèn)題,傳統(tǒng)的算法提供的不僅僅是滿意的結(jié)果。
1.黑盒子
神經(jīng)網(wǎng)絡(luò)最為人所知的缺點(diǎn)可能就是它們的“黑盒子”性質(zhì),這意味著你不知道神經(jīng)網(wǎng)絡(luò)如何以及為什么會(huì)產(chǎn)生一定的輸出。例如,當(dāng)你將一張貓的圖像放入神經(jīng)網(wǎng)絡(luò),并預(yù)測(cè)它是一輛汽車(chē)時(shí),很難理解是什么導(dǎo)致它產(chǎn)生這個(gè)預(yù)測(cè)。當(dāng)你具有人類(lèi)可解釋的特征時(shí),理解其錯(cuò)誤的原因要容易得多。在比較中,像決策樹(shù)這樣的算法是非常容易理解的。這很重要,因?yàn)樵谀承╊I(lǐng)域,可解釋性非常重要。
這就是為什么很多銀行不使用神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)一個(gè)人是否有信譽(yù),因?yàn)樗麄冃枰蚩蛻艚忉尀槭裁此麄儧](méi)有獲得貸款。否則,這個(gè)人可能會(huì)覺(jué)得受到銀行的錯(cuò)誤威脅,因?yàn)樗幻靼姿麨槭裁礇](méi)有獲得貸款,這可能導(dǎo)致他改變對(duì)該銀行的看法,像Quora這樣的網(wǎng)站也是如此。如果他們因?yàn)闄C(jī)器學(xué)習(xí)算法而決定刪除用戶帳戶,他們需要向用戶解釋為什么他們已經(jīng)完成了它。我懷疑他們是否會(huì)滿意電腦所給的答案。
在機(jī)器學(xué)習(xí)的推動(dòng)下,其他情景將是重要的商業(yè)決策。你能想象一個(gè)大公司的首席執(zhí)行官會(huì)在不明白為什么應(yīng)該完成的情況下做出價(jià)值數(shù)百萬(wàn)美元的決定嗎??jī)H僅因?yàn)?ldquo;計(jì)算機(jī)”說(shuō)他需要這樣做。
2.開(kāi)發(fā)持續(xù)時(shí)間
盡管像Keras這樣的庫(kù)使得神經(jīng)網(wǎng)絡(luò)的開(kāi)發(fā)非常簡(jiǎn)單,但是有時(shí)您需要更多地控制算法的細(xì)節(jié),例如,當(dāng)您試圖解決機(jī)器學(xué)習(xí)中的難題時(shí)。
然后你可能會(huì)使用Tensorflow,它為你提供了更多的機(jī)會(huì),但因?yàn)樗哺鼜?fù)雜,開(kāi)發(fā)需要更長(zhǎng)的時(shí)間(取決于你想要構(gòu)建的)。那么對(duì)于公司管理層來(lái)說(shuō),如果真的值得他們昂貴的工程師花費(fèi)數(shù)周時(shí)間來(lái)開(kāi)發(fā)一些東西,那么問(wèn)題就會(huì)出現(xiàn),用更簡(jiǎn)單的算法可以更快地解決問(wèn)題。
3.數(shù)據(jù)量
與傳統(tǒng)的機(jī)器學(xué)習(xí)算法相比,神經(jīng)網(wǎng)絡(luò)通常需要更多的數(shù)據(jù),至少有數(shù)千甚至數(shù)百萬(wàn)個(gè)標(biāo)記樣本。這不是一個(gè)容易解決的問(wèn)題,如果使用其他算法,許多機(jī)器學(xué)習(xí)問(wèn)題可以用較少的數(shù)據(jù)很好地解決。
盡管有些情況下神經(jīng)網(wǎng)絡(luò)很少處理數(shù)據(jù),但大多數(shù)情況下他們不處理。在這種情況下,像樸素貝葉斯這樣的簡(jiǎn)單算法可以很好地處理少數(shù)數(shù)據(jù)。
4.計(jì)算昂貴
通常,神經(jīng)網(wǎng)絡(luò)比傳統(tǒng)算法在計(jì)算上更昂貴。最先進(jìn)的深度學(xué)習(xí)算法,實(shí)現(xiàn)真正深度的神經(jīng)網(wǎng)絡(luò)的成功訓(xùn)練,可能需要幾周時(shí)間才能完全從頭開(kāi)始進(jìn)行訓(xùn)練。大多數(shù)傳統(tǒng)的機(jī)器學(xué)習(xí)算法花費(fèi)的時(shí)間少于幾分鐘到幾個(gè)小時(shí)或幾天。
神經(jīng)網(wǎng)絡(luò)所需的計(jì)算能力很大程度上取決于數(shù)據(jù)的大小,但也取決于網(wǎng)絡(luò)的深度和復(fù)雜程度。例如,具有一層和50個(gè)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)將比具有1000棵樹(shù)的隨機(jī)森林快得多。相比之下,具有50層的神經(jīng)網(wǎng)絡(luò)將比僅有10棵樹(shù)的隨機(jī)森林慢得多。
現(xiàn)在你可能會(huì)知道神經(jīng)網(wǎng)絡(luò)對(duì)于某些任務(wù)比較適用,但對(duì)其他人來(lái)說(shuō)并不一定適用。您了解到,大量的數(shù)據(jù)、更多的計(jì)算能力、更好的算法和智能營(yíng)銷(xiāo)增加了深度學(xué)習(xí)的受歡迎程度,并使其成為目前最熱門(mén)的領(lǐng)域之一。最重要的是,您已經(jīng)了解到,神經(jīng)網(wǎng)絡(luò)幾乎可以擊敗所有其他機(jī)器學(xué)習(xí)算法以及與之相伴隨的缺點(diǎn)。最大的缺點(diǎn)是它們的“黑盒子”性質(zhì),增加開(kāi)發(fā)時(shí)間(取決于您的問(wèn)題)、所需的數(shù)據(jù)量以及它們大部分計(jì)算成本高昂。
結(jié)論深度學(xué)習(xí)目前可能仍舊有點(diǎn)過(guò)度炒作的情況,并且超過(guò)期望完成的事情。但這并不意味著它沒(méi)有用處。我認(rèn)為我們生活在機(jī)器學(xué)習(xí)復(fù)興中,因?yàn)樗絹?lái)越民主化,越來(lái)越多的人可以用它來(lái)構(gòu)建有用的產(chǎn)品。機(jī)器學(xué)習(xí)可以解決很多問(wèn)題,我相信這將在未來(lái)幾年內(nèi)發(fā)生。
其中一個(gè)主要問(wèn)題是只有少數(shù)人了解可以用它做些什么,并知道如何建立成功的數(shù)據(jù)科學(xué)團(tuán)隊(duì),為公司帶來(lái)真正的價(jià)值。一方面,我們擁有博士級(jí)工程師,他們是機(jī)器學(xué)習(xí)背后的理論天才,但可能缺乏對(duì)商業(yè)方面的理解。另一方面,我們有首席執(zhí)行官和管理職位的人員,他們不知道深度學(xué)習(xí)可以做些什么,并認(rèn)為它將在未來(lái)幾年解決所有問(wèn)題。我們需要更多的人來(lái)填補(bǔ)這個(gè)空白,這將產(chǎn)生更多對(duì)我們社會(huì)有用的產(chǎn)品。