當(dāng)前位置:首頁 > 充電吧 > 充電吧
[導(dǎo)讀]眼下,人工智能已經(jīng)成為越來越火的一個方向。普通工程師,如何轉(zhuǎn)向人工智能方向,是知乎上的一個問題。本文是對此問題的一個回答的歸檔版。相比原回答內(nèi)容上有所增加。

眼下,人工智能已經(jīng)成為越來越火的一個方向。普通工程師,如何轉(zhuǎn)向人工智能方向,是知乎上的一個問題。本文是對此問題的一個回答的歸檔版。相比原回答內(nèi)容上有所增加。

一、 目的

本文的目的是給出一個簡單的,平滑的,易于實現(xiàn)的學(xué)習(xí)方法,幫助 “普通” 工程師踏入AI領(lǐng)域這個門。這里,我對普通工程師的定義是:擁有大學(xué)本科知識;平時工作較忙;自己能獲取的數(shù)據(jù)有限。因此,本文更像是一篇 “from the scratch” 的AI入門教程。

二、 AI領(lǐng)域簡介

AI,也就是人工智能,并不僅僅包括機器學(xué)習(xí)。曾經(jīng),符號與邏輯被認(rèn)為是人工智能實現(xiàn)的關(guān)鍵,而如今則是基于統(tǒng)計的機器學(xué)習(xí)占據(jù)了主導(dǎo)地位。最近火熱的深度學(xué)習(xí)正是機器學(xué)習(xí)中的一個子項。目前可以說,學(xué)習(xí)AI主要的是學(xué)習(xí)機器學(xué)習(xí)。

但是,人工智能并不等同于機器學(xué)習(xí),這點在進入這個領(lǐng)域時一定要認(rèn)識清楚。關(guān)于AI領(lǐng)域的發(fā)展歷史介紹推薦看周老師寫的《機器學(xué)習(xí)簡介》。下面一個問題是:AI的門好跨么?其實很不好跨。我們以機器學(xué)習(xí)為例。

在學(xué)習(xí)過程中,你會面對大量復(fù)雜的公式,在實際項目中會面對數(shù)據(jù)的缺乏,以及艱辛的調(diào)參等。如果僅僅是因為覺得這個方向未來會“火”的話,那么這些困難會容易讓人放棄??紤]到普通工程師的特點,而要學(xué)習(xí)如此困難的學(xué)科,是否就是沒有門路的?答案是否定的。只要制定合適的學(xué)習(xí)方法即可。

三、 學(xué)習(xí)方法

學(xué)習(xí)方法的設(shè)定簡單說就是回答以下幾個問題:我要學(xué)的是什么?我怎樣學(xué)習(xí)?我如何去學(xué)習(xí)?這三個問題概括說就是:學(xué)習(xí)目標(biāo),學(xué)習(xí)方針與學(xué)習(xí)計劃。學(xué)習(xí)目 標(biāo)比較清楚,就是踏入AI領(lǐng)域這個門。這個目標(biāo)不大,因此實現(xiàn)起來也較為容易。“過大的目標(biāo)時就是為了你日后放棄它時找到了足夠的理由”。

學(xué)習(xí)方針可以總結(jié)為 “興趣為先,踐學(xué)結(jié)合”。簡單說就是先培養(yǎng)興趣,然后學(xué)習(xí)中把實踐穿插進來,螺旋式提高。這種方式學(xué)習(xí)效果好,而且不容易讓人放棄。有了學(xué)習(xí)方針以后,就可以制定學(xué)習(xí)計劃,也稱為學(xué)習(xí)路線。下面就是學(xué)習(xí)路線的介紹。

四、 學(xué)習(xí)路線

我推薦的學(xué)習(xí)路線是這樣的,如下圖:

圖1 AI領(lǐng)域?qū)W習(xí)路線圖

這個學(xué)習(xí)路線是這樣設(shè)計的:首先了解這個領(lǐng)域,建立起全面的視野,培養(yǎng)起充足的興趣,然后開始學(xué)習(xí)機器學(xué)習(xí)的基礎(chǔ),這里選擇一門由淺入深的課程來學(xué)習(xí), 課程最好有足夠的實驗?zāi)軌蜻M行實戰(zhàn)?;A(chǔ)打下后,對機器學(xué)習(xí)已經(jīng)有了充足的了解,可以用機器學(xué)習(xí)來解決一個實際的問題。

這時還是可以把 機器學(xué)習(xí)方法當(dāng)作一個黑盒子來處理的。實戰(zhàn)經(jīng)驗積累以后,可以考慮繼續(xù)進行學(xué)習(xí)。這時候有兩個選擇,深度學(xué)習(xí)或者繼續(xù)機器學(xué)習(xí)。深度學(xué)習(xí)是目前最火熱的機器學(xué)習(xí)方向,其中一些方法已經(jīng)跟傳統(tǒng)的機器學(xué)習(xí)不太一樣,因此可以單獨學(xué)習(xí)。除了深度學(xué)習(xí)以外,機器學(xué)習(xí)還包括統(tǒng)計學(xué)習(xí),集成學(xué)習(xí)等實用方法。

如果條件足夠,可以同時學(xué)習(xí)兩者,一些規(guī)律對兩者是共通的。學(xué)習(xí)完后,你已經(jīng)具備了較強的知識儲備,可以進入較難的實戰(zhàn)。這時候有兩個選擇,工業(yè)界的可以選擇看開源項目,以改代碼為目的來讀代碼;學(xué)術(shù)界的可以看特定領(lǐng)域的論文,為解決問題而想發(fā)論文。

無論哪者,都需要知識過硬,以及較強的編碼能力,因此很能考察和鍛煉水平。經(jīng)過這個階段以后,可以說是踏入AI領(lǐng)域的門了。“師傅領(lǐng)進門,修行在個人”。之后的路就要自己走了。

下面是關(guān)于每個階段的具體介紹:

0.領(lǐng)域了解

在學(xué)習(xí)任何一門知識之前,首先第一步就是了解這個知識是什么?它能做什么事?它的價值在什么地方?如果不理解這些的話,那么學(xué)習(xí)本身就是一個沒有方向的舟,不知道駛向何處,也極易有沉船的風(fēng)險。了解這些問題后,你才能培養(yǎng)出興趣,興趣是最好的引路人,學(xué)習(xí)的動力與持久力才能讓你應(yīng)付接下來的若干個階段。

1.知識準(zhǔn)備

如果你離校過久,或者覺得基礎(chǔ)不牢,最好事先做一下準(zhǔn)備復(fù)習(xí)工作。“工欲善其事,必先利其器”。以下的準(zhǔn)備工作不多,但足以應(yīng)付后面階段的學(xué)習(xí)。

數(shù)學(xué):復(fù)習(xí)以下基本知識。線性代數(shù):矩陣乘法;高數(shù):求導(dǎo);概率論:條件與后驗概率。其他的一些知識可以在后面的學(xué)習(xí)過程中按需再補;

英文:常備一個在線英文詞典,例如愛詞霸,能夠不吃力的看一些英文的資料網(wǎng)頁;

FQ:可以隨時隨地上Google,這是一個很重要的工具。不是說百度查的不能看,而是很多情況下Google搜出來的資料比百度搜的幾十頁的資料還管用,尤其是在查英文關(guān)鍵字時。節(jié)省時間可是很重要的學(xué)習(xí)效率提升。

2.機器學(xué)習(xí)

機器學(xué)習(xí)的第一門課程首推Andrew Ng的機器學(xué)習(xí)。這門課程有以下特點:難度適中,同時有足夠的實戰(zhàn)例子,非常適合第一次學(xué)習(xí)的人。cs229 這門課程我這里不推薦,為什么,原因有以下:

時間:cs229 的時間太早,一些知識已經(jīng)跟不上當(dāng)今的發(fā)展,目前最為火熱的神經(jīng)網(wǎng)絡(luò)一筆帶過。而Cousera上神經(jīng)網(wǎng)絡(luò)可是用了兩個課時去講的!而且非常詳細(xì);

教學(xué):Ng在cs229 時候的教學(xué)稍顯青澀,可能是面對網(wǎng)絡(luò)教學(xué)的原因。有很多問題其實他都沒有講清楚,而且下面的人的提問其實也很煩躁,你往往不關(guān)心那些人的問題。這點在 Coursera上就明顯得到了改善,你會發(fā)現(xiàn)Ng的教學(xué)水平大幅度改善了,他會對你循循善誘,推心置腹,由淺入深的教學(xué),在碰到你不明白的單詞術(shù)語時也會叫你不要擔(dān)心,更重要的,推導(dǎo)與圖表不要太完善,非常細(xì)致清晰,這點真是強力推薦;

字幕:cs229 的字幕質(zhì)量比Coursera上的差了一截。Coursera上中文字幕翻譯經(jīng)過了多人把關(guān),質(zhì)量很有保證;

作業(yè):cs229 沒有作業(yè),雖然你可以做一些,但不會有人看。這點遠(yuǎn)不如Coursera上每周有deadline的那種作業(yè),而且每期作業(yè)提交上去都有打分。更重要的是,每期作業(yè)都有實際的例子,讓你手把手練習(xí),而且能看到自己的成果,成就感滿滿!

3.實踐做項目

學(xué)習(xí)完了基礎(chǔ)課程,你對機器學(xué)習(xí)就有了初步了解?,F(xiàn)在使用它們是沒有問題的,你可以把機器學(xué)習(xí)算法當(dāng)作黑盒子,放進去數(shù)據(jù),就會有結(jié)果。在實戰(zhàn)中你更需要去關(guān)心如何獲取數(shù)據(jù),以及怎么調(diào)參等。如果有時間,自己動手做一個簡單的實踐項目是最好的。

這里需要選擇一個應(yīng)用方向,是圖像(計算機視覺),音頻(語音識別),還是文本(自然語言處理)。這里推薦選擇圖像領(lǐng)域,這里面的開源項目較多,入門也較簡單,可以使用OpenCV做開發(fā),里面已經(jīng)實現(xiàn)好了神經(jīng)網(wǎng)絡(luò),SVM等機器學(xué)習(xí)算法。項目做好后,可以開源到到 Github 上面,然后不斷完善它。實戰(zhàn)項目做完后,你可以繼續(xù)進一步深入學(xué)習(xí),這時候有兩個選擇,深度學(xué)習(xí)和繼續(xù)機器學(xué)習(xí);

4.深度學(xué)習(xí)

深度學(xué)習(xí):深度學(xué)習(xí)是目前最火熱的研究方向。有以下特點:知識更新快,較為零碎,沒有系統(tǒng)講解的書。因此學(xué)習(xí)的資源也相對零散,下面是一些資源介紹。其中不推薦的部分并不代表不好,而是在這個初學(xué)階段不合適:

推薦,UFLDL: 非常好的DL基礎(chǔ)教程,也是Andrew Ng寫的。有很詳盡的推導(dǎo),有翻譯,且翻譯質(zhì)量很高;推薦,Deep learning (paper):2015年Nature上的論文,由三位深度學(xué)習(xí)界的大牛所寫,讀完全篇論文,給人高屋建瓴,一覽眾山小的感覺,強烈推薦。如果只能讀一篇論文了解深度學(xué)習(xí),我推薦此篇。這篇論文有同名的中文翻譯;推薦,Neural networks and deep learning:這本書的作者非常擅長以淺顯的語言表達(dá)深刻的道理,雖然沒有翻譯,但是閱讀并不困難;推薦,Recurrent Neural Networks: 結(jié)合一個實際案例告訴你RNN是什么,整篇教程學(xué)完以后,會讓你對RNN如何產(chǎn)生作用的有很清晰的認(rèn)識,而這個效果,甚至是讀幾篇相關(guān)論文所沒有的;

不推薦,Neural Networks for Machine Learning – University of Toronto | Coursera:深度學(xué)習(xí)創(chuàng)始人教的課,最大的問題是太難,而且老先生的吐字有時不是很標(biāo)準(zhǔn);不推薦,Deep Learning (book):同樣也是由深度學(xué)習(xí)大牛所寫的書,但感覺就像是第二作者,也就是他的學(xué)生所寫的。很多內(nèi)容都講了,但是感覺也沒講出什么內(nèi)容來,只是告訴你來自那篇論文,這樣的話可能直接閱讀論文更合適。不推薦,cs231n:李菲菲的課程,很有名,專門講CNN。但是這門課程有一個最大的問題,就是沒有字幕,雖然有youtube的自動翻譯字幕,但有還不如沒有。

5.繼續(xù)機器學(xué)習(xí)

深度學(xué)習(xí)未必就一定是未來的主流,至少一些大牛是這么認(rèn)為的。傳統(tǒng)的機器學(xué)習(xí)有如下特點,知識系統(tǒng)化,有相對經(jīng)典的書。其中統(tǒng)計學(xué)習(xí)(代表SVM)與集成學(xué)習(xí)(代表adaboost)是在實踐中使用非常多的技術(shù)。下面是相關(guān)資源:

推薦,機器學(xué)習(xí)(周志華): 如果是在以前,機器學(xué)習(xí)方面的經(jīng)典教材首推PRML,但現(xiàn)在周老師的書出來以后,就不再是這樣了。首先推薦讀周老師的書。這本書有一個特點,那就是再難的道理也能用淺顯精煉的語言表達(dá)出來。正如周老師的名言:“體現(xiàn)你水平的地方是把難的東西講容易了,而不是把容易的東西講難,想把一個東西講難實在太簡單”;

不推薦,Pattern Recognition And Machine Learning:當(dāng)前階段不推薦。PRML是以貝葉斯的觀點看待很多機器學(xué)習(xí)方法,這也是它的一大特色。但對于初學(xué)者來說,這種觀點其實并無必要。而且此書沒有中文翻譯,當(dāng)前階段硬啃很容易放棄;

6.開源項目

當(dāng)知識儲備較為充足時,學(xué)習(xí)可以再次轉(zhuǎn)入實踐階段。這時候的實踐仍然可以分兩步走,學(xué)習(xí)經(jīng)典的開源項目或者發(fā)表高質(zhì)量的論文。開源項目的學(xué)習(xí)應(yīng)該以盡量 以優(yōu)化為目的,單純?yōu)樽x代碼而學(xué)習(xí)效果往往不太好。好的開源項目都可以在Github 里搜索。這里以深度學(xué)習(xí)為例。深度學(xué)習(xí)的開源優(yōu)秀庫有很多,例如torch,theano等等,這里列舉其中的兩個:

推薦,DeepLearnToolbox:較早的一個深度學(xué)習(xí)庫,用matlab語言撰寫,較為適合從剛學(xué)習(xí)的課程轉(zhuǎn)入學(xué)習(xí)。遺憾的是作者不再維護它了;

推薦,tensorflow:Google的開源庫,時至今日,已經(jīng)有40000多個star,非常驚人,支持移動設(shè)備。

7.會議論文

較好的課程都會推薦你一些論文。一些著名的技術(shù)與方法往往誕生于一些重要的會議。因此,看往年的會議論文是深入學(xué)習(xí)的方法。在這時,一些論文中的內(nèi)容會驅(qū)使你學(xué)習(xí)數(shù)學(xué)中你不擅長的部分。有時候你會覺得數(shù)學(xué)知識儲備不夠,因此往往需要學(xué)習(xí)一些輔助課程。

當(dāng)你看完足夠的論文以后,在這個階段,如果是在校學(xué)生,可以選擇某個課題,以發(fā)論文為目的來學(xué)習(xí)研究。一般來說,論文是工作的產(chǎn)物。有時候一篇基于實驗的論文往往需要你寫代碼或者基于開源項目。因此開源項目的學(xué)習(xí)與會議論文的工作兩者之間是有相關(guān)的。

兩者可以同時進行學(xué)習(xí)。關(guān)于在哪里看論文,可以看一下CCF推薦排名,了解一下這個領(lǐng)域里有哪些優(yōu)秀的會議。

下面介紹兩個圖像與機器學(xué)習(xí)領(lǐng)域的著名頂級會議:

CVPR:與另兩個會議ICCV和ECCV合稱計算機視覺領(lǐng)域的三大會,注意會議每年的主頁是變動的,因此搜索需要加上年份;

Conference on Neural Information Processing Systems:簡稱NIPS,許多重要的工作發(fā)表在這上面,例如關(guān)于CNN的一篇重要論文就是發(fā)表在上面。

8.自由學(xué)習(xí)

到這里了,可以說是進入這個門了。下面可以依據(jù)興趣來自由學(xué)習(xí)。前階段不推薦的學(xué)習(xí)資源也可隨意學(xué)習(xí),下面是點評:

cs229:Ng寫的講義很不錯,其中關(guān)于SVM的推導(dǎo)部分很清晰,想學(xué)習(xí)SVM推薦;

Neural Networks for Machine Learning:大牛的視角跟人就是不一樣,看看Hinton對神經(jīng)網(wǎng)絡(luò)是怎么看的,往往會讓你有種原來如此的感悟。其實看這門課程也等同于讀論文,因為幾乎每節(jié)課的參考資料里都有論文要你讀;

CS231n: Convolutional Neural Networks for Visual Recognition:最新的知識,還有詳細(xì)的作業(yè)。國內(nèi)應(yīng)該有團隊對字幕進行了翻譯,可以找找;

PRML:作為一門經(jīng)典的機器學(xué)習(xí)書籍,是很有閱讀必要的,會讓你對機器學(xué)習(xí)擁有一個其他的觀察視角;

五、 總結(jié)

本文的目的是幫助對AI領(lǐng)域了解不深,但又想進入的同學(xué)踏入這個門。這里只說踏入,是因為這個領(lǐng)域的專精實在非常困難,需要數(shù)年的積累與努力。在進行領(lǐng)域?qū)W習(xí)前,充分認(rèn)識自己的特點,制定合適的學(xué)習(xí)方法是十分重要的。

首先得對這個領(lǐng)域進行充分了解,培養(yǎng)興趣。在學(xué)習(xí)時,保持著循序漸進的學(xué)習(xí)方針,不要猛進的學(xué)習(xí)過難資源;結(jié)合著學(xué)習(xí)與實踐相輔的策略,不要只讀只看,實際動手才有成就感。學(xué)習(xí)某個資源時要有充分的目的,不是為了學(xué)開源項目而看代碼,而是為了寫開源項目而看;不是為了發(fā)論文而寫論文,而是為了做事情而寫論文。

如果一個學(xué)習(xí)資源對你過難,并不代表一定是你的問題,可能是學(xué)習(xí)資源的演講或撰寫人的問題。能把難的問題講簡單的人才是真正有水 平的人。所以,一定要學(xué)習(xí)優(yōu)質(zhì)資源,而不是不分青紅皂白的學(xué)習(xí)。最后,牢記以興趣來學(xué)習(xí)。學(xué)習(xí)的時間很長,過程也很艱難,而只有興趣才是讓你持之以恒,攻克難關(guān)的最佳助力。

謹(jǐn)以此文與在學(xué)海中乘舟的諸位共勉。我就是一名普通工程師,剛剛轉(zhuǎn)入AI領(lǐng)域,還有很多不足。希望此文可以幫助到大家。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉