在被算法取代前,程序員或?qū)⒁驗(yàn)槲锢韺W(xué)家而更早消失
這不是成為物理學(xué)家的好時(shí)機(jī)。
上面這句話是 Oscar Boykin 說的。他曾在喬治亞理工學(xué)院學(xué)習(xí)物理學(xué),2002年在加州大學(xué)洛杉磯分校完成物理學(xué)博士學(xué)位。四年前,瑞士大型強(qiáng)子對(duì)撞機(jī)(LHC)的物理學(xué)家們探測(cè)到希格斯玻色子(Higgs boson),這是20世紀(jì)60年代首次提出的亞原子粒子。正如 Boykin 所指出的,每個(gè)物理學(xué)家都渴望發(fā)現(xiàn)它。但是,希格斯玻色子的發(fā)現(xiàn)并沒有擾亂宇宙的理論模型。它沒有改變?nèi)魏螙|西,也沒有給物理學(xué)家?guī)砣魏涡碌呐Ψ较颉?ldquo;當(dāng)物理學(xué)中出現(xiàn)了什么問題時(shí),物理學(xué)家們會(huì)很興奮;但現(xiàn)在的情況是,物理學(xué)中沒有太多問題了。”Boykin 說,“對(duì)物理學(xué)家來說,這是個(gè)令人泄氣的領(lǐng)域。”再加上,物理學(xué)家的薪資也不高。
Boykin 不再當(dāng)物理學(xué)家了。他現(xiàn)在是硅谷的一名軟件工程師。這是成為軟件工程師的好時(shí)機(jī)。
Boykin 在 Stripe 公司工作,這是一家估值超過90億美元的創(chuàng)業(yè)公司,主要業(yè)務(wù)是幫助企業(yè)接受在線支付。Boykin 幫助構(gòu)建了公司的軟件系統(tǒng),該系統(tǒng)從公司提供的服務(wù)中收集數(shù)據(jù)。Boykin 的工作任務(wù)是對(duì)這些服務(wù)未來可能發(fā)生的狀況進(jìn)行預(yù)測(cè),包括預(yù)測(cè)何時(shí)、何地、以何種方式將可能發(fā)生欺詐性交易。作為一名物理學(xué)家,Boykin 非常適合這項(xiàng)工作,它需要非常多的數(shù)學(xué)知識(shí)和很好的抽象思維能力。不像物理學(xué)家,Boykin 現(xiàn)在工作的領(lǐng)域是一個(gè)能提供無限挑戰(zhàn)和可能性的領(lǐng)域。而且,薪資也非??捎^。
如果物理學(xué)和軟件工程是亞原子粒子,那么硅谷就是它們發(fā)生碰撞的地方。除了 Boykin 之外,Stripe 的其他三位工程師也是物理學(xué)家出身。去年12月,通用電氣收購(gòu)機(jī)器學(xué)習(xí)創(chuàng)業(yè)公司 Wise.io 時(shí),首席執(zhí)行官 Jeff Immelt 自豪地說他得到了一家全是物理學(xué)家的公司,其中最著名的是加州大學(xué)天體物理學(xué)家 Joshua Bloom。開源機(jī)器學(xué)習(xí)平臺(tái) H20,其用戶有來自世界各地的70000名數(shù)據(jù)科學(xué)家,是在曾在 SLAC 國(guó)家加速器實(shí)驗(yàn)室工作的瑞士物理學(xué)家 Arno Candel 的幫助下建立的。微軟的數(shù)據(jù)科學(xué)主管 Vijay Narayanan 是一名天體物理學(xué)家,他手下的幾名研究員也都是物理學(xué)家。
這不是偶發(fā)事件。Stripe 總裁兼聯(lián)合創(chuàng)始人 John Collison 說:“我們并不是特意跑到大學(xué),然后找來一群物理學(xué)家。事情只是自然而然地變成這樣了。”而且,這是發(fā)生在硅谷的變化。因?yàn)椴还茉诮Y(jié)構(gòu)上還是技術(shù)上,互聯(lián)網(wǎng)公司所做的事情越來越適合物理學(xué)家所擁有的技能。
物理學(xué)家進(jìn)入計(jì)算機(jī)領(lǐng)域是非常自然的
當(dāng)然了,物理學(xué)家從很早以來就在計(jì)算機(jī)技術(shù)方面發(fā)揮了重要的作用,就像他們?cè)谄渌S多領(lǐng)域也有著重要作用一樣。幫助設(shè)計(jì)了最早的計(jì)算機(jī)之一的 ENIAC 的 John Mauchly 是物理學(xué)家。發(fā)明 C 語言的 Dennis Ritchie 也是物理學(xué)家。
但是對(duì)打算進(jìn)入計(jì)算機(jī)科學(xué)領(lǐng)域的物理學(xué)家來說,現(xiàn)在是一個(gè)特別成熟的時(shí)機(jī)。這是由于機(jī)器學(xué)習(xí)的興起,機(jī)器需要通過分析大量數(shù)據(jù)來學(xué)習(xí)任務(wù),這種新興的數(shù)據(jù)科學(xué)和 AI 正是最適合物理學(xué)家的方向。
此外,業(yè)界已經(jīng)開始廣泛采納神經(jīng)網(wǎng)絡(luò)技術(shù),這是模仿人類大腦結(jié)構(gòu)的數(shù)學(xué)模型或計(jì)算模型。但這些神經(jīng)網(wǎng)絡(luò)其實(shí)是大規(guī)模的數(shù)學(xué),主要是線性代數(shù)和概率論。計(jì)算機(jī)科學(xué)家不一定擅長(zhǎng)這些數(shù)學(xué)領(lǐng)域,但物理學(xué)家相反。“對(duì)物理學(xué)家來說唯一需要從頭開始的是學(xué)習(xí)如何優(yōu)化這些神經(jīng)網(wǎng)絡(luò),以及訓(xùn)練它們,但這是相對(duì)簡(jiǎn)單的。”Boykin 說。方法之一是“牛頓法”(Newton’s method),此牛頓是指物理學(xué)家的牛頓。
微軟劍橋研究實(shí)驗(yàn)室主管 Chris Bishop 早在30年前就感受到了同樣的風(fēng)氣,當(dāng)時(shí)神經(jīng)網(wǎng)絡(luò)剛剛開始在學(xué)術(shù)界顯示出效果。這也是他從物理學(xué)轉(zhuǎn)到機(jī)器學(xué)習(xí)的原因,他說:“物理學(xué)家進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域是非常自然的,比計(jì)算機(jī)科學(xué)家更加自然。”
挑戰(zhàn)的空間
Boykin 說,十年前,他的許多物理學(xué)家朋友紛紛投身金融界。同樣,物理學(xué)家的數(shù)學(xué)才能在華爾街也非常吃香,數(shù)學(xué)是預(yù)測(cè)市場(chǎng)價(jià)值的方式之一。一種關(guān)鍵的方法是 Black-Scholes 模型,這是一種判斷金融衍生物價(jià)值的方法。但 Black-Scholes 模型也是助長(zhǎng)了2008年的金融危機(jī)的因素之一。Boykin 以及其他物理學(xué)家說,現(xiàn)在,他們的物理學(xué)家同事們更多地進(jìn)入了數(shù)據(jù)科學(xué)以及其他類型的計(jì)算機(jī)技術(shù)領(lǐng)域。
大約十年前,許多物理學(xué)家進(jìn)入頂尖的科技公司,協(xié)助建立所謂的大數(shù)據(jù)軟件,這些系統(tǒng)在數(shù)百甚至數(shù)千臺(tái)機(jī)器上處理數(shù)據(jù)。在 Twitter 公司,Boykin 主導(dǎo)設(shè)計(jì)了一個(gè)名為 Summingbird 的這樣的系統(tǒng);在另一家名為 Cloudant 的創(chuàng)業(yè)公司,三名認(rèn)識(shí)于 MIT 物理系的研究者也創(chuàng)建了類似的軟件。物理學(xué)家們知道如何處理數(shù)據(jù)。在 MIT,Cloudant 的創(chuàng)始人就在處理來自大型強(qiáng)子對(duì)撞機(jī)的大量數(shù)據(jù)集,而構(gòu)建這些非常復(fù)雜的系統(tǒng)需要有很強(qiáng)的抽象思維。然后,一旦這些系統(tǒng)建立起來,許多物理學(xué)家就能直接利用這些數(shù)據(jù)。
在 Google 的早期,在機(jī)房中為公司構(gòu)建大規(guī)模分布式系統(tǒng)的關(guān)鍵人物之一是 Yonatan Zunger,他擁有斯坦福大學(xué)弦理論(string theory)博士學(xué)位。Kevin Scott 加入 Google 的廣告團(tuán)隊(duì)時(shí),他的職責(zé)是從 Google 的各業(yè)務(wù)中獲取數(shù)據(jù),并利用這些數(shù)據(jù)預(yù)測(cè)投放哪些廣告能獲得最多的點(diǎn)擊量。為此,他聘請(qǐng)了無數(shù)的物理學(xué)家。不像許多計(jì)算機(jī)科學(xué)家,物理學(xué)家們非常適合機(jī)器學(xué)習(xí)的實(shí)驗(yàn)性質(zhì)?,F(xiàn)任 LinkedIn 首席技術(shù)官的 Scott 說,“這(機(jī)器學(xué)習(xí))簡(jiǎn)直就像一門實(shí)驗(yàn)科學(xué)。”
現(xiàn)在大數(shù)據(jù)軟件已經(jīng)很常見了——Stripe 使用的是 Boykin 在 Twitter 時(shí)設(shè)計(jì)的 Summingbird 的開源版本,該框架也幫助機(jī)器學(xué)習(xí)模型驅(qū)動(dòng)了許多其他公司的預(yù)測(cè)。這為物理學(xué)家們提供了進(jìn)入硅谷的更廣闊的道路。在 Stripe,Boykin 的團(tuán)隊(duì)還包括 Roban Kramer(物理學(xué)博士,哥倫比亞大學(xué)),Christian Anderson(物理學(xué)碩士,哈佛大學(xué))和 Kelley Rivoire(物理學(xué)學(xué)士,麻省理工學(xué)院)。他們來科技公司,因?yàn)樗麄冞m合這樣的工作。當(dāng)然,也因?yàn)殄X。正如 Boykin 說的:“科技公司的工資高得荒謬!”但他們來,還因?yàn)橛泻芏嗬щy的問題亟待他們解決。
Anderson 在獲得博士學(xué)位之前就離開了哈佛,因?yàn)樗麑?duì)物理學(xué)這個(gè)領(lǐng)域的看法和 Boykin 如出一轍——是一種回報(bào)率遞減的知識(shí)追求。但互聯(lián)網(wǎng)不是這樣?;ヂ?lián)網(wǎng)的機(jī)會(huì)更多,有待解決的問題更多,挑戰(zhàn)的空間也更大。
未來
今天,物理學(xué)家正在侵入硅谷的公司。但在往后幾年,類似的現(xiàn)象會(huì)進(jìn)一步蔓延。機(jī)器學(xué)習(xí)不僅將在世界范圍里改變分析數(shù)據(jù)的方式,而且將改變構(gòu)建軟件的方式。神經(jīng)網(wǎng)絡(luò)已經(jīng)重塑了圖像識(shí)別、語音識(shí)別、機(jī)器翻譯以及軟件接口的本質(zhì)。正如微軟的 Chris Bishop 所說,軟件工程正在從基于邏輯的人工編碼轉(zhuǎn)向基于概率和不確定性的機(jī)器學(xué)習(xí)模型。Google、Facebook 這樣的公司紛紛開始用這種新的思維方式培訓(xùn)他們的工程師。最終,計(jì)算行業(yè)的其他公司也將跟上。
換句話說,物理學(xué)家們涌入硅谷當(dāng)工程師是一個(gè)更大的變化的跡象。不久,硅谷的工程師們又將涌回當(dāng)物理學(xué)家。