當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 本書節(jié)選自圖書,Python本身帶有許多機(jī)器學(xué)習(xí)的第三方庫,但本書在絕大多數(shù)情況下只會(huì)用到Numpy這個(gè)基礎(chǔ)的科學(xué)計(jì)算庫來進(jìn)行算法代碼的實(shí)現(xiàn)。這樣做的目的是希望讀者能夠從實(shí)現(xiàn)的過程中更好地理解機(jī)

本書節(jié)選自圖書,Python本身帶有許多機(jī)器學(xué)習(xí)的第三方庫,但本書在絕大多數(shù)情況下只會(huì)用到Numpy這個(gè)基礎(chǔ)的科學(xué)計(jì)算庫來進(jìn)行算法代碼的實(shí)現(xiàn)。這樣做的目的是希望讀者能夠從實(shí)現(xiàn)的過程中更好地理解機(jī)器學(xué)習(xí)算法的細(xì)節(jié),以及了解Numpy的各種應(yīng)用。不過作為補(bǔ)充,本書會(huì)在適當(dāng)?shù)臅r(shí)候應(yīng)用scikit-learn這個(gè)成熟的第三方庫中的模型。

“機(jī)器學(xué)習(xí)”在最近雖可能不至于到人盡皆知的程度,卻也是非?;馃岬脑~匯。機(jī)器學(xué)習(xí)是英文單詞“Machine Learning”(簡稱ML)的直譯,從字面上便說明了這門技術(shù)是讓機(jī)器進(jìn)行“學(xué)習(xí)”的技術(shù)。然而我們知道機(jī)器終究是死的,所謂的“學(xué)習(xí)”歸根結(jié)底亦只是人類“賦予”機(jī)器的一系列運(yùn)算。這個(gè)“賦予”的過程可以有很多種實(shí)現(xiàn),而Python正是其中相對(duì)容易上手、同時(shí)性能又相當(dāng)不錯(cuò)的一門語言。本文打算先談?wù)剻C(jī)器學(xué)習(xí)相關(guān)的一些比較寬泛的知識(shí),再介紹并說明為何要使用Python來作為機(jī)器學(xué)習(xí)的工具。最后,我們會(huì)提供一個(gè)簡短易懂的、具有實(shí)際意義的例子來給大家提供一個(gè)直觀的感受。

具體而言,本章主要涉及的知識(shí)點(diǎn)有:

機(jī)器學(xué)習(xí)的定義及重要性;

Python在機(jī)器學(xué)習(xí)領(lǐng)域的優(yōu)異性;

如何在電腦上配置Python機(jī)器學(xué)習(xí)的環(huán)境;

機(jī)器學(xué)習(xí)一般性的步驟。

機(jī)器學(xué)習(xí)緒論
正如前言所說,由于近期的各種最新成果,使得“機(jī)器學(xué)習(xí)”成為了非常熱門的詞匯。機(jī)器學(xué)習(xí)在各種領(lǐng)域的優(yōu)異表現(xiàn)(圍棋界的Master是其中最具代表性的存在),使得各行各業(yè)的人們都或多或少地對(duì)機(jī)器學(xué)習(xí)產(chǎn)生了興趣與敬畏。然而與此同時(shí),對(duì)機(jī)器學(xué)習(xí)有所誤解的群體也日益壯大;他們或?qū)C(jī)器學(xué)習(xí)想得過于神秘,或?qū)⑺氲眠^于萬能。本節(jié)擬對(duì)機(jī)器學(xué)習(xí)進(jìn)行一般性的介紹,同時(shí)會(huì)說明機(jī)器學(xué)習(xí)中一些常見的術(shù)語以方便之后章節(jié)的敘述。

什么是機(jī)器學(xué)習(xí)

清晨的一句“今天天氣真好”、朋友之間的寒暄“你剛剛是去吃飯了吧”、考試過后的感嘆“復(fù)習(xí)了那么久終有收獲”……這些日常生活中隨處可見的話語,其背后卻已蘊(yùn)含了“學(xué)習(xí)”的思想—它們都是利用以往的經(jīng)驗(yàn)、對(duì)未知的新情況作出的有效的決策。而把這個(gè)決策的過程交給計(jì)算機(jī)來做,可以說就是“機(jī)器學(xué)習(xí)”的一個(gè)最淺白的定義。

我們或許可以先說說機(jī)器學(xué)習(xí)與以往的計(jì)算機(jī)工作樣式有什么不同。傳統(tǒng)的計(jì)算機(jī)如果想要得到某個(gè)結(jié)果,需要人類賦予它一串實(shí)打?qū)嵉闹噶?,然后?jì)算機(jī)就根據(jù)這串指令一步步地執(zhí)行下去。這個(gè)過程中的因果關(guān)系非常明確,只要人類的理解不出偏差,運(yùn)行結(jié)果是可以準(zhǔn)確預(yù)測的。但是在機(jī)器學(xué)習(xí)中,這一傳統(tǒng)樣式被打破了:計(jì)算機(jī)確實(shí)仍然需要人類賦予它一串指令,但這串指令往往不能直接得到結(jié)果;相反,它是一串賦予了機(jī)器“學(xué)習(xí)能力”的指令。在此基礎(chǔ)上,計(jì)算機(jī)需要進(jìn)一步地接受“數(shù)據(jù)”,并根據(jù)之前人類賦予它的“學(xué)習(xí)能力”,從中“學(xué)習(xí)”出最終的結(jié)果。這個(gè)結(jié)果往往是無法僅僅通過直接編程得出的。因此這里就導(dǎo)出了稍微深一點(diǎn)的機(jī)器學(xué)習(xí)的定義:它是一種讓計(jì)算機(jī)利用數(shù)據(jù)而非指令來進(jìn)行各種工作的方法。在這背后,最關(guān)鍵的就是“統(tǒng)計(jì)”的思想,它所推崇的“相關(guān)而非因果”的概念是機(jī)器學(xué)習(xí)的理論根基。在此基礎(chǔ)上,機(jī)器學(xué)習(xí)可以說是計(jì)算機(jī)使用輸入給它的數(shù)據(jù),利用人類賦予它的算法得到某種模型的過程,其最終的目的則是使用該模型,預(yù)測未來未知數(shù)據(jù)的信息。

既然提到了統(tǒng)計(jì),那么一定的數(shù)學(xué)理論就不可或缺。相關(guān)的、比較簡短的定義會(huì)在第4章給出(PAC框架),這里我們就先只敘述機(jī)器學(xué)習(xí)在統(tǒng)計(jì)理論下的、比較深刻的本質(zhì):它追求的是合理的假設(shè)空間(Hypothesis Space)的選取和模型的泛化(GeneralizaTIon)能力。該句中出現(xiàn)了一些專用術(shù)語,詳細(xì)的定義會(huì)在介紹術(shù)語時(shí)提及,這里我們提供一個(gè)直觀的理解:

所謂的假設(shè)空間,就是我們的模型在數(shù)學(xué)上的“適用場合”。

所謂的泛化能力,就是我們的模型在未知數(shù)據(jù)上的表現(xiàn)。

注意:上述本質(zhì)上嚴(yán)格來說,應(yīng)該是PAC Learning的本質(zhì);在其余的理論框架下,機(jī)器學(xué)習(xí)是可以具有不同的內(nèi)核的。

從上面的討論可以看出,機(jī)器學(xué)習(xí)和人類思考的過程有或多或少的類似。事實(shí)上,我們?cè)诘?、第7章講的神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)和卷積神經(jīng)網(wǎng)絡(luò)(ConvoluTIonal Neural Network,CNN)背后確實(shí)有著相應(yīng)的神經(jīng)科學(xué)的理論背景。然而與此同時(shí)需要知道的是,機(jī)器學(xué)習(xí)并非是一個(gè)“會(huì)學(xué)習(xí)的機(jī)器人”和“具有學(xué)習(xí)能力的人造人”之類的,這一點(diǎn)從上面諸多討論也可以明晰(慚愧的是,筆者在第一次聽到“機(jī)器學(xué)習(xí)”四個(gè)字時(shí),腦海中浮現(xiàn)的正是一個(gè)“聰明的機(jī)器人”的圖像,甚至還幻想過它和人類一起生活的場景)。相反的,它是被人類利用的、用于發(fā)掘數(shù)據(jù)背后信息的工具。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉