當(dāng)前位置:首頁 > 公眾號(hào)精選 > 嵌入式微處理器
[導(dǎo)讀]機(jī)器學(xué)習(xí)概覽 什么是機(jī)器學(xué)習(xí)? 機(jī)器通過分析大量數(shù)據(jù)來進(jìn)行學(xué)習(xí)。


Part 1

機(jī)器學(xué)習(xí)概覽


什么是機(jī)器學(xué)習(xí)?

機(jī)器通過分析大量數(shù)據(jù)來進(jìn)行學(xué)習(xí)。比如說,不需要通過編程來識(shí)別貓或人臉,它們可以通過使用圖片來進(jìn)行訓(xùn)練,從而歸納和識(shí)別特定的目標(biāo)。

機(jī)器學(xué)習(xí)和人工智能的關(guān)系

機(jī)器學(xué)習(xí)是一種重在尋找數(shù)據(jù)中的模式并使用這些模式來做出預(yù)測(cè)的研究和算法的門類。機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一部分,并且和知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘有所交集。

機(jī)器學(xué)習(xí)的工作方式


  • 選擇數(shù)據(jù):將你的數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù)
  • 模型數(shù)據(jù)使用訓(xùn)練數(shù)據(jù)來構(gòu)建使用相關(guān)特征的模型
  • 驗(yàn)證模型: 使用你的驗(yàn)證數(shù)據(jù)接入你的模型
  • 測(cè)試模型: 使用你的測(cè)試數(shù)據(jù)檢查被驗(yàn)證的模型的表現(xiàn)
  • 使用模型: 使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測(cè)
  • 調(diào)優(yōu)模型: 使用更多數(shù)據(jù)、不同的特征或調(diào)整過的參數(shù)來提升算法的性能表現(xiàn)

機(jī)器學(xué)習(xí)所處的位置


  • 傳統(tǒng)編程:軟件工程師編寫程序來解決問題。首先存在一些數(shù)據(jù)→為了解決一個(gè)問題,軟件工程師編寫一個(gè)流程來告訴機(jī)器應(yīng)該怎樣做→計(jì)算機(jī)遵照這一流程執(zhí)行,然后得出結(jié)果

  • 統(tǒng)計(jì)學(xué):分析師比較變量之間的關(guān)系

  • 機(jī)器學(xué)習(xí):數(shù)據(jù)科學(xué)家使用訓(xùn)練數(shù)據(jù)集來教計(jì)算機(jī)應(yīng)該怎么做,然后系統(tǒng)執(zhí)行該任務(wù)。首先存在大數(shù)據(jù)→機(jī)器會(huì)學(xué)習(xí)使用訓(xùn)練數(shù)據(jù)集來進(jìn)行分類,調(diào)節(jié)特定的算法來實(shí)現(xiàn)目標(biāo)分類→該計(jì)算機(jī)可學(xué)習(xí)識(shí)別數(shù)據(jù)中的關(guān)系、趨勢(shì)和模式

  • 智能應(yīng)用:智能應(yīng)用使用人工智能所得到的結(jié)果,如圖是一個(gè)精準(zhǔn)農(nóng)業(yè)的應(yīng)用案例示意,該應(yīng)用基于無人機(jī)所收集到的數(shù)據(jù)

機(jī)器學(xué)習(xí)的實(shí)際應(yīng)用

機(jī)器學(xué)習(xí)有很多應(yīng)用場景,這里給出了一些示例,你會(huì)怎么使用它?

  • 快速三維地圖測(cè)繪和建模:要建造一架鐵路橋,PwC的數(shù)據(jù)科學(xué)家和領(lǐng)域?qū)<覍C(jī)器學(xué)習(xí)應(yīng)用到了無人機(jī)收集到的數(shù)據(jù)上。這種組合實(shí)現(xiàn)了工作成功中的精準(zhǔn)監(jiān)控和快速反饋。

  • 增強(qiáng)分析以降低風(fēng)險(xiǎn):為了檢測(cè)內(nèi)部交易,PwC將機(jī)器學(xué)習(xí)和其它分析技術(shù)結(jié)合了起來,從而開發(fā)了更為全面的用戶概況,并且獲得了對(duì)復(fù)雜可疑行為的更深度了解。

  • 預(yù)測(cè)表現(xiàn)最佳的目標(biāo):PwC使用機(jī)器學(xué)習(xí)和其它分析方法來評(píng)估 Melbourne Cup 賽場上不同賽馬的潛力。

Part 2

機(jī)器學(xué)習(xí)的演化

幾十年來,人工智能研究者的各個(gè)「部落」一直以來都在彼此爭奪主導(dǎo)權(quán)?,F(xiàn)在是這些部落聯(lián)合起來的時(shí)候了嗎?他們也可能不得不這樣做,因?yàn)楹献骱退惴ㄈ诤鲜菍?shí)現(xiàn)真正通用人工智能(AGI)的唯一方式。這里給出了機(jī)器學(xué)習(xí)方法的演化之路以及未來的可能模樣。

五大流派

  • 符號(hào)主義:使用符號(hào)、規(guī)則和邏輯來表征知識(shí)和進(jìn)行邏輯推理,最喜歡的算法是:規(guī)則和決策樹

  • 貝葉斯派:獲取發(fā)生的可能性來進(jìn)行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫

  • 聯(lián)結(jié)主義:使用概率矩陣和加權(quán)神經(jīng)元來動(dòng)態(tài)地識(shí)別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡(luò)

  • 進(jìn)化主義:生成變化,然后為特定目標(biāo)獲取其中最優(yōu)的,最喜歡的算法是:遺傳算法

  • Analogizer:根據(jù)約束條件來優(yōu)化函數(shù)(盡可能走到更高,但同時(shí)不要離開道路),最喜歡的算法是:支持向量機(jī)

演化的階段

  • 1980年代 —— 主導(dǎo)流派:符號(hào)主義,架構(gòu):服務(wù)器或大型機(jī),主導(dǎo)理論:知識(shí)工程,基本決策邏輯:決策支持系統(tǒng),實(shí)用性有限

  • 1990年代到2000年 —— 主導(dǎo)流派:貝葉斯,架構(gòu):小型服務(wù)器集群,主導(dǎo)理論:概率論,分類:可擴(kuò)展的比較或?qū)Ρ?,?duì)許多任務(wù)都足夠好了

  • 2010年代早期到中期 —— 主導(dǎo)流派:聯(lián)結(jié)主義,架構(gòu):大型服務(wù)器農(nóng)場,主導(dǎo)理論:神經(jīng)科學(xué)和概率,識(shí)別:更加精準(zhǔn)的圖像和聲音識(shí)別、翻譯、情緒分析等

流派有望合作融合到一起

  • 2010年代末期 —— 主導(dǎo)流派:聯(lián)結(jié)主義+符號(hào)主義,架構(gòu):許多云,主導(dǎo)理論:記憶神經(jīng)網(wǎng)絡(luò)、大規(guī)模集成、基于知識(shí)的推理,簡單的問答:范圍狹窄的、領(lǐng)域特定的知識(shí)共享

  • 2020年代+ —— 主導(dǎo)流派:聯(lián)結(jié)主義+符號(hào)主義+貝葉斯+……,架構(gòu):云計(jì)算和霧計(jì)算,主導(dǎo)理論:感知的時(shí)候有網(wǎng)絡(luò),推理和工作的時(shí)候有規(guī)則,簡單感知、推理和行動(dòng):有限制的自動(dòng)化或人機(jī)交互

  • 2040年代+ —— 主導(dǎo)流派:算法融合,架構(gòu):無處不在的服務(wù)器,主導(dǎo)理論:最佳組合的元學(xué)習(xí),感知和響應(yīng):基于通過多種學(xué)習(xí)方式獲得的知識(shí)或經(jīng)驗(yàn)采取行動(dòng)或做出回答

Part 3

機(jī)器學(xué)習(xí)的算法

你應(yīng)該使用哪種機(jī)器學(xué)習(xí)算法?這在很大程度上依賴于可用數(shù)據(jù)的性質(zhì)和數(shù)量以及每一個(gè)特定用例中你的訓(xùn)練目標(biāo)。不要使用最復(fù)雜的算法,除非其結(jié)果值得付出昂貴的開銷和資源。這里給出了一些最常見的算法,按使用簡單程度排序。

決策樹

Decision Tree

在進(jìn)行逐步應(yīng)答過程中,典型的決策樹分析會(huì)使用分層變量或決策節(jié)點(diǎn),例如,可將一個(gè)給定用戶分類成信用可靠或不可靠。 優(yōu)點(diǎn): 擅長對(duì)人、地點(diǎn)、事物的一系列不同特征、品質(zhì)、特性進(jìn)行評(píng)估,場景舉例: 基于規(guī)則的信用評(píng)估、賽馬結(jié)果預(yù)測(cè)。

支持向量機(jī)

Support Vector Machine
基于超平面(hyperplane),支持向量機(jī)可以對(duì)數(shù)據(jù)群進(jìn)行分類。 優(yōu)點(diǎn): 支持向量機(jī)擅長在變量 X 與其它變量之間進(jìn)行二元分類操作,無論其關(guān)系是否是線性的,場景舉例: 新聞分類、手寫識(shí)別。


回歸

Regression

回歸可以勾畫出因變量與一個(gè)或多個(gè)因變量之間的狀態(tài)關(guān)系。在這個(gè)例子中,將垃圾郵件和非垃圾郵件進(jìn)行了區(qū)分。 優(yōu)點(diǎn): 回歸可用于識(shí)別變量之間的連續(xù)關(guān)系,即便這個(gè)關(guān)系不是非常明顯, 場景舉例: 路面交通流量分析、郵件過濾。

樸素貝葉斯分類

Naive Bayes Classification

樸素貝葉斯分類器用于計(jì)算可能條件的分支概率。每個(gè)獨(dú)立的特征都是「樸素」或條件獨(dú)立的,因此它們不會(huì)影響別的對(duì)象。例如,在一個(gè)裝有共 5 個(gè)黃色和紅色小球的罐子里,連續(xù)拿到兩個(gè)黃色小球的概率是多少?從圖中最上方分支可見,前后抓取兩個(gè)黃色小球的概率為 1/10。樸素貝葉斯分類器可以計(jì)算多個(gè)特征的聯(lián)合條件概率。
優(yōu)點(diǎn):對(duì)于在小數(shù)據(jù)集上有顯著特征的相關(guān)對(duì)象,樸素貝葉斯方法可對(duì)其進(jìn)行快速分類,場景舉例:情感分析、消費(fèi)者分類。


隱馬爾可夫模型

Hidden Markov model

隱馬爾可夫過程是完全確定性的 —— 一個(gè)給定的狀態(tài)經(jīng)常會(huì)伴隨另一個(gè)狀態(tài)。交通信號(hào)燈就是一個(gè)例子。相反,隱馬爾可夫模型通過分析可見數(shù)據(jù)來計(jì)算隱藏狀態(tài)的發(fā)生。隨后,借助隱藏狀態(tài)分析,隱馬爾可夫模型可以估計(jì)可能的未來觀察模式。在本例中,高或低氣壓的概率(這是隱藏狀態(tài))可用于預(yù)測(cè)晴天、雨天、多云天的概率。
優(yōu)點(diǎn):容許數(shù)據(jù)的變化性,適用于識(shí)別(recognition)和預(yù)測(cè)操作,場景舉例:面部表情分析、氣象預(yù)測(cè)。

隨機(jī)森林

Random forest

隨機(jī)森林算法通過使用多個(gè)帶有隨機(jī)選取的數(shù)據(jù)子集的樹(tree)改善了決策樹的精確性。本例在基因表達(dá)層面上考察了大量與乳腺癌復(fù)發(fā)相關(guān)的基因,并計(jì)算出復(fù)發(fā)風(fēng)險(xiǎn)。 優(yōu)點(diǎn): 隨機(jī)森林方法被證明對(duì)大規(guī)模數(shù)據(jù)集和存在大量且有時(shí)不相關(guān)特征的項(xiàng)(item)來說很有用,場景舉例: 用戶流失分析、風(fēng)險(xiǎn)評(píng)估。

循環(huán)神經(jīng)網(wǎng)絡(luò)

Recurrent neural network

在任意神經(jīng)網(wǎng)絡(luò)中,每個(gè)神經(jīng)元都通過 1 個(gè)或多個(gè)隱藏層來將很多輸入轉(zhuǎn)換成單個(gè)輸出。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)會(huì)將值進(jìn)一步逐層傳遞,讓逐層學(xué)習(xí)成為可能。換句話說,RNN 存在某種形式的記憶,允許先前的輸出去影響后面的輸入。
優(yōu)點(diǎn):循環(huán)神經(jīng)網(wǎng)絡(luò)在存在大量有序信息時(shí)具有預(yù)測(cè)能力,場景舉例:圖像分類與字幕添加、政治情感分析。

長短期記憶與門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)

LSTM & GRU nerual network

早期的 RNN 形式是會(huì)存在損耗的。盡管這些早期循環(huán)神經(jīng)網(wǎng)絡(luò)只允許留存少量的早期信息,新近的長短期記憶(LSTM)與門控循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)都有長期與短期的記憶。換句話說,這些新近的 RNN 擁有更好的控制記憶的能力,允許保留早先的值或是當(dāng)有必要處理很多系列步驟時(shí)重置這些值,這避免了「梯度衰減」或逐層傳遞的值的最終 degradation。LSTM 與 GRU 網(wǎng)絡(luò)使得我們可以使用被稱為「門(gate)」的記憶模塊或結(jié)構(gòu)來控制記憶,這種門可以在合適的時(shí)候傳遞或重置值。
優(yōu)點(diǎn):長短期記憶和門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)具備與其它循環(huán)神經(jīng)網(wǎng)絡(luò)一樣的優(yōu)點(diǎn),但因?yàn)樗鼈冇懈玫挠洃浤芰?,所以更常被使用,場景舉例:自然語言處理、翻譯。

卷積神經(jīng)網(wǎng)絡(luò)

convolutional neural network

卷積是指來自后續(xù)層的權(quán)重的融合,可用于標(biāo)記輸出層。 優(yōu)點(diǎn): 當(dāng)存在非常大型的數(shù)據(jù)集、大量特征和復(fù)雜的分類任務(wù)時(shí),卷積神經(jīng)網(wǎng)絡(luò)是非常有用的,場景舉例: 圖像識(shí)別、文本轉(zhuǎn)語音、藥物發(fā)現(xiàn)。


END

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請(qǐng)聯(lián)系我們,謝謝!

嵌入式ARM

掃描二維碼,關(guān)注更多精彩內(nèi)容

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉