人工智能之機器學(xué)習你有沒有掌握

時間：2020-04-28 23:03:01

關(guān)鍵字：人工智能機器學(xué)習 MACHINE ARTIFICIAL

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 我們經(jīng)?？吹竭@幾個熱詞：人工智能（ ArtificialIntelligence ）、機器學(xué)習（ MachineLearning ）和深度學(xué)習（DeepLearning），但是它們之間究竟

我們經(jīng)?？吹竭@幾個熱詞：人工智能（ ArtificialIntelligence ）、機器學(xué)習（ MachineLearning ）和深度學(xué)習（DeepLearning），但是它們之間究竟有什么區(qū)別和聯(lián)系呢？

人工智能（AI）的根本在于智能，即如何為機器賦予人的智能，這是一個非常大的范圍。

機器學(xué)習（ML）是指通過數(shù)據(jù)訓(xùn)練出能完成一定功能的模型，是實現(xiàn)人工智能的手段之一，也是目前最主流的人工智能實現(xiàn)方法。人工智能是科學(xué)，機器學(xué)習是讓機器變得更加智能的方法或算法。

深度學(xué)習（DL）是機器學(xué)習的一個分支。深度即層數(shù)，超過 8 層的神經(jīng)網(wǎng)絡(luò)模型就叫深度學(xué)習。深度學(xué)習也是當下最流行的機器學(xué)習的一種。目前在語音、圖像等領(lǐng)域取得了很好的效果。

三者之間是從大到小的包含關(guān)系。

今天重點介紹一下機器學(xué)習ML。

機器學(xué)習直接來源于早期的人工智能領(lǐng)域。

機器學(xué)習為什么如此重要？機器學(xué)習之所以成為人工智能背后的強勁動力是在于一個重大突破--互聯(lián)網(wǎng)的發(fā)明?；ヂ?lián)網(wǎng)有大量的數(shù)字信息被生成存儲和分析。機器學(xué)習算法在這些大數(shù)據(jù)方面是最有效的。

機器學(xué)習最基本的做法，是使用算法來解析數(shù)據(jù)、從中學(xué)習，然后對真實世界中的事件做出決策和預(yù)測。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同，機器學(xué)習是用大量的數(shù)據(jù)來“訓(xùn)練”，通過各種算法從數(shù)據(jù)中學(xué)習如何完成任務(wù)。機器學(xué)習則是機器通過大數(shù)據(jù)的輸入，從中主動尋求規(guī)律，驗證規(guī)律，最后得出結(jié)論，機器據(jù)此結(jié)論來自主解決問題，如果出現(xiàn)了偏差，會自主糾錯。

什么是機器學(xué)習呢？

機器學(xué)習ML（Machine Learning）是一門人工智能的學(xué)科，一門多領(lǐng)域交叉學(xué)科，涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習行為，以獲取新的知識或技能，重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。

機器學(xué)習ML是人工智能的核心，是使計算機具有智能的根本途徑，其應(yīng)用遍及人工智能的各個領(lǐng)域，它主要使用歸納、綜合而不是演繹。

ML defined byLangley（1996） - Machine learning is a science of the artificial. Thefield‘s main objects of study are arTIfacts， specifically algorithms that improvetheir performance with experience.

ML defined byTom Mitchell （1997）- Machine Learning is the study of computeralgorithms that improve automaTIcally through experience.

ML defined byAlpaydin（2004） - Machine learning is programming computers to opTImize aperformance criterion using example data or past experience.

機器學(xué)習的本質(zhì)是空間搜索和函數(shù)的泛化。無論使用哪種機器學(xué)習模型，都要經(jīng)歷要經(jīng)歷“建立模型”，“訓(xùn)練模型”，“反饋”，“應(yīng)用”的過程。而這個過程，跟一個嬰兒認識世界，獲取知識的過程是一樣的。培養(yǎng)機器建立人的認識的過程，就是“機器學(xué)習”。

機器學(xué)習常見分類：

1）有監(jiān)督學(xué)習（supervised learning）：從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習出一個函數(shù)，當新的數(shù)據(jù)到來時，可以根據(jù)這個函數(shù)預(yù)測結(jié)果。主要應(yīng)用于分類和預(yù)測。監(jiān)督學(xué)習的訓(xùn)練集要求是包括輸入和輸出，也可以說是特征和目標。訓(xùn)練集中的目標是由人標注的。常用算法包括人工神經(jīng)網(wǎng)絡(luò)（ArTIficial neural network）、貝葉斯（Bayesian）、決策樹（Decision Tree）和線性分類（Linear classifier）等。

2）無監(jiān)督學(xué)習（unsupervised learning）：與監(jiān)督學(xué)習相比，訓(xùn)練集沒有人為標注的結(jié)果。又稱歸納性學(xué)習（clustering）利用K方式（Kmeans），建立中心（centriole），通過循環(huán)和遞減運算（iteration&descent）來減小誤差，達到分類的目的。常用算法包括人工神經(jīng)網(wǎng)絡(luò)（Artificial neural network）、關(guān)聯(lián)規(guī)則學(xué)習（Association rule learning）、分層聚類 Hierarchical clustering 和異常檢測（Anomaly detection）等。

3）半監(jiān)督學(xué)習（semi- supervised learning）：介于監(jiān)督學(xué)習與無監(jiān)督學(xué)習之間。結(jié)合了大量未標記的數(shù)據(jù)和少量標簽數(shù)據(jù)。常用算法包括包括生成模型（Generative models）、低密度分離（Low-density separation）和聯(lián)合訓(xùn)練Co-training等。

4）強化學(xué)習（Reinforcement learning）：在這種學(xué)習模式下，輸入數(shù)據(jù)作為對模型的反饋，不像監(jiān)督模型那樣，輸入數(shù)據(jù)僅僅是作為一個檢查模型對錯的方式，在強化學(xué)習下，輸入數(shù)據(jù)直接反饋到模型，模型必須對此立刻作出調(diào)整。常見的應(yīng)用場景包括動態(tài)系統(tǒng)以及機器人控制等。常見算法包括Q-Learning、時間差學(xué)習（Temporal difference learning）和學(xué)習自動 Learning Automata等。

機器學(xué)習研究內(nèi)容主要包括三個方面：

（1）面向任務(wù)的研究：研究和分析改進一組預(yù)定任務(wù)的執(zhí)行性能的學(xué)習系統(tǒng)。

（2）認知模型：研究人類學(xué)習過程并進行計算機模擬。

（3）理論分析：從理論上探索各種可能的學(xué)習方法和獨立于應(yīng)用領(lǐng)域的算法。

機器學(xué)習研究領(lǐng)域集中于兩個范疇：

（1）分類任務(wù)要求系統(tǒng)依據(jù)已知的分類知識對輸入的未知模式作分析，以確定輸入模式的類屬。相應(yīng)的學(xué)習目標就是學(xué)習用于分類的準則（如分類規(guī)則）。

（2）問題求解任務(wù)要求對于給定的目標狀態(tài)，尋找一個將當前狀態(tài)轉(zhuǎn)換為目標狀態(tài)的動作序列；機器學(xué)習在這一領(lǐng)域的研究工作大部分集中于通過學(xué)習來獲取能提高問題求解效率的知識（如搜索控制知識，啟發(fā)式知識等）。

機器學(xué)習應(yīng)用廣泛，如：計算機視覺、自然語言處理、生物特征識別、數(shù)據(jù)挖掘、搜索引擎、自動駕駛、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、專家系統(tǒng)、認知模擬、規(guī)劃和問題求解、戰(zhàn)略游戲和機器人等。

機器學(xué)習各種方法的應(yīng)用范圍不斷擴大，一部分已形成商品。歸納學(xué)習的知識獲取工具已在診斷分類型專家系統(tǒng)中廣泛使用。連接學(xué)習在聲圖文識別中占優(yōu)勢。分析學(xué)習已用于設(shè)計綜合型專家系統(tǒng)。遺傳算法與強化學(xué)習在工程控制中有較好的應(yīng)用前景。與符號系統(tǒng)耦合的神經(jīng)網(wǎng)絡(luò)連接學(xué)習將在企業(yè)的智能管理與智能機器人運動規(guī)劃中發(fā)揮作用。

機器學(xué)習是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究領(lǐng)域，也是人工智能和神經(jīng)計算的核心研究課題之一?，F(xiàn)有的計算機系統(tǒng)和人工智能系統(tǒng)沒有什么學(xué)習能力，至多也只有非常有限的學(xué)習能力，因而不能滿足科技和生產(chǎn)提出的新要求。對機器學(xué)習的討論和機器學(xué)習研究的進展，必將促使人工智能和整個科學(xué)技術(shù)的進一步發(fā)展。

結(jié)語

機器學(xué)習是一門人工智能的科學(xué)，該領(lǐng)域的主要研究對象是人工智能，特別是如何在經(jīng)驗學(xué)習中改善具體算法的性能。機器學(xué)習是人工智能的組成部分，是人工智能的核心和前沿。機器學(xué)習的進展將不斷推動人工智能向前發(fā)展。