人工智能之機器學(xué)習你有沒有掌握
我們經(jīng)??吹竭@幾個熱詞: 人工智能( ArtificialIntelligence )、機器學(xué)習( MachineLearning )和深度學(xué)習 (DeepLearning) ,但是它們之間究竟有什么 區(qū)別和聯(lián)系呢?
人工智能(AI)的根本在于智能,即如何為機器賦予人的智能,這是一個非常大的范圍。
機器學(xué)習(ML)是指通過數(shù)據(jù)訓(xùn)練出能完成一定功能的模型,是實現(xiàn)人工智能的手段之一,也是目前最主流的人工智能實現(xiàn)方法。人工智能是科學(xué),機器學(xué)習是讓機器變得更加智能的方法或算法。
深度學(xué)習(DL)是機器學(xué)習的一個分支。深度即層數(shù),超過 8 層的神經(jīng)網(wǎng)絡(luò)模型就叫深度學(xué)習。深度學(xué)習也是當下最流行的機器學(xué)習的一種。目前在語音、圖像等領(lǐng)域取得了很好的效果。
三者之間是從大到小的包含關(guān)系。
今天重點介紹一下機器學(xué)習ML。
機器學(xué)習直接來源于早期的人工智能領(lǐng)域。
機器學(xué)習為什么如此重要?機器學(xué)習之所以成為人工智能背后的強勁動力是在于一個重大突破--互聯(lián)網(wǎng)的發(fā)明?;ヂ?lián)網(wǎng)有大量的數(shù)字信息被生成存儲和分析。機器學(xué)習算法在這些大數(shù)據(jù)方面是最有效的。
機器學(xué)習最基本的做法,是使用算法來解析數(shù)據(jù)、從中學(xué)習,然后對真實世界中的事件做出決策和預(yù)測。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,機器學(xué)習是用大量的數(shù)據(jù)來“訓(xùn)練”,通過各種算法從數(shù)據(jù)中學(xué)習如何完成任務(wù)。機器學(xué)習則是機器通過大數(shù)據(jù)的輸入,從中主動尋求規(guī)律,驗證規(guī)律,最后得出結(jié)論,機器據(jù)此結(jié)論來自主解決問題,如果出現(xiàn)了偏差,會自主糾錯。
什么是機器學(xué)習呢?
機器學(xué)習ML(Machine Learning)是一門人工智能的學(xué)科,一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。
機器學(xué)習ML是人工智能的核心,是使計算機具有智能的根本途徑,其應(yīng)用遍及人工智能的各個領(lǐng)域,它主要使用歸納、綜合而不是演繹。
ML defined byLangley(1996) - Machine learning is a science of the artificial. Thefield‘s main objects of study are arTIfacts, specifically algorithms that improvetheir performance with experience.
ML defined byTom Mitchell (1997)- Machine Learning is the study of computeralgorithms that improve automaTIcally through experience.
ML defined byAlpaydin(2004) - Machine learning is programming computers to opTImize aperformance criterion using example data or past experience.
機器學(xué)習的本質(zhì)是空間搜索和函數(shù)的泛化。無論使用哪種機器學(xué)習模型,都要經(jīng)歷要經(jīng)歷“建立模型”,“訓(xùn)練模型”,“反饋”,“應(yīng)用”的過程。而這個過程,跟一個嬰兒認識世界,獲取知識的過程是一樣的。培養(yǎng)機器建立人的認識的過程,就是“機器學(xué)習”。
機器學(xué)習常見分類:
1)有監(jiān)督學(xué)習(supervised learning):從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習出一個函數(shù),當新的數(shù)據(jù)到來時,可以根據(jù)這個函數(shù)預(yù)測結(jié)果。主要應(yīng)用于分類和預(yù)測。監(jiān)督學(xué)習的訓(xùn)練集要求是包括輸入和輸出,也可以說是特征和目標。訓(xùn)練集中的目標是由人標注的。常用算法包括人工神經(jīng)網(wǎng)絡(luò)(ArTIficial neural network)、貝葉斯(Bayesian) 、決策樹(Decision Tree)和線性分類(Linear classifier)等 。
2)無監(jiān)督學(xué)習(unsupervised learning):與監(jiān)督學(xué)習相比,訓(xùn)練集沒有人為標注的結(jié)果。又稱歸納性學(xué)習(clustering)利用K方式(Kmeans),建立中心(centriole),通過循環(huán)和遞減運算(iteration&descent)來減小誤差,達到分類的目的。常用算法包括人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network)、關(guān)聯(lián)規(guī)則學(xué)習(Association rule learning)、分層聚類 Hierarchical clustering 和異常檢測(Anomaly detection) 等 。
3)半監(jiān)督學(xué)習(semi- supervised learning):介于監(jiān)督學(xué)習與無監(jiān)督學(xué)習之間。結(jié)合了大量未標記的數(shù)據(jù)和少量標簽數(shù)據(jù)。常用算法包括包括生成模型(Generative models)、低密度分離(Low-density separation)和聯(lián)合訓(xùn)練Co-training等。
4)強化學(xué)習(Reinforcement learning):在這種學(xué)習模式下,輸入數(shù)據(jù)作為對模型的反饋,不像監(jiān)督模型那樣,輸入數(shù)據(jù)僅僅是作為一個檢查模型對錯的方式,在強化學(xué)習下,輸入數(shù)據(jù)直接反饋到模型,模型必須對此立刻作出調(diào)整。常見的應(yīng)用場景包括動態(tài)系統(tǒng)以及機器人控制等。常見算法包括Q-Learning、時間差學(xué)習(Temporal difference learning)和學(xué)習自動 Learning Automata等。
機器學(xué)習研究內(nèi)容主要包括三個方面:
(1)面向任務(wù)的研究:研究和分析改進一組預(yù)定任務(wù)的執(zhí)行性能的學(xué)習系統(tǒng)。
(2)認知模型:研究人類學(xué)習過程并進行計算機模擬。
(3)理論分析:從理論上探索各種可能的學(xué)習方法和獨立于應(yīng)用領(lǐng)域的算法。
機器學(xué)習研究領(lǐng)域集中于兩個范疇:
(1)分類任務(wù)要求系統(tǒng)依據(jù)已知的分類知識對輸入的未知模式作分析,以確定輸入模式的類屬。相應(yīng)的學(xué)習目標就是學(xué)習用于分類的準則(如分類規(guī)則)。
(2)問題求解任務(wù)要求對于給定的目標狀態(tài),尋找一個將當前狀態(tài)轉(zhuǎn)換為目標狀態(tài)的動作序列;機器學(xué)習在這一領(lǐng)域的研究工作大部分集中于通過學(xué)習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發(fā)式知識等)。
機器學(xué)習應(yīng)用廣泛,如:計算機視覺、自然語言處理、生物特征識別、數(shù)據(jù)挖掘、搜索引擎、自動駕駛、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、專家系統(tǒng)、認知模擬、規(guī)劃和問題求解、戰(zhàn)略游戲和機器人等。
機器學(xué)習各種方法的應(yīng)用范圍不斷擴大,一部分已形成商品。歸納學(xué)習的知識獲取工具已在診斷分類型專家系統(tǒng)中廣泛使用。連接學(xué)習在聲圖文識別中占優(yōu)勢。分析學(xué)習已用于設(shè)計綜合型專家系統(tǒng)。遺傳算法與強化學(xué)習在工程控制中有較好的應(yīng)用前景。與符號系統(tǒng)耦合的神經(jīng)網(wǎng)絡(luò)連接學(xué)習將在企業(yè)的智能管理與智能機器人運動規(guī)劃中發(fā)揮作用。
機器學(xué)習是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究領(lǐng)域,也是人工智能和神經(jīng)計算的核心研究課題之一?,F(xiàn)有的計算機系統(tǒng)和人工智能系統(tǒng)沒有什么學(xué)習能力,至多也只有非常有限的學(xué)習能力,因而不能滿足科技和生產(chǎn)提出的新要求。對機器學(xué)習的討論和機器學(xué)習研究的進展,必將促使人工智能和整個科學(xué)技術(shù)的進一步發(fā)展。
結(jié)語
機器學(xué)習是一門人工智能的科學(xué),該領(lǐng)域的主要研究對象是人工智能,特別是如何在經(jīng)驗學(xué)習中改善具體算法的性能。機器學(xué)習是人工智能的組成部分,是人工智能的核心和前沿。機器學(xué)習的進展將不斷推動人工智能向前發(fā)展。