機(jī)器學(xué)習(xí)包含哪些分類?大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)的現(xiàn)狀如何?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
在下述的內(nèi)容中,小編將會(huì)對(duì)機(jī)器學(xué)習(xí)的相關(guān)消息予以報(bào)道,如果機(jī)器學(xué)習(xí)是您想要了解的焦點(diǎn)之一,不妨和小編共同閱讀這篇文章哦。
一、大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)的研究現(xiàn)狀
大數(shù)據(jù)的價(jià)值體現(xiàn)主要集中在數(shù)據(jù)的轉(zhuǎn)向以及數(shù)據(jù)的信息處理能力等等。在產(chǎn)業(yè)發(fā)展的今天,大數(shù)據(jù)時(shí)代的到來(lái),對(duì)數(shù)據(jù)的轉(zhuǎn)換,數(shù)據(jù)的處理數(shù)據(jù)的存儲(chǔ)等帶來(lái)了更好的技術(shù)支持,產(chǎn)業(yè)升級(jí)和新產(chǎn)業(yè)誕生形成了一種推動(dòng)力量,讓大數(shù)據(jù)能夠針對(duì)可發(fā)現(xiàn)事物的程序進(jìn)行自動(dòng)規(guī)劃,實(shí)現(xiàn)人類用戶以計(jì)算機(jī)信息之間的協(xié)調(diào)。另外現(xiàn)有的許多機(jī)器學(xué)習(xí)方法是建立在內(nèi)存理論基礎(chǔ)上的。大數(shù)據(jù)還無(wú)法裝載進(jìn)計(jì)算機(jī)內(nèi)存的情況下,是無(wú)法進(jìn)行諸多算法的處理的,因此應(yīng)提出新的機(jī)器學(xué)習(xí)算法,以適應(yīng)大數(shù)據(jù)處理的需要。大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)算法,依據(jù)一定的性能標(biāo)準(zhǔn),對(duì)學(xué)習(xí)結(jié)果的重要程度可以予以忽視。采用分布式和并行計(jì)算的方式進(jìn)行分治策略的實(shí)施,可以規(guī)避掉噪音數(shù)據(jù)和冗余帶來(lái)的干擾,降低存儲(chǔ)耗費(fèi),同時(shí)提高學(xué)習(xí)算法的運(yùn)行效率。 [4]
隨著大數(shù)據(jù)時(shí)代各行業(yè)對(duì)數(shù)據(jù)分析需求的持續(xù)增加,通過(guò)機(jī)器學(xué)習(xí)高效地獲取知識(shí),已逐漸成為當(dāng)今機(jī)器學(xué)習(xí)技術(shù)發(fā)展的主要推動(dòng)力。大數(shù)據(jù)時(shí)代的機(jī)器學(xué)習(xí)更強(qiáng)調(diào)“學(xué)習(xí)本身是手段"機(jī)器學(xué)習(xí)成為一種支持和服務(wù)技術(shù)。如何基于機(jī)器學(xué)習(xí)對(duì)復(fù)雜多樣的數(shù)據(jù)進(jìn)行深層次的分析,更高效地利用信息成為當(dāng)前大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)研究的主要方向。所以,機(jī)器學(xué)習(xí)越來(lái)越朝著智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術(shù)的一個(gè)重要源泉。另外,在大數(shù)據(jù)時(shí)代,隨著數(shù)據(jù)產(chǎn)生速度的持續(xù)加快,數(shù)據(jù)的體量有了前所未有的增長(zhǎng),而需要分析的新的數(shù)據(jù)種類也在不斷涌現(xiàn),如文本的理解、文本情感的分析、圖像的檢索和理解、圖形和網(wǎng)絡(luò)數(shù)據(jù)的分析等。使得大數(shù)據(jù)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等智能計(jì)算技術(shù)在大數(shù)據(jù)智能化分析處理應(yīng)用中具有極其重要的作用。在2014年12月中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)大數(shù)據(jù)專家委員會(huì)上通過(guò)數(shù)百位大數(shù)據(jù)相關(guān)領(lǐng)域?qū)W者和技術(shù)專家投票推選出的“2015年大數(shù)據(jù)十大熱點(diǎn)技術(shù)與發(fā)展趨勢(shì)”中,結(jié)合機(jī)器學(xué)習(xí)等智能計(jì)算技術(shù)的大數(shù)據(jù)分析技術(shù)被推選為大數(shù)據(jù)領(lǐng)域第一大研究熱點(diǎn)和發(fā)展趨勢(shì)。
二、機(jī)器學(xué)習(xí)分類
機(jī)器學(xué)習(xí)經(jīng)過(guò)幾十年的發(fā)展,衍生出了很多種分類方法,這里按學(xué)習(xí)模式的不同,可分為監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
(一)監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)(Supervised Learning)是從有標(biāo)簽的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)模型,然后對(duì)某個(gè)給定的新數(shù)據(jù)利用模型預(yù)測(cè)它的標(biāo)簽。如果分類標(biāo)簽精確度越高,則學(xué)習(xí)模型準(zhǔn)確度越高,預(yù)測(cè)結(jié)果越精確。
監(jiān)督學(xué)習(xí)主要用于回歸和分類。
常見(jiàn)的監(jiān)督學(xué)習(xí)的回歸算法有線性回歸、回歸樹(shù)、K鄰近、Adaboost、神經(jīng)網(wǎng)絡(luò)等。
常見(jiàn)的監(jiān)督學(xué)習(xí)的分類算法有樸素貝葉斯、決策樹(shù)、SVM、邏輯回歸、K鄰近、Adaboost、神經(jīng)網(wǎng)絡(luò)等。
(二)半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)(Semi-Supervised Learning)是利用少量標(biāo)注數(shù)據(jù)和大量無(wú)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)的模式。
半監(jiān)督學(xué)習(xí)側(cè)重于在有監(jiān)督的分類算法中加入無(wú)標(biāo)記樣本來(lái)實(shí)現(xiàn)半監(jiān)督分類。
常見(jiàn)的半監(jiān)督學(xué)習(xí)算法有Pseudo-Label、Π-Model、Temporal Ensembling、Mean Teacher、VAT、UDA、MixMatch、ReMixMatch、FixMatch等。
(三)無(wú)監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning)是從未標(biāo)注數(shù)據(jù)中尋找隱含結(jié)構(gòu)的過(guò)程。
無(wú)監(jiān)督學(xué)習(xí)主要用于關(guān)聯(lián)分析、聚類和降維。
常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)算法有稀疏自編碼(Sparse Auto-Encoder)、主成分分析(Principal Component Analysis, PCA)、K-Means算法(K均值算法)、DBSCAN算法(Density-Based Spatial Clustering of Applications with Noise)、最大期望算法(Expectation-Maximization algorithm, EM)等。
(四)強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)(Reinforcement Learning)類似于監(jiān)督學(xué)習(xí),但未使用樣本數(shù)據(jù)進(jìn)行訓(xùn)練,是是通過(guò)不斷試錯(cuò)進(jìn)行學(xué)習(xí)的模式。
在強(qiáng)化學(xué)習(xí)中,有兩個(gè)可以進(jìn)行交互的對(duì)象:智能體(Agnet)和環(huán)境(Environment),還有四個(gè)核心要素:策略(Policy)、回報(bào)函數(shù)(收益信號(hào),Reward Function)、價(jià)值函數(shù)(Value Function)和環(huán)境模型(Environment Model),其中環(huán)境模型是可選的。
強(qiáng)化學(xué)習(xí)常用于機(jī)器人避障、棋牌類游戲、廣告和推薦等應(yīng)用場(chǎng)景中。
以上便是小編此次帶來(lái)的全部?jī)?nèi)容,十分感謝大家的耐心閱讀,想要了解更多相關(guān)內(nèi)容,或者更多精彩內(nèi)容,請(qǐng)一定關(guān)注我們網(wǎng)站哦。