當(dāng)前位置:首頁 > 智能硬件 > 智能硬件
[導(dǎo)讀]在這篇文章中,小編將為大家?guī)頇C(jī)器學(xué)習(xí)的相關(guān)報(bào)道。如果你對(duì)本文即將要講解的內(nèi)容存在一定興趣,不妨繼續(xù)往下閱讀哦。

在這篇文章中,小編將為大家?guī)?a href="/tags/機(jī)器學(xué)習(xí)" target="_blank">機(jī)器學(xué)習(xí)的相關(guān)報(bào)道。如果你對(duì)本文即將要講解的內(nèi)容存在一定興趣,不妨繼續(xù)往下閱讀哦。

一、機(jī)器學(xué)習(xí)的基本過程

1.確定目標(biāo)

機(jī)器學(xué)習(xí)的目標(biāo)并不在于機(jī)器學(xué)習(xí),而在于我們將這種方法應(yīng)用到現(xiàn)實(shí)場景,去解決現(xiàn)實(shí)的問題點(diǎn)。所以在工作開始之前,我們需要想清楚自己是要實(shí)現(xiàn)何種目標(biāo),比如是要對(duì)流失用戶進(jìn)行風(fēng)險(xiǎn)預(yù)警,對(duì)潛在付費(fèi)用戶進(jìn)行意愿評(píng)估,還是對(duì)信貸用戶進(jìn)行欺詐識(shí)別。

2.診斷問題

因?yàn)槊鞔_了所要實(shí)現(xiàn)的目標(biāo),所以可以根據(jù)現(xiàn)實(shí)基礎(chǔ)來診斷問題。為了實(shí)現(xiàn)這個(gè)目標(biāo),需要機(jī)器學(xué)習(xí)給到怎樣的輸出,單純的0-1標(biāo)簽即可,還是需要連續(xù)的風(fēng)險(xiǎn)概率;目前的數(shù)據(jù)量是否能支撐這個(gè)項(xiàng)目,業(yè)務(wù)樣本的黑白比例是否不夠均衡,這些問題都是需要診斷的。

3.方案設(shè)計(jì)

明確了要實(shí)現(xiàn)的目標(biāo),也了解了現(xiàn)實(shí)基礎(chǔ)里存在的問題點(diǎn),便可以展開方案設(shè)計(jì)。在這個(gè)細(xì)分的業(yè)務(wù)場景下,適合選用哪一類型的算法,不同算法往往是為不同領(lǐng)域而生的;在這個(gè)場景下,如果沒有明確的黑白樣本,需要基于何種方法來進(jìn)行樣本定義。在方案設(shè)計(jì)的環(huán)節(jié),需要給出一個(gè)工作開展的大的方向,相當(dāng)于把時(shí)間和精力限制在一個(gè)合適的框架中。

4.方案執(zhí)行

在方案執(zhí)行的過程中遇到問題時(shí),如何進(jìn)行解決,也是很重要的環(huán)節(jié)。機(jī)器學(xué)習(xí)算法的執(zhí)行,一般稱之為最優(yōu)化的過程,即在一個(gè)算法框架下,如何最快地達(dá)到最優(yōu)的結(jié)果。而針對(duì)整個(gè)方案的執(zhí)行,又會(huì)包括數(shù)據(jù)準(zhǔn)備,特征工程,算法調(diào)試,模型評(píng)估等具體事項(xiàng),每一個(gè)事項(xiàng)相互獨(dú)立,各有各的方法論,但又相互影響,上下游之間的執(zhí)行效果環(huán)環(huán)相扣。

5.評(píng)估迭代

評(píng)估的過程,其實(shí)就是一個(gè)目標(biāo)量化的過程,因?yàn)橛辛肆炕?,所以有了絕對(duì)意義上的效果優(yōu)劣。只是不同的業(yè)務(wù)目標(biāo),不同的模型框架,對(duì)應(yīng)的評(píng)估體系是不一樣的。建立一套合適的評(píng)估方式,機(jī)器學(xué)習(xí)項(xiàng)目也就實(shí)現(xiàn)了閉環(huán),可以在迭代中去逐步逼近要實(shí)現(xiàn)的業(yè)務(wù)目標(biāo)。

二、基于過濾法實(shí)現(xiàn)機(jī)器學(xué)習(xí)特征選擇

基于過濾法(Filter)實(shí)現(xiàn)特征選擇是最為簡單和常用的一種方法,其最大優(yōu)勢是不依賴于模型,僅從特征的角度來挖掘其價(jià)值高低,從而實(shí)現(xiàn)特征排序及選擇。實(shí)際上,基于過濾法的特征選擇方案,其核心在于對(duì)特征進(jìn)行排序——按照特征價(jià)值高低排序后,即可實(shí)現(xiàn)任意比例/數(shù)量的特征選擇或剔除。顯然,如何評(píng)估特征的價(jià)值高低從而實(shí)現(xiàn)排序是這里的關(guān)鍵環(huán)節(jié)。為了評(píng)估特征的價(jià)值高低,大體可分為如下3類評(píng)估標(biāo)準(zhǔn):

基于特征所含信息量的高低:這種一般就是特征基于方差法實(shí)現(xiàn)的特征選擇,即認(rèn)為方差越大對(duì)于標(biāo)簽的可區(qū)分性越高;否則,即低方差的特征認(rèn)為其具有較低的區(qū)分度,極端情況下當(dāng)一列特征所有取值均相同時(shí),方差為0,對(duì)于模型訓(xùn)練也不具有任何價(jià)值。當(dāng)然,實(shí)際上這里倘若直接以方差大小來度量特征所含信息量是不嚴(yán)謹(jǐn)?shù)?,例如?duì)于[100, 110, 120]和[1, 5, 9]兩組特征來說,按照方差計(jì)算公式前者更大,但從機(jī)器學(xué)習(xí)的角度來看后者可能更具有區(qū)分度。所以,在使用方差法進(jìn)行特征選擇前一般需要對(duì)特征做歸一化

基于相關(guān)性:一般是基于統(tǒng)計(jì)學(xué)理論,逐一計(jì)算各列與標(biāo)簽列的相關(guān)性系數(shù),當(dāng)某列特征與標(biāo)簽相關(guān)性較高時(shí)認(rèn)為其對(duì)于模型訓(xùn)練價(jià)值更大。而度量兩列數(shù)據(jù)相關(guān)性的指標(biāo)則有很多,典型的包括歐式距離、卡方檢驗(yàn)、T檢驗(yàn)等等

基于信息熵理論:與源于統(tǒng)計(jì)學(xué)的相關(guān)性方法類似,也可從信息論的角度來度量一列特征與標(biāo)簽列的相關(guān)程度,典型的方法就是計(jì)算特征列與標(biāo)簽列的互信息。當(dāng)互信息越大時(shí),意味著提供該列特征時(shí)對(duì)標(biāo)簽的信息確定程度越高。這與決策樹中的分裂準(zhǔn)則思想其實(shí)是有異曲同工之妙

當(dāng)然,基于過濾法的特征選擇方法其弊端也極為明顯:

因?yàn)椴灰蕾囉谀P?,所以無法有針對(duì)性的挖掘出適應(yīng)模型的最佳特征體系;

特征排序以及選擇是獨(dú)立進(jìn)行(此處的獨(dú)立是指特征與特征之間的獨(dú)立,不包含特征與標(biāo)簽間的相關(guān)性計(jì)算等),對(duì)于某些特征單獨(dú)使用價(jià)值低、組合使用價(jià)值高的特征無法有效發(fā)掘和保留。

最后,小編誠心感謝大家的閱讀。你們的每一次閱讀,對(duì)小編來說都是莫大的鼓勵(lì)和鼓舞。希望大家對(duì)機(jī)器學(xué)習(xí)已經(jīng)具備了初步的認(rèn)識(shí),最后的最后,祝大家有個(gè)精彩的一天。

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權(quán)不予轉(zhuǎn)載,侵權(quán)必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉