機(jī)器學(xué)習(xí)為何重要?機(jī)器學(xué)習(xí)落地時(shí)存在哪些挑戰(zhàn)?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
機(jī)器學(xué)習(xí)將是下述內(nèi)容的主要介紹對(duì)象,通過(guò)這篇文章,小編希望大家可以對(duì)機(jī)器學(xué)習(xí)的相關(guān)情況以及信息有所認(rèn)識(shí)和了解,詳細(xì)內(nèi)容如下。
一、機(jī)器學(xué)習(xí)為何重要
人工智能將比任何其他創(chuàng)新更有能力塑造我們的未來(lái),任何不了解它的人很快就會(huì)發(fā)現(xiàn)自己被拋在后面。
在經(jīng)過(guò)多個(gè)人工智能冬天和“虛假繁榮”之后,數(shù)據(jù)存儲(chǔ)和計(jì)算機(jī)處理能力的快速發(fā)展極大地改變了游戲規(guī)則。
機(jī)器學(xué)習(xí)已經(jīng)對(duì)計(jì)算機(jī)視覺(jué)(機(jī)器識(shí)別圖像或視頻中對(duì)象的能力)做出了巨大改進(jìn)。例如,您收集了幾十萬(wàn)甚至幾百萬(wàn)張圖片,需要分別給它們貼上標(biāo)簽,比如要給有貓的圖片貼上標(biāo)簽,然后,該算法試圖建立一個(gè)模型,可以準(zhǔn)確無(wú)誤地給每一張有貓的圖片貼上標(biāo)簽。一旦精度足夠高,機(jī)器就能“了解”貓的樣子。
為了在收集數(shù)據(jù)時(shí)立即進(jìn)行分析,以準(zhǔn)確識(shí)別先前已知和先前從未見(jiàn)過(guò)的新模式,還必須使用能夠生成和聚合這些大數(shù)據(jù)的機(jī)器來(lái)了解每個(gè)患者的正常行為,并跟蹤、發(fā)現(xiàn)和標(biāo)記任何可能表明嚴(yán)重健康問(wèn)題的異常內(nèi)容。
物聯(lián)網(wǎng)的實(shí)現(xiàn)依賴于能夠獲得隱藏在廣闊且不斷增長(zhǎng)的數(shù)據(jù)海洋中的洞察力。由于目前的方法不能擴(kuò)展到物聯(lián)網(wǎng)的規(guī)模,因此,實(shí)現(xiàn)物聯(lián)網(wǎng)承諾的未來(lái)依賴于機(jī)器學(xué)習(xí)來(lái)發(fā)現(xiàn)模式、相關(guān)性和異常,而這些模式、相關(guān)性和異常有可能會(huì)改善我們?nèi)粘I畹乃蟹矫妗?
機(jī)器學(xué)習(xí)是我們走向人工智能之旅的核心,與此同時(shí),它將改變每個(gè)行業(yè),并對(duì)我們的日常生活產(chǎn)生巨大影響。
二、機(jī)器學(xué)習(xí)落地時(shí)存在哪些挑戰(zhàn)
在這部分,我們主要來(lái)了解一下當(dāng)機(jī)器學(xué)習(xí)落地時(shí),存在哪些挑戰(zhàn)。
在實(shí)際業(yè)務(wù)落地過(guò)程中,大部分大型云平臺(tái)提供商均已提供機(jī)器學(xué)習(xí)算力等資源服務(wù),同時(shí)支持多種機(jī)器學(xué)習(xí)框架等以提供開(kāi)放靈活的部署環(huán)境。但是,機(jī)器學(xué)習(xí)模型所需的數(shù)據(jù)往往并非從云平臺(tái)中產(chǎn)生,而是從傳感器、手機(jī)、網(wǎng)關(guān)等邊緣設(shè)備中產(chǎn)生。數(shù)據(jù)從邊側(cè)產(chǎn)生,而云端需從邊側(cè)采集數(shù)據(jù)以訓(xùn)練和不斷完善機(jī)器學(xué)習(xí)模型。
在實(shí)際落地時(shí),當(dāng)前機(jī)器學(xué)習(xí)需面對(duì)以下問(wèn)題:
1、海量設(shè)備數(shù)據(jù)導(dǎo)致延遲和成本問(wèn)題
假設(shè)即使有100 Mbps的專網(wǎng)連接,將10TB的數(shù)據(jù)運(yùn)送到云端也需要10天。面對(duì)大量邊緣連接設(shè)備每天生成數(shù)百兆字節(jié)甚至TB數(shù)據(jù),帶來(lái)的延遲和成本對(duì)客戶和服務(wù)提供方來(lái)說(shuō)往往是難以承受的;
2、數(shù)據(jù)壓縮導(dǎo)致的延遲和精度問(wèn)題
正因遷移所有數(shù)據(jù)通常不切實(shí)際,往往需要對(duì)數(shù)據(jù)進(jìn)行“壓縮”(如特征工程、難例識(shí)別等)并傳輸?shù)皆贫?,而?shù)據(jù)壓縮過(guò)程容易引入新的延遲。壓縮數(shù)據(jù)不一定能完全代表完整數(shù)據(jù)集信息,容易導(dǎo)致精度損失。
3、邊側(cè)數(shù)據(jù)隱私和計(jì)算實(shí)時(shí)性問(wèn)題
邊側(cè)數(shù)據(jù)與資源等具備地理分布性。隱私和網(wǎng)絡(luò)瓶頸導(dǎo)致數(shù)據(jù)集天然分割, 傳統(tǒng)集中式機(jī)器學(xué)習(xí)在邊緣情況下性能將顯著下降;單個(gè)邊側(cè)資源受限且異構(gòu)(算力、供電、場(chǎng)地等均受限),相對(duì)云上資源建設(shè)與維護(hù)成本更高。
上述問(wèn)題的本質(zhì)來(lái)源是數(shù)據(jù)在邊緣產(chǎn)生,而算力卻在云端更為充足。也就是說(shuō),機(jī)器學(xué)習(xí)服務(wù)將邊緣產(chǎn)生的數(shù)據(jù)轉(zhuǎn)換為知識(shí)的過(guò)程中,一方面需要在邊緣快速響應(yīng)并處理本地產(chǎn)生的數(shù)據(jù),另一方面需要云上算力與開(kāi)發(fā)環(huán)境的支持。隨著邊緣設(shè)備數(shù)量指數(shù)級(jí)增長(zhǎng)以及設(shè)備性能的提升,邊云協(xié)同機(jī)器學(xué)習(xí)應(yīng)運(yùn)而生,以期打通機(jī)器學(xué)習(xí)的最后一公里。
最后,小編誠(chéng)心感謝大家的閱讀。你們的每一次閱讀,對(duì)小編來(lái)說(shuō)都是莫大的鼓勵(lì)和鼓舞。希望大家對(duì)機(jī)器學(xué)習(xí)已經(jīng)具備了初步的認(rèn)識(shí),最后的最后,祝大家有個(gè)精彩的一天。