當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 區(qū)塊鏈
[導(dǎo)讀] 使用機器學(xué)習(xí)來分析區(qū)塊鏈數(shù)據(jù)集是一個令人著迷的挑戰(zhàn)。區(qū)塊鏈數(shù)據(jù)集除了具有不可思議的潛力,可以幫助我們了解加密貨幣資產(chǎn)的行為,但是這對機器學(xué)習(xí)的實踐者提出了非常獨特的挑戰(zhàn)。然而這些挑戰(zhàn)被轉(zhuǎn)化為大多

使用機器學(xué)習(xí)來分析區(qū)塊鏈數(shù)據(jù)集是一個令人著迷的挑戰(zhàn)。區(qū)塊鏈數(shù)據(jù)集除了具有不可思議的潛力,可以幫助我們了解加密貨幣資產(chǎn)的行為,但是這對機器學(xué)習(xí)的實踐者提出了非常獨特的挑戰(zhàn)。然而這些挑戰(zhàn)被轉(zhuǎn)化為大多數(shù)傳統(tǒng)機器學(xué)習(xí)技術(shù)的主要障礙。機器智能技術(shù)的快速發(fā)展使得新機器學(xué)習(xí)方法的產(chǎn)生成為可能,這些方法非常適用于區(qū)塊鏈數(shù)據(jù)集的分析。在IntoTheBlock,我們定期試驗了這些新方法,以提高市場情報信號的效率。今天,我想簡要介紹一下機器學(xué)習(xí)領(lǐng)域的一些新思想,它們可以在分析區(qū)塊鏈數(shù)據(jù)時產(chǎn)生有趣的結(jié)果。

區(qū)塊鏈數(shù)據(jù)集提供了一個與加密貨幣資產(chǎn)行為相關(guān)的獨特的數(shù)據(jù)宇宙,因此,為機器學(xué)習(xí)方法的應(yīng)用提供了獨特的機會。然而,區(qū)塊鏈數(shù)據(jù)集的性質(zhì)和結(jié)構(gòu)給機器學(xué)習(xí)方法帶來了獨特的挑戰(zhàn)。雖然我們可能認(rèn)為區(qū)塊鏈數(shù)據(jù)集是機器學(xué)習(xí)應(yīng)用程序的天堂,但傳統(tǒng)方法通常會遇到一些意想不到的挑戰(zhàn):

·缺少標(biāo)記數(shù)據(jù):區(qū)塊鏈數(shù)據(jù)集中只有很少的標(biāo)記數(shù)據(jù)可用于訓(xùn)練機器學(xué)習(xí)模型。

·模糊數(shù)據(jù):區(qū)塊鏈充滿了加密或模糊的數(shù)據(jù),幾乎不可能進行分析。

·缺乏基準(zhǔn)測試模型:機器學(xué)習(xí)就是將模型與其他模型進行基準(zhǔn)測試。在一個很少有文檔記錄的模型產(chǎn)生可信結(jié)果的空間中,這樣的結(jié)果有點困難。

傳統(tǒng)的機器學(xué)習(xí)思想

傳統(tǒng)的機器學(xué)習(xí)實踐者將世界分為兩類模型:

·監(jiān)督學(xué)習(xí)(Unsupervised Learning):有監(jiān)督學(xué)習(xí)(Supervised Learning)這個名稱表示有一名導(dǎo)師作為老師在場?;旧?,監(jiān)督學(xué)習(xí)是一種我們使用數(shù)據(jù)來教或訓(xùn)練機器的學(xué)習(xí),這些數(shù)據(jù)都有很好的標(biāo)記,這意味著一些數(shù)據(jù)已經(jīng)有了正確的答案。

·非監(jiān)督學(xué)習(xí):非監(jiān)督學(xué)習(xí)是機器使用既不分類也不標(biāo)記的信息進行訓(xùn)練,并允許算法在沒有指導(dǎo)的情況下對該信息進行操作。在這里,機器的任務(wù)是根據(jù)相似、模式和差異對未排序的信息進行分組,而不需要事先對數(shù)據(jù)進行任何訓(xùn)練。

在區(qū)塊鏈數(shù)據(jù)集中,由于標(biāo)記數(shù)據(jù)集的有限可用性,監(jiān)督學(xué)習(xí)應(yīng)用程序是有限的。非監(jiān)督方法可能非常有效,但在缺乏其他模型或基準(zhǔn)進行比較的情況下,很難判斷其性能。

為了幫助改進區(qū)塊鏈數(shù)據(jù)分析中的非監(jiān)督和監(jiān)督方法,我們嘗試使用一些近年來在機器學(xué)習(xí)社區(qū)中獲得廣泛關(guān)注的新方法。

新的機器學(xué)習(xí)方法,可以幫助我們了解區(qū)塊鏈數(shù)據(jù)集

我們生活在機器學(xué)習(xí)研究技術(shù)的黃金時代。今天,機器學(xué)習(xí)框架和平臺正在迅速整合許多技術(shù),幫助實現(xiàn)傳統(tǒng)監(jiān)督和非監(jiān)督方法之外的新功能。我們發(fā)現(xiàn)其中一些技術(shù)與區(qū)塊鏈數(shù)據(jù)集的分析非常相關(guān)。

半監(jiān)督學(xué)習(xí)

半監(jiān)督學(xué)習(xí)是近年來備受關(guān)注的機器學(xué)習(xí)領(lǐng)域之一。從概念上講,半監(jiān)督學(xué)習(xí)是監(jiān)督學(xué)習(xí)的一種變體,它結(jié)合了用于訓(xùn)練的標(biāo)記和未標(biāo)記數(shù)據(jù)集。半監(jiān)督學(xué)習(xí)的原理是利用少量的帶標(biāo)簽的監(jiān)督學(xué)習(xí)和大量的無標(biāo)簽的非監(jiān)督學(xué)習(xí)數(shù)據(jù),在許多情況下可以比完全監(jiān)督的模型產(chǎn)生更好的準(zhǔn)確性。

在區(qū)塊鏈分析中,半監(jiān)督學(xué)習(xí)可以用于訓(xùn)練模型,這些模型可以對參與者(如交換器或錢包)進行分類,而不需要依賴大型標(biāo)記數(shù)據(jù)集進行訓(xùn)練。例如,分類器可以學(xué)習(xí)使用幾個標(biāo)記地址來識別加密貨幣交易,并使用一個更大的未標(biāo)記地址池來進行擴展。

遷移學(xué)習(xí)

遷移學(xué)習(xí)是一種表示法學(xué)習(xí),其基礎(chǔ)是通過重用以前任務(wù)中的知識來掌握新任務(wù)的思想。傳統(tǒng)的學(xué)習(xí)是孤立的,只基于特定的任務(wù)、數(shù)據(jù)集和單獨的訓(xùn)練模型。沒有可以從一個模型轉(zhuǎn)移到另一個模型的知識被保留。在遷移學(xué)習(xí)中,您可以利用以前訓(xùn)練過的模型中的知識(特性、權(quán)重等)來訓(xùn)練新的模型。

當(dāng)涉及到區(qū)塊鏈數(shù)據(jù)分析時,可以使用遷移學(xué)習(xí)來構(gòu)建模型,從而從以前的任務(wù)中歸納出知識。例如,識別異常比特幣轉(zhuǎn)移的模型可以將其知識推廣到以太坊區(qū)塊鏈。

AutoML與自動化

設(shè)計機器學(xué)習(xí)模型是一項難以置信的主觀任務(wù),它通常依賴于數(shù)據(jù)科學(xué)家的經(jīng)驗,而這些經(jīng)驗沒有經(jīng)過客觀測試。一個給定的機器學(xué)習(xí)問題可以有無限個解,很難理解我們是否有這個問題的正確解。

AutoML是一種新技術(shù),旨在自動創(chuàng)建機器學(xué)習(xí)模型。對于給定的數(shù)據(jù)集、一系列優(yōu)化指標(biāo)和一些時間或資源方面的約束,AutoML方法應(yīng)該能夠評估成千上萬的神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)并產(chǎn)生最優(yōu)結(jié)果。雖然有效的數(shù)據(jù)科學(xué)團隊可能能夠評估給定問題的12個模型,但是AutoML方法可以在相對可管理的時間內(nèi)快速搜索成千上萬的體系結(jié)構(gòu)。

在區(qū)塊鏈數(shù)據(jù)集中,NAS和AutoML可以幫助我們評估給定場景的大量模型。例如,我們可以評估數(shù)百個模型,得出一個更完善的架構(gòu),而不是設(shè)計一個特定的神經(jīng)網(wǎng)絡(luò)來預(yù)測交易所資金流動。

元學(xué)習(xí)

元學(xué)習(xí)可以簡單地定義為獲取知識多樣性的能力。作為人類,我們能夠用最少的信息同時獲得多個任務(wù)。我們可以通過看到一個新的物體的圖片來識別它,或者我們可以同時學(xué)習(xí)復(fù)雜的、多任務(wù)的活動,比如駕駛飛機。雖然人工智能代理可以掌握非常復(fù)雜的任務(wù),但它們需要在任何原子子任務(wù)上進行大量訓(xùn)練,而且它們在多任務(wù)處理方面仍然非常糟糕。一種流行的元學(xué)習(xí)技術(shù)被稱為“少鏡頭學(xué)習(xí)”(few-shot learning),它可以創(chuàng)建深度神經(jīng)網(wǎng)絡(luò),通過模仿極簡數(shù)據(jù)集來學(xué)習(xí),例如,嬰兒如何通過只看一兩張照片來學(xué)習(xí)識別物體。

在區(qū)塊鏈分析中,我們可以使用元學(xué)習(xí)來重用識別模式(如惡意傳輸)的模型來識別有用信息(如支付交易)。

這些是一些新的機器學(xué)習(xí)方法,可以成為非常有用的區(qū)塊鏈數(shù)據(jù)分析。隨著加密貨幣分析空間的發(fā)展,其中一些技術(shù)的應(yīng)用將從一個開放的實踐變成必須的,以產(chǎn)生有意義的,能夠幫助我們理解加密貨幣資產(chǎn)的行為。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉