當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 在我之前的文章中,我討論了如何對卷積神經(jīng)網(wǎng)絡(CNN)學習的權重進行拓撲數(shù)據(jù)分析,以便深入了解正在學習的內(nèi)容以及如何學習它。 這項工作的重要性可歸納如下: 它使我們能夠

在我之前的文章中,我討論了如何對卷積神經(jīng)網(wǎng)絡(CNN)學習的權重進行拓撲數(shù)據(jù)分析,以便深入了解正在學習的內(nèi)容以及如何學習它。

這項工作的重要性可歸納如下:

它使我們能夠了解神經(jīng)網(wǎng)絡如何執(zhí)行分類任務。

它允許我們觀察網(wǎng)絡的學習方式

它允許我們看到深層網(wǎng)絡中的各個層如何在它們檢測到的內(nèi)容上有所不同

在這篇文章中,我們展示了如何將這種理解用于實際目的。那些是:

如何使用持久同源性的條形碼長度來推斷CNN的準確性。

我們的研究結果如何從一個數(shù)據(jù)集推廣到下一個數(shù)據(jù)集。

使用持久同源條形碼方法如何定量測量數(shù)據(jù)集的定性性質。

我們需要回顧上一篇文章中的一些想法。引入的一個想法是使用持久同源作為測量數(shù)據(jù)形狀的工具。在我們的例子中,我們使用持久同源性來測量圓形的大小和強度或“明確定義”。

我們首先回顧一下持久同源性的概念。持久同源性分配給任何數(shù)據(jù)集并標注“條形碼”,它是間隔的集合。在維度=0時,條形碼輸出反映了數(shù)據(jù)集分解為集群或組件。

對于更高維度,持久同源性測量除聚類分解之外的幾何特征的存在。在dimension=1的情況下,條形碼測量數(shù)據(jù)集中循環(huán)的存在。

在左邊,條形碼包括一個長條和一些更短的條。長條反映了圓的存在,而較短的條反映了噪聲。在右邊,我們再次有對應于噪音的短桿和兩個不同長度的長桿。這些條反映了兩個環(huán)的存在,條的不同長度對應于環(huán)的大小。條形的長度也可以反映出可能被稱為循環(huán)的“明確定義”的東西。

在左邊,我們有一個非常明確的循環(huán)及其條形碼。在右側,循環(huán)中添加了一些噪聲,使得更加分散且定義不太明確。右邊最長的條比左邊的條長。因此,最長條的長度可以反映環(huán)的明確定義。

推斷CNN的準確性

實際上是通過條形碼中存在一個長條來確認的。我們現(xiàn)在想要了解隨著訓練的進展,循環(huán)形狀是如何演變的。

我們通過檢查條形碼中最長條的長度(可以在訓練的任何階段計算)與訓練點的準確度之間的相關性來實現(xiàn)這一點。我們對兩個數(shù)據(jù)集MNIST和第二個房號數(shù)據(jù)集進行了這些計算,稱為SVHN。

跨數(shù)據(jù)集的推廣

第二個發(fā)現(xiàn)涉及從一個數(shù)據(jù)集到另一個數(shù)據(jù)集的泛化過程。具體來說,我們訓練了基于MNIST的CNN,并在應用于SVHN時檢查其準確性。我們使用三種不同的方法進行了培訓。

測量可變性

第三個發(fā)現(xiàn)涉及檢查兩個數(shù)據(jù)集的可變性。定性地,我們可以確定SVHN比MNIST具有更多的可變性。反過來,我們希望SVHN提供更豐富的數(shù)據(jù)集和更精確的權重向量數(shù)據(jù)集。實際上,SVHN的持續(xù)時間間隔明顯長于MINST(1.27對1.10)。這從上面進一步證實,所生成的圓模型的“良好定義性”與神經(jīng)網(wǎng)絡的質量之間存在強相關性。

加起來

拓撲分析在這種類型的分析挑戰(zhàn)中有用的原因是它提供了一種將復雜數(shù)據(jù)集壓縮為可理解且可能可操作的形式的方法。在這里,與許多其他數(shù)據(jù)分析問題一樣,獲得對數(shù)據(jù)中“頻繁出現(xiàn)的圖案”的理解至關重要。上述觀察結果表明,拓撲分析可用于獲得對CNN學習和泛化能力的控制和理解。這些方面還有許多進一步的想法,我們將在以后的文章中討論。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉