當前位置:首頁 > 公眾號精選 > AI科技大本營
[導讀]作者|泳魚來源|算法進階本文將從神經元到邏輯回歸模型結構,并將其擴展到深度深度網絡模型。一、談談智慧對于人類智慧奧秘的探索,不同時代、學科背景的人對于智慧的理解及其實現(xiàn)方法有著不同的思想主張。有的主張用顯式邏輯體系搭建人工智能系統(tǒng),即符號主義。有的主張用數(shù)學模型模擬大腦組成以實現(xiàn)...

從神經元談到深度神經網絡作者 | 泳魚來源 | 算法進階本文將從神經元到邏輯回歸模型結構,并將其擴展到深度深度網絡模型。


一、談談智慧

對于人類智慧奧秘的探索,不同時代、學科背景的人對于智慧的理解及其實現(xiàn)方法有著不同的思想主張。有的主張用顯式邏輯體系搭建人工智能系統(tǒng),即符號主義。有的主張用數(shù)學模型模擬大腦組成以實現(xiàn)智慧,即聯(lián)結主義,這也就是我們本文討論的方向。那大腦為什么能夠思考?科學家發(fā)現(xiàn),原因在于人體的神經網絡,而神經網絡的基本組成就是神經元:從神經元談到深度神經網絡1、外部刺激通過神經元的神經末梢,轉化為電信號,傳導到神經元。2、神經元的樹突接收電信號,由神經元處理是否達到激活閾值再輸出興奮或者抑制電信號,最后由軸突將信號傳遞給其它細胞。3、無數(shù)神經元構成神經中樞。神經中樞綜合各種信號,做出判斷。4、 人體根據(jù)神經中樞的指令,對外部刺激做出反應。

二、神經元

既然智慧的基礎是神經元,而正因為神經元這些特點才使大腦具有強大的 “運算及決策的能力”,科學家以此為原理發(fā)明了人工神經元數(shù)學模型,并以神經元為基礎而組合成人工神經網絡模型。(注:下文談到的神經元都特指人工神經元)從神經元談到深度神經網絡如上圖就是人工神經元的基本結構。它可以輸入一定維數(shù)的輸入(如:3維的輸入,x1,x2, x3),每個輸入都先要乘上相應的權重值(如:w0,w1,w2),乘上每一權重值的作用可以視為對每一輸入的加權,也就是對每一輸入的神經元對它的重視程度是不一樣的。接下來神經元將乘上權重的每個輸入做下求和(也就是加權求和),并加上截距項(截距項b可以視為對神經元閾值的直接調整),最后由激活函數(shù)(f)非線性轉換為最終輸出值。激活函數(shù)的種類很多,有sigmoid,tanh,sign,relu,softmax等等(下一專題會討論下激活函數(shù))。激活函數(shù)的作用是在神經元上實現(xiàn)一道非線性的運算,以通用萬能近似定理——“如果一個前饋神經網絡具有線性輸出層和至少一層隱藏層,只要給予網絡足夠數(shù)量的神經元,便可以實現(xiàn)以足夠高精度來逼近任意一個在 ?n 的緊子集 (Compact subset) 上的連續(xù)函數(shù)”所表明,激活函數(shù)是深度神經網絡學習擬合任意函數(shù)的前提。

三、神經元到邏輯回歸

單個神經元且其激活函數(shù)為sigmoid時,既是我們熟知的邏輯回歸的模型結構。從神經元談到深度神經網絡


邏輯回歸是一種廣義線性的分類模型且其模型結構可以視為單層的神經網絡,由一層輸入層、一層僅帶有一個sigmoid激活函數(shù)的神經元的輸出層組成,而無隱藏層。(注:計算網絡層數(shù)不計入輸入層)在邏輯回歸模型結構中,我們輸入數(shù)據(jù)特征x,通過輸出層神經元激活函數(shù)σ(sigmoid函數(shù))將輸入的特征經由sigmoid(wx b)的計算后非線性轉換為0~1區(qū)間的數(shù)值后輸出。學習訓練過程是通過梯度下降學到合適的參數(shù)w的模型 Y=sigmoid(wx b),使得模型輸出值Y與實際值y的誤差最小。

四、邏輯回歸到深度神經網絡

基于前面的介紹可以知道,神經網絡也就是神經元按層次連接而成的網絡,邏輯回歸是單層的神經網絡,當我們給僅有輸入層及輸出層的單層神經網絡中間接入至少一層的隱藏層,也就是深度神經網絡了。從神經元談到深度神經網絡


深度神經網絡包含了三種網絡層:輸入層、隱藏層及輸出層。
  • 輸入層:為數(shù)據(jù)特征輸入層,輸入數(shù)據(jù)特征個數(shù)就對應著網絡的神經元數(shù)。
  • 隱藏層:即網絡的中間層,隱藏層層數(shù)可以為0或者很多層,其作用接受前一層網絡輸出作為當前的輸入值,并計算輸出當前結果到下一層。隱藏層是神經網絡性能的關鍵,通常由含激活函數(shù)的神經元組成,以進一步加工出高層次抽象的特征,以增強網絡的非線性表達。隱藏網絡層數(shù)直接影響模型的擬合效果。
  • 輸出層:為最終結果輸出的網絡層。輸出層的神經元個數(shù)代表了分類標簽的個數(shù)(注:在做二分類時,如果輸出層的激活函數(shù)采用sigmoid,輸出層的神經元個數(shù)為1個;如果采用softmax分類器,輸出層神經元個數(shù)為2個)
神經網絡中,數(shù)據(jù)特征(x)從輸入層輸入,每層的計算結果由前一層傳遞到下一層,最終到輸出層輸出計算結果。每個網絡層由一定數(shù)量的神經元組成,神經元可以視為一個個的計算單元,對輸入進行加權求和,故其計算結果由神經元包含的權重(即模型參數(shù)w)直接控制,神經元內還可以包含激活函數(shù),可以對加權求和的結果進一步做非線性的計算,如sigmoid(wx b)。從神經元談到深度神經網絡



本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉