近日,由百度發(fā)起的一場通過增強現(xiàn)實(AR)技術復原朝陽門的行動,引起了大家的廣泛關注。而在這場成熟的百度AR技術應用背后,實則是百度在人工智能領域深厚積累的體現(xiàn)。
用AR技術喚醒逝去文明 百度助推AI融入生活
代表著下一個時代的人工智能技術,正真真切切地走進我們的生活。近日,由百度發(fā)起的一場通過增強現(xiàn)實(AR)技術復原朝陽門的行動,引起了大家的廣泛關注。市民在朝陽門地鐵站利用手機百度APP對準墻面或地面上的巨幅朝陽門手繪海報拍照,隨后點擊“發(fā)現(xiàn)AR動畫”,即可喚醒老城門。據(jù)悉這是國內首次使用AR技術進行文化名城復原,并在流動空間里進行大型歷史文化公益教育的嘗試。而在這場成熟的百度AR技術應用背后,實則是百度在人工智能領域深厚積累的體現(xiàn)。從百度無人車到度秘、百度AR、百度醫(yī)療大腦,我們從百度的戰(zhàn)略布局中不難發(fā)現(xiàn),百度一直在致力于推動著人工智能技術融入進我們的生活。用AR技術喚醒逝去的文明
百度用技術復原朝陽門,大家只需要通過手機百度APP觸發(fā)AR后,就可以看到元末明初時期老百姓在朝陽門的各色各樣生活場景,同時還可與復原的朝陽門進行“零距離”的人機交互。而這項技術究竟又是如何實現(xiàn)的?
百度相關負責人表示,此次朝陽門老城門復原,借助手機百度內嵌的AR插件,依托百度圖片識別、多模交互、3D視覺為核心的移動端AR技術,用聲音、三維模型動畫等形式將歷史生動呈現(xiàn),為受眾提供有趣交互體驗的同時,傳遞了老北京歷史文化。
“百度AR之所以在短時間內發(fā)展迅速得益于在人工智能領域的深厚積累。人工智能是AR技術的基礎,AR需要通過圖像識別、人臉識別、OCR文字識別、語音識別等人工智能技術來感知真實世界,從而達到虛擬物體與現(xiàn)實環(huán)境進行無縫疊加,并實現(xiàn)真實空間內的人機交互,提升應用產品的服務效率。”
值得注意的是,百度還選定了地鐵的西直門站及2號線的一輛列車,在春節(jié)期間“上演”一場AR復現(xiàn)老北京九大城門的歷史文化體驗之旅。據(jù)百度介紹,之所以選定2號線,是因為在眾多地鐵線路中,它是唯一一條貫穿老北京九大城門的地鐵線路。而在這個項目的研發(fā)過程中,工程師們不斷嘗試各種技術方案,優(yōu)化算法的跟蹤和顯示效果,使得古城門故事展現(xiàn)更加流暢、穩(wěn)定,并且深入琢磨產品交互體驗,將城門更真實地展現(xiàn)在用戶面前,也讓更多人真切地體驗到前沿的人工智能AR技術。
我們認為移動互聯(lián)網(wǎng)后,下一個時代就是人工智能時代,所以百度在五六年前就開始大舉投入人工智能了。”李彥宏在接受媒體采訪時曾表示,事實上,在近兩年,李彥宏幾乎每次在公眾場合的亮相,反復強調的都是人工智能。
作為最早布局人工智能的公司之一,百度于2013年成立全球首家深度學習研究院,后擴充為百度研究院,下設人工智能實驗室、深度學習實驗室以及大數(shù)據(jù)實驗室,招募吳恩達等人工智能頂級專家,建成了全球最大的深度神經網(wǎng)絡“百度大腦”,同谷歌、微軟等企業(yè)爭奪人工智能技術制高點。
今年11月16日,第三屆世界互聯(lián)網(wǎng)大會發(fā)布了世界互聯(lián)網(wǎng)領先科技成果,百度的人工智能核心成果——百度大腦成功入選15大領先科技成果,成為國內唯一入選的綜合型人工智能技術。世界互聯(lián)網(wǎng)領先科技成果推薦委員會認為,今年9月1日發(fā)布的百度大腦,以其領先算法、超強計算能力、百億級大數(shù)據(jù),建立了超大規(guī)模的神經網(wǎng)絡,能夠學習并訓練極其復雜的模型,同時具備語音、圖像、自然語言處理、用戶畫像等領先能力,廣泛應用在無人車、智能醫(yī)療、AR、度秘機器人等方面。
百度總裁張亞勤在介紹百度大腦的整體情況時表示,“百度大腦由超大規(guī)模神經網(wǎng)絡、計算以及數(shù)據(jù)三大部分組成,主要包含語音、圖像、自然語言處理、用戶畫像四大能力。其中,百度深度語音識別技術Deep Speech 2入選了《麻省理工科技評論》‘2016年十大突破技術’,語音識別準確率達到97%;百度多項人臉檢測識別、OCR競賽均世界第一;情感分析、句法分析、命名實體識別等技術也在國際標準評測集上獲世界第一。”
在互聯(lián)網(wǎng)下一幕開啟之際,百度的選擇是開放人工智能技術,幫助其他互聯(lián)網(wǎng)企業(yè)發(fā)展,建立一個健康、共贏的產業(yè)新生態(tài)。近日,百度宣布其全新的深度學習開源平臺PaddlePaddle在開源社區(qū)Github及百度大腦平臺開放,供廣大開發(fā)者下載使用。百度成為繼Google、Facebook、IBM后另一個將人工智能技術開源的科技巨頭,同時也是國內首個開源深度學習平臺的科技公司。
據(jù)悉PaddlePaddle的前身是百度于2013年自主研發(fā)的深度學習平臺Paddle(Parallel Distributed Deep Learning,并行分布式深度學習),且一直為百度內部工程師研發(fā)使用。全球各大科技巨頭開源的深度學習平臺都極具各自技術特點,對于百度,由于其自身在搜索、圖像識別、語音語義識別理解、情感分析、機器翻譯、用戶畫像推薦等多領域的業(yè)務和技術方向,PaddlePaddle則表現(xiàn)更加全面,是一個相對全功能的深度學習框架。今年9月1日百度世界大會上,百度首席科學家Andrew Ng(吳恩達)首次宣布將百度深度學習平臺對外開放,命名PaddlePaddle。
百度資深科學家、PaddlePaddle研發(fā)負責人徐偉介紹:“在PaddlePaddle的幫助下,深度學習模型的設計如同編寫偽代碼一樣容易,設計師只需關注模型的高層結構,而無需擔心任何瑣碎的底層問題。未來,程序員可以快速應用深度學習模型來解決醫(yī)療、金融等實際問題,讓人工智能發(fā)揮出最大作用。”目前,PaddlePaddle已在百度30多項主要產品和服務之中發(fā)揮著巨大的作用,如外賣的預估出餐時間、預判網(wǎng)盤故障時間點、精準推薦用戶所需信息、海量圖像識別分類、字符識別(OCR)、病毒和垃圾信息檢測、機器翻譯和自動駕駛等領域。
對此,有業(yè)內人士表示百度作為最早布局人工智能領域的公司,在互聯(lián)網(wǎng)下一幕開啟之際全面開放助力傳統(tǒng)企業(yè)和開發(fā)者升級,也是在經濟新常態(tài)下促進整個社會經濟發(fā)展的體現(xiàn)。
正如李彥宏所說的“這些技術不僅僅是屬于百度的,我們會無償把它開放出來,供我們聯(lián)盟的伙伴使用。這樣的話確實能夠使得人工智能迅速地滲透到各個行業(yè),從而改變我們的社會。”