當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀]   從1945年到2015年,以人工智能為題講述了許多很美的故事,模仿游戲便是其實之一。但春冬輪回,在人工智能的世界里,人們的幻想像一個小球一樣,被拋得高高,也注定摔得慘慘(1974與1987年

  從1945年到2015年,以人工智能為題講述了許多很美的故事,模仿游戲便是其實之一。但春冬輪回,在人工智能的世界里,人們的幻想像一個小球一樣,被拋得高高,也注定摔得慘慘(1974與1987年兩次人工智能寒冬)。

  這一次,人們對人工智能的幻想被扔得更高了。強人工智能、機器毀滅人類的說法時常有。但這更像是預(yù)言家的說法,像陰謀論。目前的人工智能還是基于邏輯與數(shù)據(jù)、沒有直覺,對情感的理解與創(chuàng)造力更是無從談起。

  球被拋得高就一定會落得慘,甚至摔得粉碎。不過,做工程的人更謹慎些,要給這個球栓上一根繩子。這根繩子就是“從實際應(yīng)用出發(fā)、從用戶角度考慮”。

  語音語義的現(xiàn)狀可以大致描繪人工智能在工程界的應(yīng)用情況。有自主語音語義相關(guān)技術(shù)且可以在國內(nèi)使用其服務(wù)的幾家公司有:出門問問、科大訊飛、云知聲、思必馳、百度(度秘)、騰訊(騰訊小鯨)以及Google(Google Now)、微軟(小冰、小娜Cortana)、蘋果(Siri)。

  到底哪家的語音語義技術(shù)牛?

  微軟小冰屬于聊天機器人,主打人機對話,每周例常解鎖一種玩法。但微軟小冰不能提供太多的實質(zhì)性的服務(wù),比如查詢機票、查詢車票、叫車,這些出門問問卻能做到。

  如何客觀的評價技術(shù)的優(yōu)劣?在這個信息交流特別頻繁的時代,被使用的人工智能算法大都來自學術(shù)界的公開成果,很難有一家公司擁有不屬于這個時代的技術(shù)。就從語音識別的角度上講,各個公司的識別率大都在90%以上(這個問題實際上要復(fù)雜些,比如方言識別率、生僻詞識別率等就有更多說法了)。當一家公司的技術(shù)只比另一家的好5%或者1%,用戶便很難感受到優(yōu)劣,技術(shù)被應(yīng)用的場景便成了重要的不同之處。

  人工智能語音語義系統(tǒng)的基本實現(xiàn)方法

  這些公司的語音語義技術(shù)都和“云”離不開關(guān)系。人工智能系統(tǒng)按照一套邏輯推理程序,在海量的數(shù)據(jù)中尋找其認為最正確的答案。這就意味著,被使用的人工智能系統(tǒng)其覆蓋的領(lǐng)域越廣,就越是對數(shù)據(jù)以及運算能力饑渴。小型離線設(shè)備,如手機、家用電腦都無法滿足這樣的需求。解決辦法是搭建一個擁有超強處理能力以及海量數(shù)據(jù)的“計算機集群”,并將其接入網(wǎng)絡(luò),也就是我們所說的“云”。搭建了AI語音語義系統(tǒng)的云就是AI語音語義云,是這些AI公司的基礎(chǔ)設(shè)施。

  搭建了智能云之后,還需要合適的語音輸入端口。這個端口可以來自公眾號、APP這類軟件,也可以來自音箱、可穿戴智能手表這類硬件。

  如何正確看待目前市面上知名的語音語義系統(tǒng)?

  雖然人工智能系統(tǒng)的概念很廣,具體到語音語義的概念還是很廣,因此這么多類似但不同的人工智能公司在不同方向上深耕。從用戶角度看,這些產(chǎn)品的不同之處還蠻大。

  擅長搜索查詢消息的個人助理的有騰訊小鯨和出門問問

  1、騰訊小鯨目前公開的信息較少,主要被嵌入TOS系統(tǒng)。與TIcwear類似,TOS系統(tǒng)被搭載在智能手表當中。不過,小鯨的功能與其他語音助手類似,可以設(shè)置鬧鐘、查詢信息,但不能像出門問問那樣直接叫車、訂咖啡。

  有資料顯示,曾在GoogleBrain工作過的工程師創(chuàng)立了名為ScaledInference的公司,該公司的種子輪投資者就包括騰訊首席探索官David Wallerstein和騰訊本身。另外,也有消息稱,騰訊沒有停止其他視覺識別產(chǎn)品的研發(fā)。

  這有點像微信當年的研發(fā)。

  2、出門問問主要做2C(面向消費者)硬件產(chǎn)品,其智能手表TIcwatch是國內(nèi)銷量較高的一款全交互智能手表。出門問問的人工智能語交互技術(shù)自成體系,包含語音識別、語音合成(TTS)、語義理解、垂直搜索、智能推送5個部分。其最大的特點是可以語音呼喚本地化生活服務(wù),導航、看新聞、查天氣等都可以通過手機APP或者手表實現(xiàn)。

  最近,出門問問推出了內(nèi)測版的“魔法小問”,要把人工智能從查詢信息——如“今天有什么電影”——提升到提供完整服務(wù),如直接幫助用戶訂電影票。這一點是其他智能系統(tǒng)做不到的。

  擅長連續(xù)對話的“聊天機器人”有圖靈機器人和度秘

  3、圖靈機器人主要做2B業(yè)務(wù),其語音語義系統(tǒng)與小冰很相似,是連續(xù)對話機器人。圖靈可以被嵌入微信公眾號、APP、網(wǎng)站或者智能硬件,用戶可以讓它講笑話、做游戲,也可以用它查快遞、查新聞。最近圖靈機器人接受了奧飛動漫的投資,走智能兒童玩具的路。

  4、度秘是百度推出的一款與小冰類似的連續(xù)對話機器人。另外,用戶可以在對話的同時,查詢“圖靈是誰”這樣的信息——這借助了百度的搜索引擎。最近,百度推出嵌入了”度秘“的實體機器人”小度“。

  還有一類人工智能系統(tǒng)即不是助理也不是聊天機器人,而是被用于做智能語音交互解決方案,他們有訊飛語音云、云知聲的、思必馳

  5、科大訊飛的“訊飛語音云”包括語音合成、語音識別和搜索、語音聽寫等技術(shù),該云對方言、生僻字的語音識別率較高。訊飛語音輸入法就是基于此云開發(fā)的。科大訊飛“主要”做的是2B(面向企業(yè)用戶)服務(wù),將自己的人工智能服務(wù)授權(quán)給其他企業(yè)。

  另外,科大訊飛在最近幾年也開始發(fā)力2C(面向消費者)的產(chǎn)品,比如智能音箱、錄音寶、錄音筆等硬件??梢钥吹剑拼笥嶏w的產(chǎn)品多是智能化的傳統(tǒng)產(chǎn)品,而非個人助理或聊天機器人。另外,科大訊飛偏向深耕“語音識別”,而非連續(xù)對話。

  6、云知聲主要做2B業(yè)務(wù),方向是智能家居和車載市場,這里便有了與出門問問類似的“軟硬結(jié)合”的概念。

  與“可穿戴設(shè)備、手機及電腦上的智能語音語義系統(tǒng)”不同,智能家居語音系統(tǒng)的聲源可能很遠且被噪音包圍。也正因此,云知聲把推廣的重點放在了“聲源識別、噪聲抑制、回聲消除”以及指令的識別上,而非對用戶意圖的理解上(語義理解)。

  值得一提的是,在京東與科大訊飛宣布“在一起”的時候,阿里與云知聲就達成了合作。不過,最近一段時間,未有相關(guān)消息。

  7、思必馳與云知聲的方向挺相似,為企業(yè)客戶提供智能硬件語音交互方案,比如通過語音控制智能硬件的開關(guān)。思必馳在車載領(lǐng)域的合作多一些,比如車蘿卜。最近,思必馳又宣布完成了融資,要把“智能語音融進硬件”這條路走得更遠些。

  8、小冰、小娜(Cortana)、Siri和Google Now

  Cortana、Siri和Google Now,即是聊天機器人,也是個人助理。

  微軟小冰與微軟小娜都基于必應(yīng)搜索和深度神經(jīng)網(wǎng)絡(luò)等技術(shù),屬于2C產(chǎn)品。微軟小娜如今可以在iOS、Android、Window 10系統(tǒng)中使用,她更像一個秘書,可以打電話、發(fā)短信、發(fā)郵件以及查詢上一場曼聯(lián)的比分。但是微軟小娜在國內(nèi)手機中的功能少很多,語音響應(yīng)很慢。

  微軟小冰作為一個對話系統(tǒng),入駐于微信、微博等應(yīng)用或者Windows 10系統(tǒng)中,她也可以查詢各種信息。與小娜不同,小冰不可以調(diào)用電話等應(yīng)用,她更像一個虛擬人物,可以陪用戶聊天(連續(xù)對話)、玩游戲(基于圖像識別等人工智能技術(shù))。

  總的來看微軟小娜和小冰代表著微軟的兩個方向:小冰連續(xù)對話能力強,可移植行強,因此可以嵌入到微信、微博、美拍等應(yīng)用中。小娜是Window 10配套的人工智能系統(tǒng),能夠調(diào)用Windows 10中的各種應(yīng)用和數(shù)據(jù),被視為個人助理。

  Siri大家熟悉,是一款可以調(diào)用應(yīng)用的聊天機器人。如今的Siri除了定鬧鐘、發(fā)短信以外,還可搜索照片、播放音樂、提供建議。它或許不是最強大的,但更面向用戶。

  

  Google Now在國內(nèi)無法良好的使用,對中文的識別效果很差,中文版的能力也很弱。但是作為Google的產(chǎn)品,它天生便有了比其他人工智能產(chǎn)品更多的數(shù)據(jù)、更好的數(shù)據(jù)挖掘能力,這使得Google Now成為了一款“主動推送”能力很強的助理產(chǎn)品。

  Google Now憑借與Chrome瀏覽器、Gmail、Google日歷等等Google應(yīng)用以及Android系統(tǒng)的“近親關(guān)系”,使得其可以實現(xiàn)很多其他產(chǎn)品做不到的功能。比如,語音解鎖、任意界面“OK,Google”喚醒、主動推送你喜歡的和你需要的“即時帖”。有人曾稱贊:

  “早上醒來,我驚奇的發(fā)現(xiàn)Google Now居然直接告訴了我去兼職工作的路上所要花費的時間。但是我沒有設(shè)置,而且那不是我真正工作的地方。”

  可以看到,Google從用戶的地理與實踐信息中明白了他何時去何地兼職。但仍需強調(diào),Google Now在國內(nèi)的功能很少,而且實現(xiàn)一些即時功能,用戶必須把個人數(shù)據(jù)交給Google。

  作為巨頭推出的產(chǎn)品,小娜、Siri和Google Now經(jīng)常被媒體用來比較,但這種比較有些不太恰當。一方面,幾款產(chǎn)品中,只有Siri的易用性在國內(nèi)不錯。另一方面,人工智能系統(tǒng)要明白用戶的用意,必須獲取數(shù)據(jù)——越多越好。因此,人工智能系統(tǒng)必須入駐更多的軟件或者平臺,獲取更高的權(quán)限。小娜雖然入駐了Android與iOS,但她仍然是微軟的產(chǎn)品,在Windows 10上才有更好的易用性。同樣,Google Now與Siri分別是Android陣營與iOS陣營的產(chǎn)品,前者擅長挖掘數(shù)據(jù)、主動推送,后者擅長聊天、被動建議。

  可以看到,這些語音方面的人工智能公司有業(yè)務(wù)2B或2C的,選擇軟硬結(jié)合或者只做軟件解決方案,深耕智能家居或者智能穿戴。這些選擇,無分對錯或者好壞。但總體來看,人工智能仍然沒有認知能力,人與人工智能聊天又涉及到感情投入——這是一個超出自然科學范疇的問題。用戶對智能家居的認知度還不夠高,相關(guān)產(chǎn)品不夠成熟、定價不夠親民。這樣看,搞智能家居系統(tǒng)這樣的生態(tài),似乎有點望得太遠。

  因此,人工智能在普通消費者身上的落地是否可以先在“一個點”上引爆,比如人工智能系統(tǒng)作為助理,從僅可查閱機票信息提升到可以提供訂票服務(wù)。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉