當前位置:首頁 > 消費電子 > 便攜設備
[導讀]   當語音識別技術應用到計算機桌面的時候,這看起來似乎是一個好主意。但是,對于大多數(shù)人來說,語音識別還不能取代鍵盤和鼠標?,F(xiàn)在,語音技術正用于一個全新的環(huán)境:手機。語音識別技術在手機中的應用將進

  當語音識別技術應用到計算機桌面的時候,這看起來似乎是一個好主意。但是,對于大多數(shù)人來說,語音識別還不能取代鍵盤和鼠標。現(xiàn)在,語音技術正用于一個全新的環(huán)境:手機。語音識別技術在手機中的應用將進一步推動這種技術向新的方向發(fā)展和應用。這是語音識別技術在臺式電腦應用中從來沒有涉足的方向。

  IBM 2011年紀念其創(chuàng)建100周年。IBM在60年代初期創(chuàng)建了一個名為“Shoebox”的試驗性的語音識別系統(tǒng)。這個系統(tǒng)解決了口語算法問題。語音識別技術是在50年代作為一項早期的技術第一次出現(xiàn)的,當時主要是由于好奇。在60年代初,IBM的“Shoebox”設備能夠識別出16個口語單詞并且能夠回答簡單的數(shù)學問題,如“3 + 4 =?”。

  Dragon Systems在80年代初為DOS計算機推出的DragonDictate可能是第一個語音識別應用程序。這個應用程序只能識別單個單詞,每次只說一個單詞。隨著時間的推移,這個應用程序已經(jīng)發(fā)展成為名為“Dragon NaturallySpeaking”(目前是第11個版本,由Nuance通訊公司所有)的產(chǎn)品。這個應用程序能夠翻譯以正常的會話語音和速度讀出的文本。

  語音識別技術在臺式電腦中的應用有兩個制約因素。第一,為了使這個應用程序以更高的準確性工作,這個應用程序必須要進行訓練以便識別用戶的語音特征。Windows Vista和Windows 7操作系統(tǒng)中的本地語音轉(zhuǎn)換文本技術和Dragon NaturallySpeaking等第三方產(chǎn)品仍然都需要一個用戶訓練期才能使用。

  第二個制約因素是鍵盤的流行程度。大多數(shù)人已經(jīng)習慣于鍵盤打字而不是講話,因此,語音控制面臨Dvorak鍵盤布局同樣的應用障礙。當簡單的老式QWERTY鍵盤供貨充足并且工作的很好的時候,為什么要學習使用Dvorak鍵盤呢?

  微軟TellMe團隊是負責為多媒體環(huán)境開發(fā)語音識別技術的部門。TellMe團隊高級產(chǎn)品經(jīng)理Abhi Rele指出,在臺式電腦環(huán)境,用戶有方便的人機交流模式,如鍵盤和鼠標。因此,語音的使用主要是針對語音愛好者的。

  語音控制的計算更廣泛的應用需要兩件事情:更好的方便的應用和主要使用語音的地方。手機正是很長時間以來一直在增長的這種地方。

  Nuance 負責產(chǎn)品管理和營銷的副總裁Matt Revis解釋說,臺式電腦和移動環(huán)境的區(qū)別是這樣的:臺式電腦是一個固定的環(huán)境,重點完全在于臺式電腦的使用情況。因此,臺式電腦的語音技術主要執(zhí)行如下任務:支持辦公應用程序、網(wǎng)絡瀏覽、通訊等。在移動方面,語音更多地用于支持各種生活方式方面:移動中的專業(yè)人員、戶外的有趣活動、免提電話等等。

  Gartner分析師Tuong Nguyen贊同這個觀點:語音在移動環(huán)境中更有意義。他說,從使用的角度看,掌上設備的語音識別功能價值更大。它增加了用戶友好的、方便的輸入方式。

  Nguyen補充說,如果不用語音技術說出一個簡單的說明語句,而是翻動許多菜單或者努力地在小顯示屏鍵盤上進行輸入,語音識別的價值就顯現(xiàn)出來了。隨著觸摸屏設備(沒有物理鍵盤)應用的增長,語音識別技術將用來增強數(shù)據(jù)輸入和輸出。語音識別還支持免提要求或者法律要求。

  在移動設備方面

  因為移動設備一般僅支持臺式電腦的一部分存儲和處理功能,語音處理需要一些時間才能以基本的形式出現(xiàn)在手機中。

  語音處理Springer手冊解釋了手機在2000年代初的情況。盡管那時還有一些局限性,但是,手機經(jīng)過編程之后能夠識別逐個數(shù)字的撥號語音,在某種程度上還能識別人的名字。主要問題是內(nèi)存,因此,大多數(shù)手機一次只能識別10個數(shù)字或者名字。但是,這些作者指出的另一個問題是這個功能使用的比較少,可能是因為手機廠商在這方面的營銷很糟糕。

  隨著手機的增加內(nèi)存和增強處理能力,普通手機的識別能力也增強了。三星電子在2005年發(fā)布的售價99美元的SCH-p-207型手機增加了語音至文本的聽寫功能和語音撥號功能。隨著內(nèi)存達到數(shù)百MB和存儲容量達到數(shù)GB,目前這一代智能手機很少受到限制。

  另一個關鍵的進步是網(wǎng)絡速度。速度更快的無線網(wǎng)絡浪潮抬高了許多大船,包括最新一代的語音處理技術。速度更快的網(wǎng)絡能夠把語音處理任務從網(wǎng)絡遷移到遠程服務器。

  谷歌語音搜索產(chǎn)品經(jīng)理Amir Mane解釋了速度更快的網(wǎng)絡是如何幫助谷歌語音應用程序的。他說,由于所有繁重的處理任務都是由谷歌服務器在網(wǎng)絡上處理的,我們減少了掌上設備計算能力的限制。

本站聲明: 本文章由作者或相關機構(gòu)授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉