語音技術(shù)的發(fā)展將在未來進(jìn)行普及化
(文章來源:資本實驗室)
在過去,我們已經(jīng)見證了語音技術(shù)的快速發(fā)展,比如谷歌的Siri、亞馬遜的Alexa。但是,盡管它們在日常生活中很有用,仍然沒有達(dá)到人類的預(yù)期。
語音是一種趨向于有機(jī)和自由流動的媒介,這種媒介不容易轉(zhuǎn)化為數(shù)字技術(shù)。隨著人工智能和計算機(jī)學(xué)習(xí)程序在未來十年的發(fā)展,預(yù)計語音解釋和語音創(chuàng)建軟件將穿越目前的神秘山谷,進(jìn)入一個與人類更為平行的領(lǐng)域。在不遠(yuǎn)的將來,語音命令和語音助手將被證明對我們的日常生活更有用,也將使各種人類技術(shù)界面之間的界限變得模糊。隨著各行業(yè)的基礎(chǔ)技術(shù)(人工智能、語音處理、機(jī)器學(xué)習(xí))的發(fā)展,它只會被賦予更大的技術(shù)重要性。
在語音技術(shù)領(lǐng)域,最前沿的一個方向是神經(jīng)語言規(guī)劃,即NLP。這種新的編程語言將使得計算機(jī)和系統(tǒng)理解語音的真正含義,還可以讓計算機(jī)理解潛藏在背后的人類語調(diào)、諷刺語氣、雙關(guān)語,甚至更深層的上下文線索,如雙重含義。