阿里智能對話交互實(shí)踐及范式思考
縱觀傳統(tǒng)互聯(lián)網(wǎng)時(shí)代,如果用一個(gè)詞來總結(jié)和概括的話,“連接”這詞再合適不過了,傳統(tǒng)互聯(lián)網(wǎng)時(shí)代主要建立了三種連接:第一,人和信息的連接;第二,人和人的連接;第三,人與商品服務(wù)的連接。第一種連接成就了Google和百度這樣的互聯(lián)網(wǎng)巨頭;人和人的連接成就了Facebook和騰訊這樣的互聯(lián)網(wǎng)公司,人和商品服務(wù)的連接,成就了Amazon、阿里巴巴、京東這樣的巨頭。從這個(gè)意義上看,傳統(tǒng)互聯(lián)網(wǎng)最典型的特征就是連接。
過去3-4年,我們可以看到,互聯(lián)網(wǎng)其實(shí)發(fā)生很大變化,交互的設(shè)備已經(jīng)從PC和智能手機(jī)延伸到更廣泛的智能設(shè)備。智能設(shè)備的快速發(fā)展正在改變著人類和設(shè)備的交互方式。不難看出,無論是智能設(shè)備的發(fā)展和普及,還是用戶的接受度都在快速增長,都促使人和設(shè)備之間交互方式的巨大改變,我們已經(jīng)進(jìn)入“交互時(shí)代“。
正在發(fā)生的變化
那么,交互時(shí)代,人和設(shè)備究竟如何通過自然語言對話展開對話交互的呢?首先,對話交互的特點(diǎn),我認(rèn)為主要有以下四點(diǎn):
1、人和智能設(shè)備的交互一定是自然語言。因?yàn)閷τ谌藖碚f,自然語言是最自然的方式,也是門檻最低的方式。
2、人和設(shè)備的對話交互應(yīng)該是雙向的。
3、人和設(shè)備的對話交互是多輪的。為了完成一個(gè)任務(wù),比如定機(jī)票,這里會涉及多輪交互。
4、上下文的理解。這是對話交互和傳統(tǒng)的搜索引擎最大的不同之處,傳統(tǒng)搜索是關(guān)鍵詞,前后的關(guān)鍵詞是沒有任何關(guān)系的。對話交互實(shí)際上是要考慮到上下文,在當(dāng)前的上下文理解這句話什么意思。
從連接到對話交互,一個(gè)本質(zhì)的改變是什么?舉個(gè)例子,比如淘寶網(wǎng)首頁,拋開內(nèi)容,其本質(zhì)就是鏈接和按鈕。對于用戶來說,無論是點(diǎn)擊鏈接還是按鈕,他的行為完全是由產(chǎn)品經(jīng)理定義好的和是完全確定的,所以它是一種受控、受限的行為,這種方式并不能確保好的用戶體驗(yàn)。
而對話交互,用戶可以說任何內(nèi)容,天文、地理,包羅萬象。我認(rèn)為這背后的本質(zhì)改變就是從“確定性”轉(zhuǎn)變?yōu)?ldquo;不確定性”。實(shí)際上,后面無論是算法還是交互設(shè)計(jì),基本上都想辦法提高語言理解的確定性或者是降低交互設(shè)計(jì)的不確定性。
阿里巴巴在智能對話交互方向上的進(jìn)展和實(shí)踐
下面介紹下阿里巴巴在智能對話交互方向的進(jìn)展和實(shí)踐。先看對話交互邏輯的概況,傳統(tǒng)的對話交互大概會分以下幾個(gè)模塊,從云識別把語言轉(zhuǎn)成文字,語言理解是把用戶說的文字轉(zhuǎn)化成一種結(jié)構(gòu)化的表示,對話管理是根據(jù)剛才那些結(jié)果來決定采取什么樣的合作。在語言設(shè)置這一塊就是根據(jù)acTIon生成一句話,通過一種比較自然的方式把它讀出來。
我認(rèn)為現(xiàn)在人機(jī)交互和傳統(tǒng)的人機(jī)交互一個(gè)主要不同點(diǎn)就在于數(shù)據(jù)和服務(wù)。隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)和服務(wù)越來越豐富,那人機(jī)交互的目的是什么?歸根到底還是想獲取互聯(lián)網(wǎng)的信息和各種各樣的服務(wù)。