“小冰”脫離象牙塔:那個(gè)最不像AI的語音助手創(chuàng)業(yè)了
眾所周知,小冰誕生于 2014 年,是微軟旗下的對話機(jī)器人。和普遍意義上的問答機(jī)器人不同的是,小冰從誕生之初就瞄準(zhǔn)‘有情感、會(huì)閑聊’的方向,主打情感計(jì)算。
7月13日,微軟中國發(fā)布官方公告,宣布將人工智能小冰業(yè)務(wù)分拆為獨(dú)立公司運(yùn)營,并委任沈向洋博士為新公司董事長,傳聞近一個(gè)月的微軟小冰分拆終于敲定。
誰是小冰?
近年來小冰出現(xiàn)在公眾視野中,常常是因?yàn)槠淅L畫、詩歌、音樂等藝術(shù)方面的創(chuàng)作。在剛剛閉幕的上海世界人工智能大會(huì)上,小冰還和小米小愛同學(xué)、百度小度、虛擬主播泠鳶共同演唱了主題曲。
小冰是一個(gè)國際化的‘AI being’。誕生于中國,2015 年推出日本小冰(りんな),2016 年推出美國小冰(Zo)。2017 年,在第五代微軟小冰產(chǎn)品發(fā)布會(huì)上,微軟宣布已分別于 2 月和 8 月推出了印度小冰(Ruuh)和印度尼西亞小冰(Rinna)。如今,小冰已經(jīng)進(jìn)化到第七代。
官方數(shù)據(jù)顯示,全球范圍內(nèi),小冰已覆蓋 6.6 億在線用戶、4.5 億臺(tái)第三方智能設(shè)備和 9 億內(nèi)容觀眾。更為重要的是,小冰以其閑聊的特質(zhì),與用戶的單次平均對話輪數(shù)(CPS)達(dá)到 23 輪,這對于當(dāng)下的語音人工智能來說,是非常高的數(shù)字。
小冰的用戶覆蓋主要來自合作伙伴的設(shè)備搭載及應(yīng)用搭載,其中包括華為、OPPO、vivo、小米等手機(jī)或音箱等硬件設(shè)備,以及 QQ、微博等應(yīng)用程序。另外,小冰也曾嘗試進(jìn)入垂直產(chǎn)業(yè)。去年,其發(fā)言人曾表示,微軟小冰已經(jīng)完成了金融、地產(chǎn)、紡織、服裝、出版、媒介等十個(gè)行業(yè)的商業(yè)化落地和布局。
2019 年 7 月 14 日 北京 中央美術(shù)學(xué)院美術(shù)館舉辦微軟人工智能小冰‘個(gè)人繪畫展’《或然世界》這是國內(nèi)首個(gè)人工智能的個(gè)人畫展 | 視覺中國
企查查信息顯示,拆分后的新主體名為‘北京紅棉小冰科技有限公司’,法定代表人李笛,大股東李明占股 70%,他僅有‘紅棉小冰’一家關(guān)聯(lián)公司。沈向洋任董事長,在工商信息中體現(xiàn)為執(zhí)行董事,目前并不占股。
和小冰從微軟‘解綁’類似,6 月,字節(jié)跳動(dòng)旗下 Tiktok 也在接受類似的挑戰(zhàn)。在美國的持續(xù)監(jiān)管壓力下,字節(jié)跳動(dòng)正一步步將海外業(yè)務(wù)剝離國內(nèi)母體,以完全獨(dú)立的方式運(yùn)營。對小冰而言,脫離母體,拿掉‘外籍’身份,或許是小冰在中國及東亞進(jìn)行本土商業(yè)化的前提。
語音是不是未來
在微軟內(nèi)部,并行著兩個(gè)對話人工智能團(tuán)隊(duì),一個(gè)是小冰,一個(gè)是 Cortana。2019 年底,微軟曾發(fā)表聲明稱,將于 2020 年叫停 Cortana 語音助手在中國區(qū)的使用。不過,該聲明中提到的撤出國家除中國外還包括英國、澳大利亞、德國、墨西哥、西班牙、加拿大和印度。
一邊大范圍關(guān)停 Cortana,另一邊拆分小冰品牌,微軟對語音人工智能助手的態(tài)度可見一斑。在人工智能技術(shù)的三個(gè)主要方向——語音語義、圖像,以及決策中,語音是最早落地的一個(gè),在小冰誕生后一兩年,產(chǎn)業(yè)中出現(xiàn)了智能音箱熱潮,這主要來自于語音技術(shù)的成熟。
對于一個(gè)語音人工智能助手來說,與人類的交流需要經(jīng)過四個(gè)階段。語音識(shí)別,即將聲音轉(zhuǎn)換成文字;語義理解,也即 NLP 技術(shù),理解人類的意圖;結(jié)果生成,即搜索答案,生成回復(fù);以及語音合成,即 TTS 技術(shù),將答案轉(zhuǎn)化為聲音。
在上述四個(gè)步驟中,一和四已經(jīng)成熟,二和三還需時(shí)日。NLP 技術(shù)被稱為人工智能皇冠上的明珠,對于漢語這樣復(fù)雜的語種來說,更是難上加難。目前想要人工智能助手像真實(shí)人類一樣與人交流,效果仍舊不能令人滿意。這也是為什么很多人工智能被稱為人工智障的原因。
盡管業(yè)內(nèi)聲音持續(xù)向好,但語音人工智能的商業(yè)化進(jìn)程卻非常緩慢。最廣泛的聲音是,語音是未來的人機(jī)交互入口,用戶的訴求將通過聲音與智能設(shè)備交互,甚至一度涌現(xiàn)出‘語音辦公’的熱潮。這在潮水退去的今天看來,是一件非常荒謬的事。
文字交流在承載信息之上具有保密的特性,而語音天然嘈雜。包括 Siri 在內(nèi)的語音助手長期承擔(dān)著‘被調(diào)戲’和簡單輔助功能的角色,使用率低、場景有限制等等問題一直難以解決。在這樣的大背景下,微軟對語音人工智能助手的判斷是否仍像 2014 年當(dāng)時(shí)一樣充滿熱忱,答案大概率是否定的。
不過盡管語音不會(huì)成為廣泛的人機(jī)交互入口,在陪伴機(jī)器人以及服務(wù)機(jī)器人等特定場景下,仍舊是剛需。語音語義作為人機(jī)交互的基石,其不可替代性不言自明,只是在其中進(jìn)行多少投入,是微軟作為商業(yè)公司需要計(jì)算的事。
拆分后的公司董事長沈向洋 他是美國國家工程院外籍院士 前微軟全球執(zhí)行副總裁 2019年辭職后受聘清華大學(xué)高等研究院雙聘教授 | 極客公園
小冰脫離象牙塔
在微軟內(nèi)部,小冰是一個(gè)無需負(fù)擔(dān)營收 KPI 的存在,科研屬性大于商業(yè)屬性,這也是為什么團(tuán)隊(duì)將小冰的市場推廣重點(diǎn)放在‘琴棋書畫’而非落地場景的原因。
此次分拆之后,小冰需要以一個(gè)獨(dú)立的商業(yè)公司的形式運(yùn)營,對于團(tuán)隊(duì)來說將會(huì)構(gòu)成一個(gè)挑戰(zhàn)。NLP 技術(shù)難,小冰之所以成為小冰所需要的情感計(jì)算技術(shù)更是處在初級(jí)階段。對于客戶來說,這樣一個(gè)能陪聊會(huì)唱歌的聊天機(jī)器人是否是剛需,需要畫一個(gè)問號(hào)。這樣一來,對于拆分后的團(tuán)隊(duì)來說,融資至關(guān)重要。
拆分前,小冰團(tuán)隊(duì)分布在北京、蘇州、東京三個(gè)辦公室,約 200 余人,拆分后保留 50 余人,在人工智能領(lǐng)域,是一個(gè)小型初創(chuàng)公司的規(guī)模。剛剛離開微軟的沈向洋坐鎮(zhèn),李笛領(lǐng)銜,團(tuán)隊(duì)依舊星光熠熠。
對于這家科研型的小型初創(chuàng)公司來說,有世界一流的人才和技術(shù),他們需要的是資金入場,和它一起等待人機(jī)交互的新未來。分拆后的小冰已經(jīng)吸引到一批投資人,新公司估值在 7 億美元。接受財(cái)新網(wǎng)采訪的投資人表示,是否入股仍在考慮,主要是在衡量其商業(yè)化效率。