傳聞近一個月的微軟小冰分拆終于敲定。
7 月 13 日一早,微軟中國發(fā)布官方公告,宣布將人工智能小冰業(yè)務(wù)分拆為獨立公司運營,并委任沈向洋博士為新公司董事長,「小冰之父」李笛為首席執(zhí)行官,日本和印尼兩地 Rinna(小冰)的負責人陳湛為日本分部總經(jīng)理,微軟將保持對新公司的投資權(quán)益。
誰是小冰?小冰誕生于 2014 年,是微軟旗下的對話機器人。和普遍意義上的問答機器人不同的是,小冰從誕生之初就瞄準「有情感、會閑聊」的方向,主打情感計算。近年來小冰出現(xiàn)在公眾視野中,常常是因為其繪畫、詩歌、音樂等藝術(shù)方面的創(chuàng)作。在剛剛閉幕的上海世界人工智能大會上,小冰還和小米小愛同學、百度小度、虛擬主播泠鳶共同演唱了主題曲。
小冰是一個國際化的「AI being」。誕生于中國,2015 年推出日本小冰(りんな),2016 年推出美國小冰(Zo)。2017 年,在第五代微軟小冰產(chǎn)品發(fā)布會上,微軟宣布已分別于 2 月和 8 月推出了印度小冰(Ruuh)和印度尼西亞小冰(Rinna)。如今,小冰已經(jīng)進化到第七代。
官方數(shù)據(jù)顯示,全球范圍內(nèi),小冰已覆蓋 6.6 億在線用戶、4.5 億臺第三方智能設(shè)備和 9 億內(nèi)容觀眾。更為重要的是,小冰以其閑聊的特質(zhì),與用戶的單次平均對話輪數(shù)(CPS)達到 23 輪,這對于當下的語音人工智能來說,是非常高的數(shù)字。
小冰的用戶覆蓋主要來自合作伙伴的設(shè)備搭載及應用搭載,其中包括華為、OPPO、vivo、小米等手機或音箱等硬件設(shè)備,以及 QQ、微博、今日頭條等應用程序。另外,小冰也曾嘗試進入垂直產(chǎn)業(yè)。去年,其發(fā)言人曾表示,微軟小冰已經(jīng)完成了金融、地產(chǎn)、紡織、服裝、出版、媒介等十個行業(yè)的商業(yè)化落地和布局。
企查查信息顯示,拆分后的新主體名為「北京紅棉小冰科技有限公司」,法定代表人李笛,大股東李明占股 70%,他僅有「紅棉小冰」一家關(guān)聯(lián)公司。沈向洋任董事長,在工商信息中體現(xiàn)為執(zhí)行董事,目前并不占股。
和小冰從微軟「解綁」類似,6 月,字節(jié)跳動旗下 Tiktok 也在接受類似的挑戰(zhàn)。在美國的持續(xù)監(jiān)管壓力下,字節(jié)跳動正一步步將海外業(yè)務(wù)剝離中國母體,以完全獨立的方式運營。對小冰而言,脫離母體,拿掉「外籍」身份,或許是小冰在中國及東亞進行本土商業(yè)化的前提。
語音是不是未來在微軟內(nèi)部,并行著兩個對話人工智能團隊,一個是小冰,一個是 Cortana。2019 年底,微軟曾發(fā)表聲明稱,將于 2020 年叫停 Cortana 語音助手在中國區(qū)的使用。不過,該聲明中提到的撤出國家除中國外還包括英國、澳大利亞、德國、墨西哥、西班牙、加拿大和印度。
一邊大范圍關(guān)停 Cortana,另一邊拆分小冰品牌,微軟對語音人工智能助手的態(tài)度可見一斑。在人工智能技術(shù)的三個主要方向——語音語義、圖像,以及決策中,語音是最早落地的一個,在小冰誕生后一兩年,產(chǎn)業(yè)中出現(xiàn)了智能音箱熱潮,這主要來自于語音技術(shù)的成熟。
對于一個語音人工智能助手來說,與人類的交流需要經(jīng)過四個階段。語音識別,即將聲音轉(zhuǎn)換成文字;語義理解,也即 NLP 技術(shù),理解人類的意圖;結(jié)果生成,即搜索答案,生成回復;以及語音合成,即 TTS 技術(shù),將答案轉(zhuǎn)化為聲音。
在上述四個步驟中,一和四已經(jīng)成熟,二和三還需時日。NLP 技術(shù)被稱為人工智能皇冠上的明珠,對于漢語這樣復雜的語種來說,更是難上加難。目前想要人工智能助手像真實人類一樣與人交流,效果仍舊不能令人滿意。這也是為什么很多人工智能被稱為人工智障的原因。
盡管業(yè)內(nèi)聲音持續(xù)向好,但語音人工智能的商業(yè)化進程卻非常緩慢。最廣泛的聲音是,語音是未來的人機交互入口,用戶的訴求將通過聲音與智能設(shè)備交互,甚至一度涌現(xiàn)出「語音辦公」的熱潮。這在潮水退去的今天看來,是一件非?;闹嚨氖?。
文字交流在承載信息之上具有保密的特性,而語音天然嘈雜。包括 Siri 在內(nèi)的語音助手長期承擔著「被調(diào)戲」和簡單輔助功能的角色,使用率低、場景有限制等等問題一直難以解決。在這樣的大背景下,微軟對語音人工智能助手的判斷是否仍像 2014 年當時一樣充滿熱忱,答案大概率是否定的。
不過盡管語音不會成為廣泛的人機交互入口,在陪伴機器人以及服務(wù)機器人等特定場景下,仍舊是剛需。語音語義作為人機交互的基石,其不可替代性不言自明,只是在其中進行多少投入,是微軟作為商業(yè)公司需要計算的事。
拆分后的公司董事長沈向洋 他是美國國家工程院外籍院士 前微軟全球執(zhí)行副總裁 2019 年辭職后受聘清華大學高等研究院雙聘教授 | 極客公園
小冰脫離象牙塔
在微軟內(nèi)部,小冰是一個無需負擔營收 KPI 的存在,科研屬性大于商業(yè)屬性,這也是為什么團隊將小冰的市場推廣重點放在「琴棋書畫」而非落地場景的原因。
此次分拆之后,小冰需要以一個獨立的商業(yè)公司的形式運營,對于團隊來說將會構(gòu)成一個挑戰(zhàn)。NLP 技術(shù)難,小冰之所以成為小冰所需要的情感計算技術(shù)更是處在初級階段。對于客戶來說,這樣一個能陪聊會唱歌的聊天機器人是否是剛需,需要畫一個問號。這樣一來,對于拆分后的團隊來說,融資至關(guān)重要。
拆分前,小冰團隊分布在北京、蘇州、東京三個辦公室,約 200 余人,拆分后保留 50 余人,在人工智能領(lǐng)域,是一個小型初創(chuàng)公司的規(guī)模。剛剛離開微軟的沈向洋坐鎮(zhèn),李笛領(lǐng)銜,團隊依舊星光熠熠。對于這家科研型的小型初創(chuàng)公司來說,有世界一流的人才和技術(shù),他們需要的是資金入場,和它一起等待人機交互的新未來。
據(jù)財新網(wǎng)報道,分拆后的小冰已經(jīng)吸引到一批投資人,新公司估值在 7 億美元。接受財新網(wǎng)采訪的投資人表示,是否入股仍在考慮,主要是在衡量其商業(yè)化效率。
但從另一個層面來說,脫離龐大體系的小冰,或許能夠以更自由的姿態(tài)成長。