洽談:孵化下一種流行應(yīng)用是手機(jī)AI的未來
比氣溫更能準(zhǔn)確預(yù)示春天到來的,是各大手機(jī)廠商的蠢蠢欲動(dòng)。
進(jìn)入3月,各手機(jī)品牌都開始啟動(dòng)了新一年的攻勢。有意思的是,去年還“幾支獨(dú)秀”的AI,今年已經(jīng)在國內(nèi)手機(jī)圈成為了遍地開花的關(guān)鍵詞。
或真或假打著AI名頭的手機(jī),普遍都會(huì)灌輸給消費(fèi)者一個(gè)認(rèn)識(shí):用了AI,你的手機(jī)能力將會(huì)更強(qiáng)。這其中被提到最多的當(dāng)然是攝影能力,其他諸如美顏、翻譯、識(shí)圖,也是廠商的重點(diǎn)宣傳領(lǐng)域。
類似的宣傳看多了,似乎我們會(huì)形成一個(gè)觀點(diǎn):AI的作用,就是增強(qiáng)。
AI能夠普遍增強(qiáng)手機(jī)和應(yīng)用的能力,這當(dāng)然事實(shí)。但這種敘事策略用多了之后,我們很可能會(huì)忽略另外一個(gè)可能:作為一種門類繁多,負(fù)載各種解決方案的技術(shù),AI完全可以作為基礎(chǔ)條件,讓開發(fā)者去創(chuàng)造一種今天我們不熟悉的,甚至完全沒有概念的手機(jī)應(yīng)用。而恰恰只有當(dāng)這種“未知能力”流行起來,AI在手機(jī)中的價(jià)值才會(huì)是不可替代的。
這個(gè)“未知”的機(jī)會(huì)來自哪里?孵化它需要怎樣的條件?這里有一些在已知條件上建立的,關(guān)于手機(jī)AI的腦洞。
機(jī)會(huì)在哪里?之所以期待AI時(shí)代會(huì)出現(xiàn)某些全新的、可以風(fēng)靡的應(yīng)用體驗(yàn),是因?yàn)榇饲八谢鸨囊苿?dòng)應(yīng)用,都是建立在智能手機(jī)一開始就建立起來的運(yùn)算與硬件格局。芯片+觸屏交互+攝像頭+GPS,構(gòu)成了我們手機(jī)中一切社交、O2O、購物和娛樂功能的基本載體。這些能力的基礎(chǔ)條件是很早就固定好的,開發(fā)者根據(jù)這些基礎(chǔ)閃轉(zhuǎn)騰挪,想方設(shè)法構(gòu)建新的體驗(yàn)和商業(yè)模式出來。
而AI正在改變這些基礎(chǔ)。
就目前來看,AI給手機(jī)帶來的基礎(chǔ)能力提升主要可以體現(xiàn)在四個(gè)方面:
一、視頻和直播:大家都知道,AI正在改變我們理解和處理視頻的方式。在通過AI芯片進(jìn)行實(shí)時(shí)運(yùn)算,在手機(jī)視頻中進(jìn)行人臉與手勢、人體姿勢識(shí)別,以及人像分割、視頻風(fēng)格化等操作正在變?yōu)榭赡堋?/p>
二、AR:在手機(jī)上進(jìn)行更好的增強(qiáng)現(xiàn)實(shí)體驗(yàn),無法離開AI的幫助。深度估計(jì)、光線估計(jì)、環(huán)境理解等算法價(jià)值,能夠幫助更符合市場預(yù)期的AR出現(xiàn)。而這些能力,又不僅僅作用于AR。
三、攝影:AI進(jìn)行拍照風(fēng)格化和人像深度處理,已經(jīng)并不新鮮。接下來用AI進(jìn)行圖像增強(qiáng),處理光影拍攝和動(dòng)態(tài)捕捉會(huì)成為新的亮點(diǎn)。
四、識(shí)別:用AI來識(shí)別文字和商品、景物等等,正在成為新的熱點(diǎn)。這方面能力可能給很多手機(jī)應(yīng)用帶來新的機(jī)會(huì)。比如拍照翻譯、手寫文字識(shí)別與辨認(rèn)、文字情緒識(shí)別等等,能廣泛應(yīng)用于翻譯、輸入和社交領(lǐng)域。而圖片分類、圖像超分辨、物體識(shí)別等,又可以作用于自媒體、社交網(wǎng)絡(luò)和購物。
如此多的新能力和背后復(fù)雜的算法作用,其實(shí)就是給了開發(fā)者新的“食材”。這些“食材”最簡單的運(yùn)用方式就是跟“老菜”炒在一起,比如在短視頻中加入AI特效和AI識(shí)別能力;更復(fù)雜一點(diǎn)是單獨(dú)組成“AI新菜”;更深一步,是重新理解手機(jī)的基礎(chǔ)能力,構(gòu)想出未曾出現(xiàn)過的未知功能。
總體而言,AI帶給手機(jī)的核心改變?cè)谟?,手機(jī)可以通過攝像頭理解現(xiàn)實(shí)世界。
而且這個(gè)功能必然會(huì)越來越強(qiáng)。如何利用這一點(diǎn),來整合功能,創(chuàng)造新應(yīng)用,建立自身的流量邏輯,才是今天擺在手機(jī)AI和移動(dòng)開發(fā)者面前的真正機(jī)會(huì)。
誰來提供機(jī)會(huì)?對(duì)于手機(jī)而言,先有好創(chuàng)意還是先有開發(fā)基礎(chǔ),并不是一個(gè)“雞生蛋,蛋生雞”的問題。而是就像烹飪一樣,必須先有食材,廚師才能去想方設(shè)法開發(fā)新味道,做出新菜式。
對(duì)于手機(jī)AI這個(gè)命題而言,一個(gè)消費(fèi)者沒有嘗試過的,可以大火起來的AI應(yīng)用,必須是建立在充足的開發(fā)基礎(chǔ)之上。
而今天來看,這個(gè)開發(fā)基礎(chǔ),必須建立在三個(gè)勢能體構(gòu)成一個(gè)有序生態(tài)的基礎(chǔ)上:
一、開放的AI芯片:業(yè)界目前開發(fā)AI架構(gòu)與應(yīng)用,主要依靠云計(jì)算來提供算力。更后端,是英偉達(dá)和谷歌的云計(jì)算AI加速芯片在起作用。但這種模式來到手機(jī)端顯然不是長久之計(jì),一方面上傳用戶的視頻、照片等資料到云端有隱私安全問題;另一方面這個(gè)過程需要時(shí)間,會(huì)造成卡頓和延遲,并且一旦沒網(wǎng)就失效了。
而沒有AI芯片,只在特定硬件布置AI算法的手機(jī),則面臨無法支撐未知AI應(yīng)用開發(fā)的問題。因?yàn)樾碌膽?yīng)用肯定要CPU、GPU以及AI專項(xiàng)處理單元進(jìn)行協(xié)同支持。手機(jī)缺失對(duì)通用AI任務(wù)的支持能力,那么用戶就只能體驗(yàn)預(yù)先設(shè)置好的幾個(gè)AI功能,無法迎接新的AI體驗(yàn)。這就是為什么蘋果要開發(fā)A11仿生神經(jīng)芯片,華為芯片要開發(fā)麒麟970,并且要基于芯片建設(shè)開發(fā)生態(tài)。
二、平臺(tái)與框架使能AI開發(fā):只有芯片當(dāng)然不行,開發(fā)者又不能拆了芯片研究一下自己該怎么干。因此,能夠開放不同層面AI能力,接入主流AI開發(fā)框架的手機(jī)AI平臺(tái),就變得至關(guān)重要。這就像在算力與開發(fā)者之間架起一個(gè)通道和市場,開發(fā)者要知道怎么進(jìn)入AI,還要知道自己能從手機(jī)AI中得到哪些利益。
比如基于麒麟970芯片的HiAI架構(gòu),就可以視為華為對(duì)手機(jī)AI開發(fā)生態(tài)的平臺(tái)與開發(fā)者布局。降低開發(fā)者的進(jìn)入成本,實(shí)行利益共享和保護(hù)知識(shí)產(chǎn)權(quán)的計(jì)劃,是一個(gè)手機(jī)AI開發(fā)平臺(tái)的立足保證。畢竟生態(tài)環(huán)境建好了,政策給力了,“招商引資”才能開動(dòng)嘛。
三、意識(shí)到機(jī)會(huì)的開發(fā)者:在手機(jī)AI這個(gè)命題上,平臺(tái)僅僅是黑土地,而開發(fā)者才是選擇如何播種、收割的農(nóng)人。但擺在開發(fā)者群落面前的第一要?jiǎng)?wù),是要認(rèn)識(shí)到有這塊肥田,有AI開發(fā)這種可能。然后就是技術(shù)磨合與開腦洞想創(chuàng)意的時(shí)間了,建立基于AI的商業(yè)模式和產(chǎn)業(yè)壁壘也同樣重要。
以上三者之間的良性循環(huán),可以看做是一個(gè)農(nóng)業(yè)生態(tài)的基礎(chǔ)。當(dāng)然我們作為消費(fèi)者,最終希望看到的是端上桌的食物,可是沒有果園農(nóng)場,食物又從哪來呢?
手機(jī)AI的機(jī)會(huì),絕不僅僅在APP更遠(yuǎn)一步,我們應(yīng)該看到的是,AI帶給手機(jī)的并不僅僅是創(chuàng)造新爆款應(yīng)用的可能。假如技術(shù)條件進(jìn)一步催熟,可能我們會(huì)從手機(jī)AI那里得到更多。
比如說,我們?nèi)ツ杲?jīng)歷過AI音箱大戰(zhàn),而今年我們看到越來越多的硬件,尤其是家電正在進(jìn)入AI交互模式。
但大家有沒有想過,既然AI音箱的主要價(jià)值在于交互,而不是“音質(zhì)”。那么為什么一定要放個(gè)很大的硬件,而不是直接跟手機(jī)對(duì)話,讓它幫你實(shí)現(xiàn)找內(nèi)容、購物、控制家居系統(tǒng)的功能呢?
畢竟手機(jī)才是永不離身的利器,也不存在喚醒距離等限制。
這就是因?yàn)?,音箱和IoT設(shè)備的AI功能需要依托云計(jì)算來進(jìn)行,放在手機(jī)上運(yùn)轉(zhuǎn)過慢、耗電過高。
而這些問題,可能會(huì)被AI芯片和5G等技術(shù)撬點(diǎn),以及手機(jī)AI開發(fā)生態(tài)所改變——如果我們可以達(dá)成高效的終端AI計(jì)算和快速傳輸,那么手機(jī)完全可以取代音箱或者其他硬件載體,成為AI生活的唯一入口。這種技術(shù)可能性,會(huì)是手機(jī)帶給AI產(chǎn)業(yè)的最大驚喜。
直接與手機(jī)對(duì)話,使用手機(jī)的傳感器和攝像頭來理解和控制IoT體系,實(shí)現(xiàn)商務(wù)、家庭、娛樂場景的AI化,甚至將手機(jī)與無人駕駛系統(tǒng)打通,那么手機(jī)的價(jià)值將又一次飛躍。
過去我們始終在猜測,手機(jī)的中心化地位會(huì)不會(huì)在AI時(shí)代被消弭。但假如AI就發(fā)生在手機(jī)上,這個(gè)猜測是不是不攻自破了呢?
總之,AI帶給手機(jī)的,肯定不僅僅是局部能力的增強(qiáng),而是重新組織了手機(jī)應(yīng)用開發(fā)的基本要素。在新條件下,AI或者手機(jī)能走到哪一步呢?
這是個(gè)讓人有點(diǎn)心動(dòng)的未知數(shù)。