近日,“全球AI+智適應(yīng)教育峰會”在北京嘉里中心大酒店盛大開幕,峰會由聯(lián)合乂學教育松鼠AI,以及IEEE(美國電氣電子工程師學會)教育工程和自適應(yīng)教育標準工作組共同舉辦,匯聚國內(nèi)外頂尖陣容。
AI智適應(yīng)學習是目前產(chǎn)學研三界關(guān)注度最高的話題之一。此次峰會,主辦方邀請了美國三院院士、機器學習泰斗Michael Jordan,全球公認機器學習之父Tom Mitchell,斯坦福國際研究院(SRI)副總裁Robert Pearlstein、美國大學入學考試機構(gòu)ACT學習方案組高級研究科學家Michael Yudelson等頂尖學者。
圖為:新東方AI研究院院長 瞿煒博士
在大會下午主論壇上,新東方AI研究院院長瞿煒博士發(fā)表了精彩演講。瞿煒博士在人工智能領(lǐng)域有近20年的豐富研究經(jīng)歷,此前在西門子公司有過工作經(jīng)歷。新東方作為中國最早在美上市的教育公司,在全球已經(jīng)有超過2000萬的學生使用他們的平臺。瞿煒博士在現(xiàn)場的演講正是新東方在AI時代的最新思考。
瞿煒博士認為,通用AI已經(jīng)走向瓶頸,場景AI將迎來新的蓬勃發(fā)展。而對于AI+教育來說,盡管是極具潛力的市場,但是依然面臨著諸多挑戰(zhàn),比如語音識別、人臉識別、文字識別、視頻分析等。新東方AI研究院雖然剛剛成立,但會在整體戰(zhàn)略上走向“開放”,并將以N-Brain聯(lián)盟為基點,在數(shù)據(jù)、場景、資源層面做更多與業(yè)界、學界的合作。
以下大部分為瞿煒的演講原文,做了不改變原意的編輯與整理。
作為一個接觸AI接近20年的老兵,根本就沒有想到AI能成為一個行業(yè),甚至在2016年左右的時候,隨著AlphaGo為公眾所熟悉,AI幾乎是指數(shù)級地變成了一個行業(yè),所有的互聯(lián)網(wǎng)公司都在擁抱AI,所有的行業(yè)也越來越多地去touch AI。
但是新東方很冷靜,俞老師(注:俞敏洪)很冷靜,并沒有著急,給大家的感覺是新東方在做什么?其實我們一直在做AI,各個BU一直在應(yīng)用AI,但是我們很冷靜地在思考教育+AI到底應(yīng)該怎么做?什么才是最好的時機來擁抱AI?
AI的冬天來了,但春天也不遠
事實上,AI在兩年的火熱之后,冬天已經(jīng)來臨了,就像外面北京的冬天來到了一樣。
語音識別其實已經(jīng)很成熟,但是機器學習、NLP、計算機視覺這幾個技術(shù)(占到AI最重要部分的分支)其實已經(jīng)過了它的頂峰。以深度學習為例,經(jīng)過幾年大規(guī)模的應(yīng)用,其實越來越多的研究者已經(jīng)發(fā)現(xiàn),它已經(jīng)到達了一個瓶頸。我們發(fā)現(xiàn)AI并不是像我們想像的那樣真的能去替代人。
中國有一句固話叫“冬天來了,春天還遠嗎”?AI的一個冬天來了,它的下一個春天是什么呢?其實,很多AI行業(yè)中的人也意識到了是場景化的AI。
通用化的AI在過去的兩年中得到了極大的普及,為公眾所接受,很多創(chuàng)業(yè)公司如雨后春筍般地興起,獲得了大量的投資,這兩年大家都感受到了,甚至融資的速度超越了前幾年互聯(lián)網(wǎng)的速度。
但是,它的冬天來了,因為很多AI的公司并沒有商業(yè)化變現(xiàn),當他們落地的時候發(fā)現(xiàn),變現(xiàn)是如此地困難。尤其是在ToC領(lǐng)域。這是為什么呢?
實際上是因為AI和行業(yè)的結(jié)合非常非常困難,不是那么容易的。所以我們看到通用的AI的發(fā)展將會變成這樣一個趨勢,但是場景化的AI在AI和行業(yè)的結(jié)合領(lǐng)域會產(chǎn)生無窮無盡的機會。
AI+教育將會是對整個教育科技的重構(gòu)
AI+汽車已經(jīng)形成了垂直的平臺,百度的阿波羅、谷歌的Waymo都產(chǎn)生了這樣的平臺,AI+生活催生了Facebook的出現(xiàn),AI+教育會出現(xiàn)什么呢?我們非常期待。這也新東方對AI+教育這件事深度的思考。
我們認為AI+教育并不一定就是通用AI技術(shù)直接嫁接到教育領(lǐng)域,像出現(xiàn)了很多產(chǎn)品級的應(yīng)用一樣,更多的AI+教育將會是對整個教育科技的重構(gòu)。很多數(shù)據(jù)都已經(jīng)準備好,比如說大數(shù)據(jù)、云計算,但在AI+教育領(lǐng)域必將出現(xiàn)一個新的大腦,我們姑且稱之為教育大腦,也必將會出現(xiàn)新的操作系統(tǒng),這種操作系統(tǒng)可能是在云,也可能在端,因為所有的AI系統(tǒng)肯定是一個軟硬結(jié)合的系統(tǒng)。
個性化的學習平臺將會雨后春筍地涌現(xiàn)
個性化的學習平臺將會雨后春筍地涌現(xiàn)。我們認為它一定是開放的,為什么?因為個性化的學習太難了,很難一個公司把它實現(xiàn)。因為這么多的國家,這么多的人群,不同的年齡段、不同的學科,這個問題對研究界而言,幾乎是沒有唯一解的,所以不可能由一家公司來完成。
新東方AI研究院在“新東方AI+教育戰(zhàn)略”基本的步驟,大家可以關(guān)注教育大腦的具體應(yīng)用。
這張圖很多在座的朋友們可能都已經(jīng)看到很多次了,不光是在教育領(lǐng)域,其實很多的領(lǐng)域都可以用這張圖來表示,但我們關(guān)心的這8個領(lǐng)域,最關(guān)注的是他們在這個教育上有什么樣的不一樣,而不僅僅是這8個詞。所以我借此機會介紹一下我們關(guān)注的20個挑戰(zhàn)。
“AI+教育”的20個挑戰(zhàn)
語音識別的挑戰(zhàn):中英混合、專有名詞識別難、強噪聲
通用的語音引擎真正應(yīng)用到教育這個場景下的時候,其實并不像在很多場景下那么有效,比如說通用的新聞,其實我們很多的云引擎,無論是谷歌、訊飛、百度的都可以做到接近人或者是超越人的水平,97%以上是沒有任何問題的,99%在特定的場景下也是可實現(xiàn)的。但當進入到教育這個場景下的時候,卻發(fā)現(xiàn)它們并不產(chǎn)生作用。比如我們應(yīng)用到中英混合識別問題,新東方的很多課程都是在拿中文教英語,所以當你看這個波形的時候,中英之間的切換幾乎是糅在一起的,這對語音識別是一個挑戰(zhàn)的問題。
另外進入到教育領(lǐng)域,其實它的場景是非常非常零碎的。你去分科施教的時候,會發(fā)現(xiàn)在數(shù)理化有很多的公式和名詞是要分別的,現(xiàn)有的中英文的引擎,我們發(fā)現(xiàn)原有的識別率在現(xiàn)有的場景下會下降到70%左右。還有一個是很多朋友即將面對的,中國人學英語的時候,我們的發(fā)音(尤其是孩子們的發(fā)音),我們稱之為“chinglish”,用中文引擎用英文引擎識別都不是有效的,所以我們認為是第三種引擎。
還有我們的線下教室是強噪聲、強混響的語音問題,這個問題解決起來非常困難。亞馬遜的Echo之所以能被大規(guī)模地應(yīng)用起來,其實關(guān)鍵是解決了一個工程的問題,就是語音識別的問題,當語音識別應(yīng)用到教育場景下的時候,這樣一個語音增強的工程問題必須要面對,否則我們基本上很難去實現(xiàn)線下場景下真實的語音識別。
還有多人混合下的聲文識別問題,教育場景下無論是線上還是線下,尤其是一對多的情況,經(jīng)常會出現(xiàn)多個孩子同時回答一個問題,多個孩子同時討論一個問題,這種情況下做語音識別,不得不面臨如何去把這個聲音分開的問題,這些問題都非常挑戰(zhàn)。
人臉識別的挑戰(zhàn):超低分辨率、強畸變角度、遮擋
進入到人臉識別,這是這一撥AI炒得最熱的,但進入到教育這個場景下的時候很多人臉識別公司也不見了。我們在和幾乎大家能看到的所有國內(nèi)、國外最牛的人臉公司進行合作。這三個是我們列舉的很實際的問題。
第一個是超低分辨率下的人臉識別的問題,右邊這張圖是一個真實的線下課堂場景,就用一個簡單的監(jiān)控攝像頭試圖來覆蓋整個教室,你會發(fā)現(xiàn)問題出現(xiàn)了,當你能看清楚第一排的學生的時候,你就無法看清楚最遠這一排的學生,你試圖要看清楚兩邊的孩子的時候,必須要用一個廣角鏡頭,而這導致了很大的畸變,所以在教育的場景下是非常非?,F(xiàn)實的,很難像普通的人臉識別問題一樣給你一個大頭照這么簡單。畸變的角度下的人臉識別問題就出現(xiàn)了。
孩子們是非?;钴S的,這也是教育的本質(zhì)所在,這就導致了人臉識別不是一個靜態(tài)的,而是老老實實地等著你去識別,你如何在動態(tài)的情況下、大遮擋的情況下而不是僅僅是局部遮擋的情況下能夠?qū)崿F(xiàn)人臉的識別?這是必須要解決的一個問題,不解決表情怎么識別,怎么時時刻刻知道孩子在干什么,所以說起來容易,理想很美好,現(xiàn)實其實是很骨感的。
文字識別挑戰(zhàn):數(shù)理化的公式、手寫體難識別
進入文字識別領(lǐng)域,我們面臨的問題是數(shù)理化的公式、圖形、圖像識別問題,還有包括手寫體的識別問題,這都是我們必須要解決的。
NLP的挑戰(zhàn):多輪對話難以實現(xiàn)、智能批改有局限
還有NLP(自然語言處理)的挑戰(zhàn),最經(jīng)典的是多輪對話,這個多輪對話還不是普通意義上的客服機器人,我們希望答疑甚至是替代老師,一定是基于內(nèi)容的。當基于內(nèi)容領(lǐng)域的時候,這個多輪對答更困難,號稱能做到二十七輪對話的話是非常非常困難的,我不認為在未來的一兩年內(nèi)能發(fā)生這樣一件事,但也許我們能解決三輪、五輪、七輪。
線上線下課堂自動提煉的問題,新東方也是很多教育公司可能的剛需,我們有這么多的課堂,這么多的老師,如何能用AI的手段自動地提煉課堂的內(nèi)容是解決教學一體化的非常重要的手段。
中英作文的智能批改閱卷,其實已經(jīng)有成熟的產(chǎn)品了,但我們的實踐發(fā)現(xiàn),要做到真正意義上的批改,必須要進入語義層面,這是非常非常有挑戰(zhàn)的。
視頻分析的挑戰(zhàn):線下的情況太復雜
其實有很多公司也在向這個方向努力。我們完整的教學過程既包括了老師的分析,也包括了學生的分析。對于老師,我們希望對他所有的教學過程進行評價,對于學生,我們希望對他的微表情進行分析??墒窃诂F(xiàn)在的場景下,線上簡單一些,尤其是英語的教學,因為我們幾乎可以正對著他,有一個大頭照;但線下的情況太復雜了。
圖譜的挑戰(zhàn):高精知識地圖缺乏
我們幾乎沒有看到任何一張基于學科的高精知識地圖。當AI進入到無人駕駛領(lǐng)域,高精地圖已經(jīng)成為了一個必然的選項,但我們講了半天的AI+教育,卻很難看到一張基于學科的知識地圖,所以這是一個非常非?;A(chǔ)的工作。
AR·VR的挑戰(zhàn):AI合成教師需要互動
最近一個星期最火的事情就是新華社和搜狗一起做了一個AI合成主播。主播技術(shù)簡單,因為它是一個單向的,但當我們把這件事放在教育領(lǐng)域談的時候,就是個挑戰(zhàn),因為AI合成教師不僅僅是一個單向的講,而是需要互動。
機器學習的挑戰(zhàn):自動標注難、場景零碎、個性化難
自動標注的問題。所有的AI都牽扯到標注,因為我們現(xiàn)在接觸到的絕大部分是監(jiān)督式的。AI如何做自動的標注,小數(shù)據(jù)量的情況不是問題,但像新東方這樣擁有海量的公司做這樣的事情的時候,我們發(fā)現(xiàn)自動標注是我們必須要面對的問題。
教育場景是如此地零碎和復雜。其實具體到每一個小的場景下的時候,我們發(fā)現(xiàn),小樣本級的訓練問題是如此地突出,這次大會有一個主題就是自適應(yīng)學習,你會發(fā)現(xiàn)專注到每一個孩子的時候,其實它的樣本數(shù)據(jù)并不多,尤其是冷啟動階段。
個性化學習問題。這可能是我們繞不開的問題,因為一開始的時候不可能對所有的孩子都有一個模型來進行推理,如何把一個模型個性化到一個孩子的身上是一個難題。
新東方的開放戰(zhàn)略:以N-Brain聯(lián)盟為基點,數(shù)據(jù)、場景、資源全部開放
上面這20個問題每一個都如此具有挑戰(zhàn)性,把它做成了,也許能成為一家偉大的公司,至少能對這個行業(yè)產(chǎn)生很大的影響。我們面臨這20個,可能還不止20個,新東方怎么辦?我們的思考其實很簡單,就是開放。
新東方愿意把數(shù)據(jù)拿出來,把場景拿出來,把資源拿出來,因為我們知道我們的起步很晚,我們不可能在所有上述領(lǐng)域再去重新來過,新東方AI研究員也不可能以一己之力跟那么多的公司PK,所以我們能做到的就是“開放”。
我們兩個星期之前成立了N-Brain聯(lián)盟。“N”,首先它代表了N種教育場景,也代表了N種可能,更代表了N個model。N在自然數(shù)集里其實代表了無窮的概念,也代表了力,也代表了氮元素占到了大氣層78%的比例,我們希望以這種形態(tài),能和在座的各位朋友合作,共同做好AI+教育這件事情。
目前,我們已經(jīng)和美國的伊利諾伊大學、中國自動化科學研究所這樣頂尖的AI研究機構(gòu)合作,我們也和北京師范大學、斯坦福大學這樣頂級的教育領(lǐng)域、心理學領(lǐng)域、認知科學領(lǐng)域、腦科學領(lǐng)域的研究機構(gòu)合作,以及與GSV(注:全球硅谷投資公司)等一起合作,我們一起團結(jié)資本的力量,還有像騰訊、網(wǎng)易這樣互聯(lián)網(wǎng)的公司,甚至包括很多很多的創(chuàng)業(yè)公司,我們正在合作,越來越多的公司加入進我們這個聯(lián)盟。新東方可以把數(shù)據(jù)貢獻出來,我們也愿意把所有的場景貢獻出來,我們也愿意把資源貢獻出來。
新東方AI研究院不僅僅是一個研究的機構(gòu)(注:2018年7月成立),同時我們也愿意做一個橋,連接內(nèi)部的資源和外部所有的資源,一起把“AI+教育”這件事情做好,我們的目的不是為了新東方自己用,而是希望向所有的機構(gòu)和所有的公立學校開放。
2018年度AI最佳掘金案例評選
人工智能風雨60年,與其說技術(shù)升級促成了今天的浪潮,不如說當前的人工智能,終于站在離商業(yè)最近的位置。
去年,首屆「AI 最佳掘金案例年度評選」活動一經(jīng)推出,便受到了AI方案輸出方和AI技術(shù)需求方的極大關(guān)注。評選從商業(yè)維度出發(fā),尋找用戶/客戶問題解決能力強的產(chǎn)品和解決方案。
現(xiàn)在,我們再次站在AI浪潮之巔,正式啟動第二屆「AI最佳掘金案例評選」。
在AI+教育領(lǐng)域我們一共設(shè)置了6個獎項,歡迎踴躍報名,報名地址:https://www.leiphone.com/special/custom/AITopTen2018.html