陶大程:機(jī)器人商業(yè)化大勢(shì)所趨但基礎(chǔ)很重要
陶大程:機(jī)器人商業(yè)化大勢(shì)所趨但基礎(chǔ)很重要
人工智能及機(jī)器人離現(xiàn)實(shí)生活越來越近了,這從人才的流向便可窺探一二。僅在2016年,就有數(shù)名知名的學(xué)界學(xué)者接二連三加盟業(yè)界,如李飛飛、Ruslan Salakhutdinov、Yoshua Bengio等。學(xué)界與業(yè)界的密切合作,將對(duì)人工智能和機(jī)器人的產(chǎn)品商業(yè)化落地有極大幫助,同時(shí)企業(yè)界應(yīng)用數(shù)據(jù)的積累也將推進(jìn)學(xué)界技術(shù)探索的進(jìn)程。
對(duì)于學(xué)界與業(yè)界雙向合作,世界頂尖的人工智能研究者、悉尼大學(xué)教授陶大程持肯定態(tài)度。值得注意的是,陶大程所從事的計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)研究正推動(dòng)著人工智能及機(jī)器人的發(fā)展。不斷突破的研究成果使他獲得了澳大利亞科學(xué)最高榮譽(yù)尤里卡獎(jiǎng)等權(quán)威獎(jiǎng)項(xiàng),并當(dāng)選IEEEFellow和歐洲科學(xué)院院士。從人臉識(shí)別到多角度學(xué)習(xí),從人工智能及機(jī)器人的商業(yè)化到對(duì)技術(shù)奇點(diǎn)的看法,在陶大程的講述中,人工智能及機(jī)器人的發(fā)展?fàn)顩r被勾勒得更加清晰。
“最快一年,人臉識(shí)別就能在機(jī)器人身上得以體現(xiàn)”
在人工智能諸多領(lǐng)域中,普通人可能有感性認(rèn)識(shí)的就是人臉識(shí)別領(lǐng)域,而各大科技公司近年來紛紛組建人臉識(shí)別小組,并以此為切入點(diǎn)布局人工智能。人臉識(shí)別,恰恰是陶大程研究多年、屢獲國(guó)際大賽獎(jiǎng)項(xiàng),并實(shí)現(xiàn)了突破的主要研究方向。
人臉識(shí)別是幫助機(jī)器人識(shí)別人類,從而進(jìn)階人機(jī)交互、協(xié)同合作的一個(gè)開始。陶大程提到,一方面,人形機(jī)器人可通過人臉識(shí)別使其更好地與人交互、融入家庭,另一方面則可以通過集成人臉識(shí)別功能用于人員搜索。
不過,人臉識(shí)別技術(shù)仍然存在著不小的挑戰(zhàn)。“最大的困境在于人臉識(shí)別算法本身的魯棒性不足”。即當(dāng)前較死板的算法缺乏靈活性及想象推理的能力,且對(duì)外部如光照、遮擋等因素變化的應(yīng)對(duì)能力不足。機(jī)器人人臉識(shí)別面臨的挑戰(zhàn)還更為獨(dú)特,如運(yùn)動(dòng)狀態(tài)導(dǎo)致人臉細(xì)紋丟失以及對(duì)實(shí)時(shí)性更高的要求。
陶大程團(tuán)隊(duì)的研究實(shí)現(xiàn)了突破,他們通過測(cè)量5個(gè)在不同環(huán)境中變化極小的“突出而穩(wěn)定”的面部特征點(diǎn)來進(jìn)行人臉識(shí)別。結(jié)果顯示無論你做出悲傷或快樂的表情,還是室內(nèi)或室外不同拍攝環(huán)境而造成光線的不同,這五個(gè)點(diǎn)都能保持較高的穩(wěn)定性。這有助于提高人臉識(shí)別的魯棒性。
針對(duì)機(jī)器人,陶大程團(tuán)隊(duì)則提出了基于CNN的模糊不變特征學(xué)習(xí)方法,很好地解決了圖像模糊對(duì)人臉識(shí)別的影響;同時(shí),他們提出了主干分支集成網(wǎng)絡(luò)的人臉識(shí)別模型,在提高了對(duì)姿態(tài)變化魯棒性的同時(shí),還有效保證了識(shí)別算法的實(shí)時(shí)性。
應(yīng)用這些技術(shù),陶大程團(tuán)隊(duì)在2016PaSC的人臉識(shí)別比賽中以絕對(duì)的優(yōu)勢(shì)獲得了第一名。根據(jù)比賽組織者的評(píng)估,他們的算法達(dá)到了和人類視覺系統(tǒng)一致的性能。
“機(jī)器視覺發(fā)展已經(jīng)歷多年時(shí)間,人臉識(shí)別的發(fā)展時(shí)間最長(zhǎng)”,而深度學(xué)習(xí)的應(yīng)用,使得人臉識(shí)別的識(shí)別率從過去的20%-50%提高到了90%以上。技術(shù)的不斷提升并部分達(dá)到實(shí)用水平展現(xiàn)出了巨大的市場(chǎng)前景,這是國(guó)內(nèi)外眾多科技公司選擇人臉識(shí)別作為主攻方向的一個(gè)重要原因。
“人臉識(shí)別很可能僅需一年就能夠在機(jī)器人身上得以體現(xiàn)”,陶大程如是說。
人臉識(shí)別還只是第一步,讓機(jī)器更智能,更好地識(shí)別人類并且發(fā)展到能學(xué)習(xí)、模仿和創(chuàng)造,還需要做很多努力,這就包括多視覺學(xué)習(xí)、人體姿態(tài)估計(jì)、行為分析等。人體姿態(tài)估計(jì)能夠幫助機(jī)器人在家庭中感知人的行為,而行為分析則結(jié)合了場(chǎng)景,能幫助機(jī)器從視頻中識(shí)別出一個(gè)人的行為或者多個(gè)人一起參與的行為,例如一個(gè)人在游泳,多個(gè)人在踢足球。通過多角度學(xué)習(xí),機(jī)器人能夠愈發(fā)精準(zhǔn)地理解一個(gè)事物、一個(gè)事件。
陶大程的團(tuán)隊(duì)在這些計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)等領(lǐng)域的研究都實(shí)現(xiàn)了突破,并在權(quán)威期刊如IEEETPAMI、TIP等發(fā)表了研究成果。在2016 AcTIvity Net競(jìng)賽中,陶大程團(tuán)隊(duì)取得了行為檢測(cè)任務(wù)第一、行為識(shí)別任務(wù)第二的佳績(jī)。
人工智能及機(jī)器人商業(yè)化大勢(shì)所趨但“基礎(chǔ)很重要”
當(dāng)技術(shù)趨于成熟,商業(yè)化也隨之而來。在學(xué)界人才像業(yè)界流入的驅(qū)使之下,各大科技公司的人工智能進(jìn)展和未來布局讓商業(yè)化進(jìn)程處于加速狀態(tài)。
“人工智能的商業(yè)化是大勢(shì)所趨。”他認(rèn)為,當(dāng)一項(xiàng)技術(shù)已經(jīng)達(dá)到成熟階段,那么它的商業(yè)化前景將非??捎^。但人工智能商業(yè)化也面臨著諸多挑戰(zhàn),技術(shù)不成熟、人工智能發(fā)展所造成的失業(yè)率反向抑制人工智能發(fā)展以及商業(yè)模式,這些都是可能影響的因素。
“一個(gè)良性的商業(yè)化模式至少是穩(wěn)扎穩(wěn)打的,企業(yè)的產(chǎn)品開發(fā)是基于成熟的、自主研發(fā)的核心技術(shù)”,他建議,針對(duì)尚未解決的應(yīng)用問題,不能盲目采用學(xué)術(shù)界公開的技術(shù),而是需要培養(yǎng)自己的科研團(tuán)隊(duì),主打獨(dú)立自主研發(fā)這張牌。
“總而言之,基礎(chǔ)很重要。”
智能機(jī)器人、無人駕駛、民用無人機(jī)、人臉識(shí)別、智能語(yǔ)音……這些具備商業(yè)化的人工智能技術(shù)在他看來都是不錯(cuò)的商業(yè)化對(duì)象。
技術(shù)奇點(diǎn)不可能實(shí)現(xiàn)不必恐慌人工智能威脅論
在近期熱播的美劇《西部世界》中,未來世界中外表與人無異的機(jī)器人產(chǎn)生了自我意識(shí),甚至反過來操控人類,這也引發(fā)了許多人對(duì)于人工智能和機(jī)器人利弊的新一輪熱議。在此之前,不少學(xué)者和知名人士,如霍金、比爾蓋茨等也曾表達(dá)過對(duì)于人工智能發(fā)展的警惕。
“技術(shù)奇點(diǎn)是不可能實(shí)現(xiàn)的,”陶大程認(rèn)為。
他提到,霍金等人的想法源自于技術(shù)奇點(diǎn),即機(jī)器智能開始跨越式發(fā)展的時(shí)間點(diǎn),同時(shí)也是一個(gè)更為智能的新型物種開始統(tǒng)治地球的起點(diǎn)。但在陶大程看來,任何事物的應(yīng)用都有好有壞,“人工智能技術(shù)是一把雙刃劍,關(guān)鍵在與如何合理的使用它”。
“在未來,科技與人文一定是交互發(fā)展的。”陶大程認(rèn)為,人工智能不會(huì)在失控的情況下肆意發(fā)展,因此大眾不必恐慌,而作為技術(shù)及行業(yè)從業(yè)人員,“我們要遵循健康的發(fā)展之道”。
實(shí)際上,目前人工智能仍處于弱人工智能階段,距離大眾口中的概念還有很長(zhǎng)的一段路要走。在硬件方面,人工智能還需要更強(qiáng)大的感知器、更流暢穩(wěn)定的機(jī)械系統(tǒng)、以及更高效的計(jì)算系統(tǒng),來實(shí)現(xiàn)機(jī)器的智能分析能力;在軟件方面,不僅需要一個(gè)通用型很高的系統(tǒng)設(shè)計(jì)框架,針對(duì)每個(gè)子模塊,還需要高效的算法設(shè)計(jì)以及充實(shí)的理論驗(yàn)證。
“我們從事人工智能方面的研究和發(fā)展工作,都是為了利用計(jì)算機(jī)來改善我們的生活”,這正是包括陶大程在內(nèi)的諸多學(xué)者進(jìn)行研究的初衷。