近日,在NLP(自然語言處理)領(lǐng)域的頂級賽事LIC 2022語言與智能技術(shù)競賽中,商湯科技研究院NLP團隊攜手香港中文大學團隊,在王歷偉教授的指導和帶領(lǐng)下,從超過500個注冊隊伍中脫穎而出,斬獲視頻語義理解任務(wù)冠軍。這也是商湯科技在人工智能學術(shù)領(lǐng)域獲得的又一項超高含金量的技術(shù)殊榮。
語言是人類信息傳遞最重要的媒介,讓機器理解語言并進行交互是人工智能的基本挑戰(zhàn)。作為由中國中文信息學會(CIPS)和中國計算機學會(CCF)主辦的NLP學術(shù)競賽,LIC已連續(xù)成功舉辦五年。本屆LIC覆蓋自然語言處理和人工智能領(lǐng)域的重要前沿課題,設(shè)計了圍繞跨模態(tài)、知識驅(qū)動、可信學習等方面的四大任務(wù),難度相比往屆也進一步提升。競賽吸引了包括騰訊、阿里巴巴、清華大學等在內(nèi)的學術(shù)界、工業(yè)界的知名研究者和開發(fā)者約3000余名選手共同參與,展開激烈角逐。
本次競賽的視頻語義理解任務(wù)包含分類標簽預(yù)測和語義標簽預(yù)測兩個子任務(wù)。在分類標簽預(yù)測任務(wù)中,商湯NLP團隊利用預(yù)訓練模型和類Transformer結(jié)構(gòu)對不同模態(tài)的數(shù)據(jù)進行編碼和融合,并進行了數(shù)據(jù)增強和模型融合,出色地完成了視頻中兩個級別的標簽分類。在語義標簽預(yù)測任務(wù)中,商湯NLP團隊提出了將命名實體識別模型和標簽分類模型結(jié)合的方案,經(jīng)過創(chuàng)新地數(shù)據(jù)增強和模型融合后,不僅可以發(fā)掘文本中存在的標簽,還可以提供額外的標簽預(yù)測。憑借在多模態(tài)和NLP領(lǐng)域的不斷積累和創(chuàng)新能力,商湯NLP團隊在這兩個子任務(wù)中均摘得桂冠。
隨著人工智能技術(shù)的發(fā)展以及在不同場景的快速落地,NLP領(lǐng)域的需求和應(yīng)用越來越廣泛,重要性日益突顯。例如在數(shù)字人領(lǐng)域,語音語義理解是數(shù)字人“AI大腦”的重要組成部分?;谡Z音識別(ASR)、語音合成(TTS)、自然語言理解(NLP)等技術(shù)組合,結(jié)合商湯所積累的語音語義理解和生成能力,以及知識庫自動學習和模型訓練能力,可以根據(jù)不同行業(yè)業(yè)務(wù)需求,快速定制AI數(shù)字人的智能語音對話和問答系統(tǒng),并可通過接入后臺運營管理平臺,支持知識庫的在線更新和維護,實現(xiàn)AI數(shù)字人的深度學習和迭代升級。依托深厚的技術(shù)積累,商湯數(shù)字人解決方案已覆蓋超過200款手機、平板電腦、AR/VR眼鏡、智慧大屏及線下一體機等多種終端設(shè)備。在不久前知名研究機構(gòu)沙利文聯(lián)合頭豹研究院發(fā)布的報告中,商湯被列入數(shù)字人領(lǐng)導者陣營。
自成立以來,商湯科技長期持續(xù)投入引領(lǐng)全球的人工智能技術(shù)研究,不斷斬獲佳績,積累了深厚的技術(shù)基礎(chǔ)與人才優(yōu)勢。目前,商湯已在各項全球競賽中已獲得70多項冠軍,發(fā)表超過600篇頂級學術(shù)論文,擁有8,000多項人工智能專利及專利申請。商湯科技還前瞻打造了行業(yè)領(lǐng)先的人工智能基礎(chǔ)設(shè)施SenseCore商湯AI大裝置,為技術(shù)研發(fā)和落地提供重要支撐,并幫助研究人員快速實驗并驗證新的想法,加速創(chuàng)新與迭代。
通過凝聚頂尖人才,持續(xù)打造更具擴展性、更普惠的人工智能軟件平臺,商湯未來將更加高效地推動前沿AI技術(shù)的創(chuàng)新轉(zhuǎn)化和落地應(yīng)用,更好地滿足多領(lǐng)域、多場景的產(chǎn)業(yè)應(yīng)用,為學術(shù)及產(chǎn)業(yè)界發(fā)展貢獻力量。