華為聯(lián)合中國電信推出了天翼云NAIE平臺(tái)
今日舉行的TM Forum 2019數(shù)字化轉(zhuǎn)型亞太峰會(huì)上,華為網(wǎng)絡(luò)人工智能產(chǎn)品部CTO程磊先生和中國電信集團(tuán)北京研究院網(wǎng)絡(luò)AI中心技術(shù)總監(jiān)錢兵先生,共同發(fā)表了《基于中國電信天翼云NAIE的AI容量預(yù)測創(chuàng)新成果》主題演講。華為和中國電信合作,將iMaster NAIE(Network AI Engine)作為電信能力的一部分,在中國電信天翼云完成部署,構(gòu)建了中國電信AI應(yīng)用開發(fā)能力?;陔娦盘煲碓芅AIE平臺(tái)與中國電信集團(tuán)的無線智能運(yùn)維海牛推理平臺(tái)展開合作,在無線網(wǎng)絡(luò)小區(qū)異常檢測,無線小區(qū)容量預(yù)測場景進(jìn)行了成功的探索實(shí)踐。
華為iMaster NAIE使能網(wǎng)絡(luò)智能化,讓網(wǎng)絡(luò)AI開發(fā)更簡單
隨著5G網(wǎng)絡(luò)加速建設(shè),多樣化5G應(yīng)用場景使網(wǎng)絡(luò)數(shù)據(jù)呈指數(shù)級(jí)增長,網(wǎng)絡(luò)告警故障處理、擴(kuò)容優(yōu)化等需求與日俱增。電信行業(yè)的運(yùn)維水平卻沒有跟上業(yè)務(wù)發(fā)展節(jié)奏,運(yùn)營商面臨 OPEX增長大大超過收入增長,成本和效率無法應(yīng)對跨行業(yè)競爭等結(jié)構(gòu)性問題。急需通過網(wǎng)絡(luò)自動(dòng)化和智能化的系統(tǒng)架構(gòu)性創(chuàng)新解決結(jié)構(gòu)性問題。
華為網(wǎng)絡(luò)人工智能產(chǎn)品部CTO程磊介紹華為網(wǎng)絡(luò)人工智能引擎(iMaster NAIE)
華為網(wǎng)絡(luò)人工智能引擎iMaster NAIE,在云端引入AI并提供數(shù)據(jù)湖服務(wù),模型訓(xùn)練服務(wù)、模型生成服務(wù)和通信模型服務(wù),大幅降低電信網(wǎng)絡(luò)AI引入門檻,提升網(wǎng)絡(luò)AI開發(fā)效率。iMaster NAIE依托華為公有云,涵蓋網(wǎng)絡(luò)AI應(yīng)用開發(fā)業(yè)務(wù)中最復(fù)雜部分的工作,如數(shù)據(jù)準(zhǔn)備,數(shù)據(jù)特征探索,模型調(diào)優(yōu)等,便于開發(fā)者快速獲取iMaster NAIE能力,程磊介紹到。
數(shù)據(jù)湖服務(wù),把數(shù)據(jù)采集、集成、建模、分析、標(biāo)注等數(shù)據(jù)處理工具以及數(shù)據(jù)治理模板, 以云服務(wù)的方式向開發(fā)者提供,提升數(shù)據(jù)治理效率。支持30+類網(wǎng)元,100+種設(shè)備自動(dòng)對接,內(nèi)置超過10種電信業(yè)務(wù)場景模板,提供高效的電信數(shù)據(jù)標(biāo)注工具和4.8億在線訓(xùn)練數(shù)據(jù)樣本,數(shù)據(jù)準(zhǔn)備時(shí)間從原來的3個(gè)月縮短到1周,節(jié)省90%的時(shí)間。
模型訓(xùn)練服務(wù),提供IDE開發(fā)環(huán)境,包括數(shù)據(jù)處理、特征提取、模型訓(xùn)練和驗(yàn)證等功能,支持業(yè)界主流算法框架,如TensorFlow、Caffe2、SParkML等,預(yù)置30+電信網(wǎng)絡(luò)特征探索工具, 50+電信領(lǐng)域資產(chǎn),集成多個(gè)場景的算法調(diào)測、特征服務(wù)和處理SDK,讓模型的設(shè)計(jì)和探索周期從3周減少到1周,縮短70%時(shí)間。
模型生成服務(wù),相對模型訓(xùn)練服務(wù),進(jìn)一步簡化模型開發(fā)過程,只需要輸入符合要求的訓(xùn)練數(shù)據(jù),就可以快速完成模型訓(xùn)練和驗(yàn)證,大幅降低電信AI模型開發(fā)的技能門檻和周期。以數(shù)據(jù)中心PUE優(yōu)化為例,傳統(tǒng)模型開發(fā)投入涉及多個(gè)角色,包括暖通專家,數(shù)據(jù)工程師,算法專家,應(yīng)用開發(fā)工程師等,需要至少半年的時(shí)間才能完成;而基于模型生成服務(wù),只需要1名暖通專家,2周時(shí)間即可訓(xùn)練出所需模型,整體開發(fā)投入降低95%以上。
通信模型服務(wù),基于云端推理框架,支持云化部署,便于業(yè)務(wù)快速集成。用戶只需調(diào)用API,輸入推理數(shù)據(jù)就可快速完成推理,運(yùn)行效率高,推理結(jié)果可用于業(yè)務(wù)應(yīng)用開發(fā)。這類服務(wù)主要適用于一些模型泛化通用性強(qiáng)的場景,如KPI異常檢測、硬盤故障檢測等。
基于天翼云NAIE和中國電信海牛平臺(tái)實(shí)現(xiàn)無線網(wǎng)絡(luò)容量預(yù)測創(chuàng)新實(shí)踐
中國電信無線網(wǎng)絡(luò)面臨的主要挑戰(zhàn):網(wǎng)絡(luò)故障和體驗(yàn)類問題事先被發(fā)現(xiàn)難,75%的體驗(yàn)類問題都來自用戶投訴;網(wǎng)絡(luò)問題根因定位及追蹤不易,隨著網(wǎng)絡(luò)復(fù)雜度增加,單純依靠專家經(jīng)驗(yàn)解決問題方式效率低下,運(yùn)維人員大多時(shí)間都在定位問題;網(wǎng)絡(luò)故障和流量等很難預(yù)測精準(zhǔn),暫實(shí)現(xiàn)不了精確網(wǎng)絡(luò)規(guī)劃和控制。
項(xiàng)目引入大數(shù)據(jù)處理和AI技術(shù),在數(shù)據(jù)質(zhì)量控制,無線小區(qū)異常檢測,無線小區(qū)容量預(yù)測三方面展開實(shí)踐。依托NAIE的網(wǎng)絡(luò)AI數(shù)據(jù)處理和模型訓(xùn)練能力,海牛平臺(tái)的實(shí)時(shí)推理和模型評(píng)估優(yōu)化能力,在異常檢測的多路徑選擇算法,短周期容量預(yù)測的LSTM算法,長周期容量預(yù)測的Fusion融合算法進(jìn)行創(chuàng)新實(shí)踐,大幅提升異常小區(qū)檢測準(zhǔn)確率和小區(qū)流量預(yù)測精度。初步評(píng)估,試點(diǎn)小區(qū)由于容量擁塞導(dǎo)致體驗(yàn)問題的投訴率下降12%,運(yùn)維效率提升20%。
中國電信集團(tuán)網(wǎng)絡(luò)AI中心技術(shù)總監(jiān)錢兵介紹無線網(wǎng)絡(luò)容量預(yù)測TMF催化劑項(xiàng)目實(shí)踐
數(shù)據(jù)質(zhì)量控制,利用NAIE數(shù)據(jù)湖提供的能力,結(jié)合小區(qū)異常檢測和容量預(yù)測場景定義數(shù)據(jù)采集標(biāo)準(zhǔn)和數(shù)據(jù)元數(shù)據(jù)規(guī)范,將多數(shù)據(jù)源,多周期,雜亂難理解的低質(zhì)量數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一數(shù)據(jù)源,易理解高質(zhì)量數(shù)據(jù)。針對異常檢測數(shù)據(jù),結(jié)合專家經(jīng)驗(yàn)預(yù)置異常門限,自動(dòng)批量標(biāo)注。對5000+性能指標(biāo)進(jìn)行數(shù)據(jù)聚類,找出數(shù)據(jù)周期性,趨勢性,突發(fā)性等7類數(shù)據(jù)特征。為高質(zhì)量高精度模型訓(xùn)練提供保證。
異常小區(qū)檢測,針對不同指標(biāo)的不同數(shù)據(jù)特征多路徑選擇相應(yīng)算法,結(jié)合單指標(biāo)檢測->專家規(guī)則->多指標(biāo)聯(lián)合檢測的三步檢測算法,將異常小區(qū)檢測準(zhǔn)確率提升到89%。
短周期容量預(yù)測,利用KD-tree構(gòu)建小區(qū)空間關(guān)系,快速找出小區(qū)周邊鄰區(qū)關(guān)系,利用LSTM Seq2seq算法對小區(qū)統(tǒng)一建模,找出用戶行為引起的流量強(qiáng)規(guī)律。同時(shí)算法還會(huì)考慮重大事件,天氣等因素,對突發(fā)性事件進(jìn)行有效預(yù)測。對7天的容量預(yù)測統(tǒng)計(jì)分析,項(xiàng)目預(yù)測有效性達(dá)到97%。
長周期容量預(yù)測無強(qiáng)規(guī)律性,受大量外部因素影響,如網(wǎng)絡(luò)變更、資費(fèi)調(diào)整等,容量預(yù)測的準(zhǔn)確率一直是業(yè)界的挑戰(zhàn)。項(xiàng)目通過清除非個(gè)人因素導(dǎo)致的流量波動(dòng)異常,按小區(qū)特征聚類分組分別建模,按數(shù)據(jù)特征聚類進(jìn)行多算法Fusion融合等關(guān)鍵手段提升容量預(yù)測準(zhǔn)確率。對20000個(gè)基站小區(qū)6個(gè)月歷史數(shù)據(jù)統(tǒng)計(jì)分析建模預(yù)測未來3個(gè)月容量,F(xiàn)usion融合算法預(yù)測有效性可達(dá)到80%,相比傳統(tǒng)的Holt-winters算法預(yù)測有效性只有39%。
項(xiàng)目取得初步性創(chuàng)新成果,并將繼續(xù)孵化,在2020年初應(yīng)用到中國電信5G網(wǎng)絡(luò)規(guī)劃,優(yōu)化和維護(hù)領(lǐng)域。并管理監(jiān)控全國100萬設(shè)備的數(shù)據(jù)質(zhì)量,服務(wù)300萬通信組織和全國3億多無線網(wǎng)絡(luò)用戶?!拔覀兊哪繕?biāo)是通過AI智能異常檢測和容量預(yù)測,讓網(wǎng)絡(luò)質(zhì)量劣化前優(yōu)化質(zhì)量,網(wǎng)絡(luò)擁塞前調(diào)整流量!”錢兵最后說到。