基于時(shí)間序列模型的校園宿舍用電量分析
掃描二維碼
隨時(shí)隨地手機(jī)看文章
引言
科技的快速發(fā)展和新技術(shù)的出現(xiàn)使人們對(duì)電力有著持續(xù)性增長(zhǎng)的需求,能源短缺問(wèn)題也日益凸顯。中國(guó)電力企業(yè)聯(lián)合會(huì)于2021年底發(fā)布的《電力行業(yè)碳達(dá)峰碳中和發(fā)展路徑研究》顯示,電力行業(yè)正迎來(lái)重大機(jī)遇與挑戰(zhàn),對(duì)于電力數(shù)據(jù)的價(jià)值挖掘研究與應(yīng)用已經(jīng)成為未來(lái)發(fā)展的必然趨勢(shì),充分發(fā)揮電網(wǎng)基礎(chǔ)設(shè)施的作用,提高資源配置能力是應(yīng)對(duì)該現(xiàn)狀的有效方式之一。
當(dāng)前,發(fā)電方式存在不穩(wěn)定性,用電高峰期無(wú)法保證有效持續(xù)供電。部分地區(qū)電網(wǎng)網(wǎng)架結(jié)構(gòu)薄弱、送電通道容量上限不高,供電量受限,未來(lái)一段時(shí)期我國(guó)部分地區(qū)電力供需緊張態(tài)勢(shì)仍將持續(xù)。在高校中,供電需求量大,用電高峰期的電量峰值較其他區(qū)域高,供電壓力大,對(duì)電力資源進(jìn)行合理配置顯得尤為重要。本文通過(guò)采集學(xué)生用電數(shù)據(jù),對(duì)學(xué)生宿舍用電情況進(jìn)行分析,建立模型對(duì)校園宿舍用電量進(jìn)行學(xué)習(xí)和預(yù)測(cè)。預(yù)測(cè)未來(lái)幾天內(nèi)的用電需求,不僅能夠給學(xué)生作為參考,也可對(duì)電力供需提供預(yù)警功能,保障宿舍電力供需平衡,加強(qiáng)高校的節(jié)電管理,從源頭上減少能耗。
1模型理論
1.1時(shí)間序列
時(shí)間序列預(yù)測(cè)是根據(jù)歷史時(shí)間序列數(shù)據(jù)建立模型的方法,被廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、氣象學(xué)等領(lǐng)域。對(duì)某一個(gè)或者一組變量X(t)進(jìn)行觀察測(cè)量,將在一系列時(shí)刻t1,t2,…,tn所得的離散數(shù)字組成的序列集合,稱(chēng)之為時(shí)間序列。時(shí)間序列預(yù)測(cè)方法首先考慮的是事物的趨勢(shì)性,通過(guò)歷史數(shù)據(jù)來(lái)預(yù)測(cè)事物的發(fā)展趨勢(shì);其次考慮的是事物的季節(jié)性,如氣候條件、節(jié)假日等各種周期性因素,根據(jù)事物發(fā)展的季節(jié)性變化預(yù)測(cè)事物的周期變化;最后考慮隨機(jī)因素的影響,不規(guī)則波動(dòng)通常夾雜在時(shí)間序列之中,以致時(shí)間序列產(chǎn)生波浪式或振蕩式變動(dòng)?;陔娏啃蛄械奶匦砸约皵?shù)據(jù)量,本文基于自回歸滑動(dòng)平均模型(Auto-RegressiveandMovingAverageModel,ARMA)建立模型。ARMA模型是研究時(shí)間序列的常用方法,用于研究平穩(wěn)隨機(jī)過(guò)程有理譜,適用性很強(qiáng)。
神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)方法之一,起源于人類(lèi)對(duì)大腦的研究,是一種仿生的網(wǎng)絡(luò)結(jié)構(gòu)。通過(guò)大量簡(jiǎn)單的生物神經(jīng)元之間的相互連接,來(lái)構(gòu)造復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),以模擬生物神經(jīng)網(wǎng)絡(luò)的智能行為,從而克服傳統(tǒng)算法處理智能信息的困難?;陂L(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long-shortTermMemory,LSTM)獨(dú)特的設(shè)計(jì)結(jié)構(gòu),LSTM作為一種特殊的遞歸神經(jīng)網(wǎng)絡(luò),不僅可以利用時(shí)間序列對(duì)輸入進(jìn)行分析,還不會(huì)像普通的遞歸神經(jīng)網(wǎng)絡(luò)忽略長(zhǎng)時(shí)間前的有用信息,因此,本文根據(jù)電量序列的特性選擇基于LSTM建立模型。
2模型建立與求解
2.1數(shù)據(jù)采集
本文以廈門(mén)大學(xué)漳州校區(qū)的學(xué)生作為調(diào)查對(duì)象,廈門(mén)大學(xué)漳州校區(qū)宿舍用電情況作為主要調(diào)查內(nèi)容,采用問(wèn)卷調(diào)查法和實(shí)地觀察法兩種數(shù)據(jù)采集方法。
2.1.1問(wèn)卷調(diào)查法
本項(xiàng)目組前期通過(guò)查詢(xún)相關(guān)資料制訂了本次調(diào)查問(wèn)卷,調(diào)查問(wèn)卷設(shè)計(jì)分為三大部分:第一部分為被調(diào)查者基本情況,第二部分為被調(diào)查者對(duì)宿舍用電器的使用情況,第三部分為被調(diào)查者夏冬兩季用電量及電費(fèi)支出情況,總計(jì)包含12個(gè)問(wèn)題。在本次調(diào)查中,共發(fā)出問(wèn)卷168份,收回問(wèn)卷168份,有效問(wèn)卷154份,有效回收率為91.7%。對(duì)調(diào)查問(wèn)卷的數(shù)據(jù)進(jìn)行分析,總結(jié)了影響本校大學(xué)生宿舍用電量情況的因素,并對(duì)校園節(jié)電管理及大學(xué)生節(jié)電意識(shí)培養(yǎng)提出了相關(guān)意見(jiàn)和建議。
2.1.2實(shí)地觀察法
本文以廈門(mén)大學(xué)漳州校區(qū)為例,對(duì)校園內(nèi)各個(gè)園區(qū)共58幢宿舍樓采取隨機(jī)抽樣調(diào)查的方法,通過(guò)學(xué)校的電費(fèi)網(wǎng)站采集了每個(gè)園區(qū)各一個(gè)宿舍從9月7日至12月7日的每日用電量。數(shù)據(jù)可視化如圖1所示。
2.2影響因素分析
為了探究用電情況是否受性別影響,抽樣統(tǒng)計(jì)不同宿舍樓同宿舍號(hào)的9、10、11和12月的用電量情況,結(jié)果如表1所示。
為了更直觀地進(jìn)行對(duì)比,基于表1數(shù)據(jù)繪制圖2。
統(tǒng)計(jì)北區(qū)不同宿舍樓同宿舍號(hào)的9、10、11和12月的用電量,發(fā)現(xiàn)用電量情況是受性別影響的,從圖2中可以看出,女生宿舍在9月一11月的平均用電量都明顯高于男生宿舍。將該結(jié)論與168份調(diào)查問(wèn)卷的結(jié)果對(duì)比來(lái)看,在耗電最多的電器中有14.29%的男生選擇了日常電器這一選項(xiàng),而選擇這一選項(xiàng)的女生有29.39%。經(jīng)過(guò)實(shí)地走訪調(diào)查發(fā)現(xiàn),女生宿舍備有電器的數(shù)量比男生來(lái)得多,并且功率也相對(duì)更大,可以推斷出這是造成男女生宿舍用電量差異較為關(guān)鍵的部分。
2.3ARMA模型建立
ARMA的基本思想是把AR和MA模型結(jié)合起來(lái),使得所用參數(shù)個(gè)數(shù)保持很少。模型形式為:
式中:{小i}為自回歸系數(shù):{9i}為移動(dòng)平均系數(shù):{yl}為時(shí)間序列:{gl}為白噪聲序列:p和.為非負(fù)整數(shù)。
本文通過(guò)觀察PACF、ACF截尾以及AIC、BIC準(zhǔn)則來(lái)分別判斷p和.的值,以進(jìn)行模型定階。
從預(yù)測(cè)日期開(kāi)始,利用ARMA模型對(duì)不同園區(qū)宿舍電量進(jìn)行預(yù)測(cè),預(yù)測(cè)值作為新的樣本加入預(yù)測(cè)模型,逐日增加樣本量,計(jì)算預(yù)測(cè)值與實(shí)際值y的累計(jì)差異率s,公式為:
通過(guò)觀察差異率變動(dòng)趨勢(shì),對(duì)預(yù)測(cè)數(shù)據(jù)進(jìn)行有效修正,最終確定選擇ARMA)9,1)作為預(yù)測(cè)模型。
2.4LSTM模型建立
LSTM是一種特殊的RNN,可以學(xué)習(xí)到長(zhǎng)期記憶信息,解決長(zhǎng)時(shí)依賴(lài)問(wèn)題,并且在反向傳播求導(dǎo)時(shí)梯度幾乎保持為常量,避免了梯度消失或爆炸,模型收斂速度更快。LSTM神經(jīng)網(wǎng)絡(luò)模型的循環(huán)單元內(nèi)部包括三個(gè)結(jié)構(gòu):遺忘門(mén)、輸入門(mén)和輸出門(mén)。遺忘門(mén)決定了上一時(shí)刻的工作狀態(tài)需要保留多少到當(dāng)前時(shí)刻,可由tanh函數(shù)實(shí)現(xiàn):輸入門(mén)決定當(dāng)前時(shí)刻網(wǎng)絡(luò)輸入哪些信息來(lái)更新長(zhǎng)期記憶狀態(tài),該閥門(mén)篩選出有用信息喂入網(wǎng)絡(luò),可由sigmoid函數(shù)實(shí)現(xiàn):最后一個(gè)是輸出閥門(mén),它置于網(wǎng)絡(luò)的輸出之后,用于控制單元狀態(tài),可以自動(dòng)提取輸出信息中的重要部分,它也由sigmoid函數(shù)實(shí)現(xiàn)。
LSTM網(wǎng)絡(luò)的基本單元如圖3所示,fl,il,ol分別為遺忘門(mén)、輸入門(mén)、輸出門(mén):xl,gl,hl,Cl分別為l時(shí)刻的輸入、輸入節(jié)點(diǎn)、中間輸出和細(xì)胞單元的狀態(tài):口、tanh分別為sigmoid和tanh函數(shù)變化。
本文先將數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)數(shù)據(jù),再將序列構(gòu)造為一個(gè)有監(jiān)督的學(xué)習(xí)問(wèn)題,并把數(shù)據(jù)集以2:1的比例分成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。為了達(dá)到較好的訓(xùn)練效果,本文將batchsize設(shè)置為1000輪,以進(jìn)行模型訓(xùn)練。
3實(shí)驗(yàn)結(jié)果與分析
本文以Yx園區(qū)宿舍的數(shù)據(jù)為例分別進(jìn)行模型訓(xùn)練,將實(shí)際值與兩種預(yù)測(cè)模型得到的預(yù)測(cè)值進(jìn)行可視化,結(jié)果如圖4所示。由圖4可知兩種模型預(yù)測(cè)效果都較為不錯(cuò),走向與實(shí)際值大致相同。
為了更好地評(píng)價(jià)并對(duì)比模型效果,本文分別計(jì)算了LSTM的平均絕對(duì)值誤差MAE與平均絕對(duì)值百分比誤差MAPE,這兩個(gè)指標(biāo)都經(jīng)常被用于時(shí)間序列分析中來(lái)評(píng)價(jià)衡量預(yù)測(cè)誤差和準(zhǔn)確性。
MAE公式為:
MAPE公式為:
結(jié)果如表2所示。
從結(jié)果可以看出,LSTM模型的MAE與MAPE均小于ARMA模型,所以LSTM模型略?xún)?yōu)于ARMA模型。
4結(jié)論
(1)本文通過(guò)不同的時(shí)間序列模型預(yù)測(cè)對(duì)照,得出LSTM模型的預(yù)測(cè)效果優(yōu)于ARMA模型,機(jī)器學(xué)習(xí)相較傳統(tǒng)的時(shí)間序列模型更加精準(zhǔn)。
(2)本文通過(guò)對(duì)廈門(mén)大學(xué)漳州校區(qū)宿舍用電量進(jìn)行調(diào)查,得出性別是影響宿舍用電量的重要因素之一,原因是女生總體使用電器更多。此外,電量可能也與氣溫有關(guān)。
(3)根據(jù)用電量情況的預(yù)測(cè)既可以合理規(guī)劃各地區(qū)配電網(wǎng),也能為宿舍用電預(yù)警提供實(shí)踐依據(jù),避免因忘繳電費(fèi)引起停電,造成生活不便。
(4)時(shí)間序列模型還可用于動(dòng)植物種群數(shù)量逐月或逐年的消長(zhǎng)進(jìn)程、某證券交易所每日收盤(pán)指數(shù)等等,還能夠用在國(guó)民經(jīng)濟(jì)宏觀操縱、區(qū)域綜合進(jìn)展計(jì)劃、企業(yè)經(jīng)營(yíng)治理、市場(chǎng)潛量預(yù)測(cè)、氣象預(yù)報(bào)、水文預(yù)報(bào)、地震預(yù)兆預(yù)報(bào)、農(nóng)作物病蟲(chóng)災(zāi)害預(yù)報(bào)、環(huán)境污染操縱、生態(tài)平穩(wěn)、天文學(xué)和海洋學(xué)等方面。
(5)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)具有一定的可行性及可靠性,電網(wǎng)公司可以根據(jù)研究資料與成果,基于事故在范圍、時(shí)間等方面的信息,快速預(yù)估停電造成的影響,還可以結(jié)合已經(jīng)掌握的信息快速制訂解決方案。