JMP鼎力支持2011全國大學(xué)生統(tǒng)計(jì)建模大賽
全國大學(xué)生統(tǒng)計(jì)建模大賽是由中國統(tǒng)計(jì)教育學(xué)會(huì)主辦、面向全國大專院校學(xué)生、統(tǒng)計(jì)志愿者及相關(guān)工作人員的專業(yè)賽事。大賽的目的是為了鼓勵(lì)廣大高校師生利用統(tǒng)計(jì)方法、建立統(tǒng)計(jì)模型、運(yùn)用計(jì)算機(jī)技術(shù)提高統(tǒng)計(jì)分析及應(yīng)用的能力。本次大賽對培養(yǎng)和發(fā)現(xiàn)統(tǒng)計(jì)業(yè)務(wù)骨干,培養(yǎng)大專院校學(xué)生及統(tǒng)計(jì)工作者的學(xué)習(xí)意識(shí),增強(qiáng)創(chuàng)新精神,提高在校學(xué)生對統(tǒng)計(jì)工作的認(rèn)識(shí)和興趣,建立產(chǎn)學(xué)研人才培養(yǎng)機(jī)制,加快統(tǒng)計(jì)數(shù)據(jù)的成果轉(zhuǎn)化,更好地為政府和社會(huì)公眾服務(wù)具有重要的意義。
繼支持2010年全國統(tǒng)計(jì)建模大賽之后,JMP中國區(qū)繼續(xù)鼎力支持2011年度大學(xué)生統(tǒng)計(jì)建模大賽,不僅為大賽安排了專用的JMP軟件供參賽學(xué)生及其指導(dǎo)老師免費(fèi)使用,而且還專門為大賽設(shè)立了JMP獎(jiǎng),以鼓勵(lì)高校師生學(xué)好、用活統(tǒng)計(jì)分析和建模方法。
本次參賽論文的主題主要是來源于社會(huì)、經(jīng)濟(jì)、金融和管理科學(xué)等方面經(jīng)過適當(dāng)簡化加工的實(shí)際問題,既可以是宏觀經(jīng)濟(jì)社會(huì)問題,也可以是具體企業(yè)生產(chǎn)經(jīng)營中的實(shí)際問題,還可以是自行設(shè)計(jì)的問卷調(diào)查、抽樣調(diào)查等問題。同時(shí)要求參賽者在規(guī)定的時(shí)間內(nèi),自行搜集數(shù)據(jù),提出問題和假設(shè)條件,運(yùn)用各類統(tǒng)計(jì)分析方法建立合適的統(tǒng)計(jì)模型,對結(jié)果進(jìn)行分析和檢驗(yàn),并闡明結(jié)論及其意義。
由此可見,參賽者需要具備綜合應(yīng)用統(tǒng)計(jì)學(xué)、計(jì)算機(jī)學(xué)和經(jīng)濟(jì)學(xué)的素質(zhì)。工欲善其事,必先利其器。如果在參賽過程中,能夠運(yùn)用一款稱心如意的統(tǒng)計(jì)科學(xué)軟件,必定會(huì)使統(tǒng)計(jì)建模事半功倍。這種理想中的統(tǒng)計(jì)科學(xué)軟件,必須具有便捷的數(shù)據(jù)收集和數(shù)據(jù)整理能力、豐富的探索性數(shù)據(jù)分析工具集和專業(yè)的統(tǒng)計(jì)建模方法,最好還要有一定的擴(kuò)展性和兼容性。全球最大統(tǒng)計(jì)學(xué)軟件集團(tuán)SAS公司的交互式可視化統(tǒng)計(jì)發(fā)現(xiàn)軟件JMP的卓越表現(xiàn)恰巧與這些要求不謀而合,能夠幫助參賽者提高工作效率,加強(qiáng)建模的創(chuàng)造性,確保分析結(jié)果的正確性,增強(qiáng)論文的可讀性和說服力。
便捷的數(shù)據(jù)收集和數(shù)據(jù)整理能力
兵馬未動(dòng),糧草先行。統(tǒng)計(jì)建模中的“糧草”就是客觀、真實(shí)的數(shù)據(jù)資料。JMP軟件中的“試驗(yàn)設(shè)計(jì)DOE”平臺(tái)可以幫助參賽者確定滿足特定條件的調(diào)查對象,需要調(diào)查的樣本大小,“表、列、行”平臺(tái)則可以從總體數(shù)據(jù)集中實(shí)現(xiàn)隨機(jī)抽樣、分層抽樣,進(jìn)行自定義的數(shù)據(jù)篩選,乃至進(jìn)行各種數(shù)據(jù)預(yù)處理、數(shù)據(jù)清洗、缺失數(shù)據(jù)追蹤等等。這些工作可以在幾秒鐘內(nèi)完成,當(dāng)遇到海量數(shù)據(jù)的分析處理時(shí),會(huì)很有用。
圖一 JMP軟件中的部分?jǐn)?shù)據(jù)整理功能
探索性數(shù)據(jù)分析工具集
統(tǒng)計(jì)建模的早期階段特別強(qiáng)調(diào)運(yùn)用創(chuàng)新的方法發(fā)現(xiàn)數(shù)據(jù)中可能隱藏的趨勢。一般來說,在這個(gè)階段以直觀形象的圖形為主的探索性數(shù)據(jù)分析(EDA: Exploratory Data Analysis)方法會(huì)很有用,而這也是JMP的特點(diǎn)之一。JMP軟件提供的圖形中包括了多維散點(diǎn)圖、動(dòng)態(tài)氣泡圖、圖形生成器、地圖等多種新穎的可視化圖形,能夠?qū)瀳D、柱狀圖、折線圖等傳統(tǒng)圖形以動(dòng)畫的形式輸出。所有圖形和圖形、圖形和數(shù)據(jù)表之間動(dòng)態(tài)鏈接。這些功能可以幫助參賽者更容易地發(fā)現(xiàn)數(shù)據(jù)中隱含的、有價(jià)值的信息(比如趨勢等),從而得到啟迪,產(chǎn)生靈感并進(jìn)一步進(jìn)行建模分析。
圖二 運(yùn)用JMP的“地圖”功能進(jìn)行中國大陸CPI信息分析
專業(yè)的統(tǒng)計(jì)建模方法
統(tǒng)計(jì)建模的核心是所用的統(tǒng)計(jì)建模方法,這是決定論文質(zhì)量高低的關(guān)鍵部分之一。JMP軟件的完整統(tǒng)計(jì)建摸解決方案包括回歸模型(多元方差分析、逐步回歸、Logistic回歸、非線性回歸、模擬預(yù)測等)、時(shí)間序列模型(ARIMA模型、平滑模型、譜密度、傳遞函數(shù)等)、數(shù)據(jù)挖掘模型(決策樹、神經(jīng)網(wǎng)絡(luò)等)、可靠性/生存模型(壽命分布模型、加速失效模型、老化模型等)、多元統(tǒng)計(jì)模型(主成分分析、聚類分析、判別分析等)等,以適應(yīng)不同應(yīng)用場景下不同的統(tǒng)計(jì)建模需求。
圖三 運(yùn)用JMP軟件對城市房價(jià)進(jìn)行可視化聚類分析
擴(kuò)展性和兼容性
統(tǒng)計(jì)建模的涉及面非常廣,需要解決的問題也是多種多樣,因此用到的統(tǒng)計(jì)分析方法也可能有著不同的實(shí)現(xiàn)方式。用戶可以將JMP作為“分析樞紐”。除了可以用JMP自帶的編程語言JSL自定義個(gè)性化的統(tǒng)計(jì)分析之外,還可以直接調(diào)用現(xiàn)成的SAS或R語言代碼進(jìn)行更為深入和復(fù)雜的分析研究。參賽者存儲(chǔ)在Excel、Access、SAS、SPSS、R等軟件中的數(shù)據(jù)源也可以直接導(dǎo)入JMP。
統(tǒng)計(jì)建模大賽 src="/21ic_image/21icimage/zb-images/147/0941455001308016204.png">
圖四 R語言代碼可以在JMP軟件中直接運(yùn)行