Pentaho:物聯(lián)網(wǎng)與大數(shù)據(jù)的應用整合
物聯(lián)網(wǎng)和大數(shù)據(jù)都是時下最熱門的話題與技術。如何將兩者結合起來,構建一個完整的解決方案,是一個把握未來命脈的領域。隨著全球科技信息化的飛速發(fā)展,各個國家趕著時代的潮流邁入了大數(shù)據(jù)時代,數(shù)據(jù)分析成為了企業(yè)的核心競爭力。
然而,信息化建設是條漫長且持續(xù)的發(fā)展道路,由于建設時期不同,錄入人員不同,信息化系統(tǒng)不同,格式規(guī)范要求不同等,造成了數(shù)據(jù)的不一致性,不同的應用系統(tǒng)形成了彼此孤立的信息孤島,沒有一座統(tǒng)一的橋梁,管理者想要得到幾項信息必須進到不同的系統(tǒng)中進行查詢,且查詢所得無法進行統(tǒng)一分析比較,綜合利用,即使擁有豐富的數(shù)據(jù)資源,也沒法提煉出有價值的信息輔助決策。
企業(yè)面臨著日益嚴峻的挑戰(zhàn),如何更好地管理種類和數(shù)量不斷增長的數(shù)據(jù),并從中提取重要價值已為燃眉之急。幸運的是,Pentaho現(xiàn)已正式加入HDS的大家庭,未來將與我們一起就項目與解決方案進行合作,共創(chuàng)美好數(shù)據(jù)未來。
集成>探查>可視化>預測
Pentaho 將數(shù)據(jù)集成與商業(yè)分析緊密結合,使 IT 和業(yè)務用戶能夠訪問、集成、混合、可視化并分析對業(yè)務成效具有重要影響的所有數(shù)據(jù)。從本質上來說,Pentaho是一款開放式平臺,它可以快速進行部署,易于使用,并且極為經濟高效。簡而言之,它就是一款專門用于滿足未來分析需求的平臺。
》》數(shù)據(jù)集成
利用 Pentaho Data Integration(PDI,數(shù)據(jù)集成功能),企業(yè)可以訪問來自復雜異構來源的數(shù)據(jù),并將其與現(xiàn)有的各類數(shù)據(jù)混合,生成適用于分析的高質量信息。PDI通過豐富的圖形用戶界面和并行處理引擎提供高性能的ETL(提取、轉換和加載)功能,可滿足所有數(shù)據(jù)集成要求,包括大數(shù)據(jù)。
》》數(shù)據(jù)發(fā)現(xiàn)和探查
Pentaho Business Analytics 可以提供現(xiàn)代化的高度交互式直觀 Web 界面,使業(yè)務用戶能夠訪問和發(fā)現(xiàn)所有數(shù)據(jù),包括大數(shù)據(jù)。借助一系列日益先進的分析功能,用戶可以創(chuàng)建報告和儀表板,從多個維度實現(xiàn)數(shù)據(jù)可視化并對其進行分析,而無需依賴IT和開發(fā)人員。
》》數(shù)據(jù)可視化
Pentaho Data Integration能夠提供豐富的圖形化可視設計環(huán)境,以縮短時間并降低復雜性。
Pentaho Business Analytics可以為業(yè)務用戶提供基于 Web 的直觀交互式報告,為高級用戶提供豐富的圖形化企業(yè)報告設計器。提供交互式數(shù)據(jù)可視化和分析,并通過可視化套索過濾和縮放功能,以了解或排除異常值。根據(jù)屬性突出顯示功能,以提供具有更高視覺對比度的數(shù)據(jù)顯示。另外還擁有豐富的交互式可視化工具庫,包括地理圖、熱度網(wǎng)格和散點氣泡圖。
》》數(shù)據(jù)預測分析
Pentaho 還提供強大、先進的機器學習算法和數(shù)據(jù)處理工具。數(shù)據(jù)科學家和分析人員可以發(fā)現(xiàn)標準分析和報告無法顯示的重要模式以及相互關系。時序預測等復雜的先進分析可以幫助企業(yè)在更充分地了解過往業(yè)務績效的基礎上,針對希望實現(xiàn)的未來成果制定相關計劃。
那么,在物聯(lián)網(wǎng)領域,如何利用Pentaho更好的與數(shù)據(jù)打交道?
首先當然是需要獲得IoT數(shù)據(jù),才能對其進行搗鼓、分析。IoT數(shù)據(jù)不象看起來那么普遍,至少值得分析的數(shù)據(jù)量很少,而在關鍵型物聯(lián)網(wǎng) (IoTTM) 領域獲取數(shù)據(jù)更是難上加難。利用 Pentaho Data Integration,企業(yè)可以訪問來自復雜異構來源的數(shù)據(jù),并將其與現(xiàn)有的各類數(shù)據(jù)混合,生成適用于分析的高質量信息。
我們舉個例子說明:比如智能邊緣“人員檢測器”,此設備用于拍攝像片,并分析人臉與上半身圖像。設備由PDI控制,自動運行,收集圖像并分析,然后在傳感器日志中記錄結果。如果檢測到人臉或身體,就會決定是否碰到“人”了,隨后會在HDS HCP中存儲相應圖像。所有一切都會記錄在傳感器日志中,不過,如果檢測到人,會攝取圖像,連同圖像輪廓圖,以描述性文件名存儲于對象存儲。
物聯(lián)網(wǎng)時代:Pentaho不懼現(xiàn)在,更關乎未來
圖像保存時,其文件名的描述很清楚,包括時間戳、傳感器標識號、人臉數(shù)量、身體數(shù)量、人數(shù)。一旦碰到了“人”,完成存儲后,您就有了大量的IoT數(shù)據(jù)可以分析了。你可以點擊任何文件名,預覽被檢測物體的輪廓圖像。
此圖中檢測到21個身體但缺少臉部。從數(shù)據(jù)點拉取的圖像得知,原來這21個是來自一則廣告(只有臉部,沒有身體)。這個案例充分體現(xiàn)了Pentaho analytics 如何與IoT設備充分融合做數(shù)據(jù)收集和分析。
Pentaho 提供了涵蓋整個大數(shù)據(jù)生命周期的完整解決方案,可利用從數(shù)據(jù)發(fā)現(xiàn)到預測分析的一系列分析功能,對任何基礎架構中的大數(shù)據(jù)和傳統(tǒng)類型數(shù)據(jù)進行數(shù)據(jù)提取和準備。利用 Pentaho,我們現(xiàn)在可以立即了解需要處理的是一個一次性錯誤還是一種錯誤模式。Pentaho 非常直觀易用,我們可以輕松靈活地對其進行調整,以滿足不斷變化的要求,最終贏得的是整個未來!