當(dāng)前位置:首頁(yè) > 物聯(lián)網(wǎng) > 《物聯(lián)網(wǎng)技術(shù)》雜志
[導(dǎo)讀] 常廣炎 楊 彬 (遼寧行政學(xué)院,遼寧 沈陽(yáng) 110161) 摘 要 :物聯(lián)網(wǎng)與工業(yè)制造深度融合,物聯(lián)信息系統(tǒng)將生產(chǎn)中的供應(yīng)、制造、銷售等信息數(shù)據(jù)化、智慧化,最 后達(dá)到快速、有效、個(gè)性化的產(chǎn)品供應(yīng)。文中描述了制造業(yè)中使用數(shù)據(jù)分析的挑戰(zhàn),根據(jù)應(yīng)用程序中的經(jīng)驗(yàn),提出 了操作建議,并分享了首選的技術(shù)堆棧。

0 引 言

德國(guó)“工業(yè) 4.0”和美國(guó)的“工業(yè)互聯(lián)網(wǎng)”將重構(gòu)世界工業(yè)布局和經(jīng)濟(jì)格局,給世界各國(guó)帶來(lái)不同的挑戰(zhàn)和機(jī)遇。我國(guó)國(guó)務(wù)院印發(fā)“中國(guó)制造 2025”,作為實(shí)施制造強(qiáng)國(guó)戰(zhàn)略第一個(gè)十年的行動(dòng)綱領(lǐng),將加快推動(dòng)物聯(lián)網(wǎng)技術(shù)與制造技術(shù)融合發(fā)展 [1]。物聯(lián)網(wǎng)收集有關(guān)機(jī)器操作、材料使用、設(shè)施物流等數(shù)據(jù),帶來(lái)了操作人員的透明度。這種透明性是由數(shù)據(jù)分析應(yīng)用所帶來(lái)的,它指的是使用統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法來(lái)發(fā)現(xiàn)不同的數(shù)據(jù)特征和模式。機(jī)器學(xué)習(xí)技術(shù)越來(lái)越多地用于各種制造應(yīng)用中,如預(yù)測(cè)性維護(hù),測(cè)試時(shí)間縮短,供應(yīng)鏈優(yōu)化和流程優(yōu)化等 [2-4]。企業(yè)的制造過(guò)程已由傳統(tǒng)的“黑箱”模式逐漸向“多維度、透明化和泛在感知”模式發(fā)展 [5]。

1 制造分析面臨的挑戰(zhàn)

制造分析的目標(biāo)是通過(guò)降低成本而不影響質(zhì)量來(lái)提高生產(chǎn)力 :

(1)減少測(cè)試時(shí)間和校準(zhǔn),包括預(yù)測(cè)測(cè)試結(jié)果和校準(zhǔn)參數(shù) ;

(2)提高質(zhì)量,通過(guò)確定廢品的根本原因和自行優(yōu)化生產(chǎn)線來(lái)降低生產(chǎn)廢品(壞件)的成本 ;

(3)降低保修成本,使用質(zhì)量測(cè)試和過(guò)程數(shù)據(jù)來(lái)預(yù)測(cè)現(xiàn)場(chǎng)故障,以及跨價(jià)值流分析 ;

(4)提高產(chǎn)量,跨生產(chǎn)線和工廠的基準(zhǔn)分析,提高第一次通過(guò)率,提高首過(guò)產(chǎn)量,并找出總體設(shè)備效率(OEE)或周期時(shí)間等性能瓶頸的原因 ;

(5)執(zhí)行預(yù)測(cè)性維護(hù),分析機(jī)器運(yùn)行狀況,確定故障的主要原因,預(yù)測(cè)部件故障以避免計(jì)劃外停機(jī)。

傳統(tǒng)的質(zhì)量改進(jìn)計(jì)劃包括六西格瑪、戴明循環(huán)、全面質(zhì)量管理(TQM)和多里安 · 謝寧的統(tǒng)計(jì)工程(SE)[6]。在 20世紀(jì) 80 年代和 90 年代開發(fā)的方法通常應(yīng)用于少量的數(shù)據(jù),并找到參與因素之間的單變量關(guān)系。 使用 MapReduce 范式簡(jiǎn)化大型數(shù)據(jù)集中的數(shù)據(jù)處理及其進(jìn)一步發(fā)展導(dǎo)致大數(shù)據(jù)分析的主流擴(kuò)散 [7]。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,大數(shù)據(jù)分析的發(fā)展提供了一系列新的工具,可應(yīng)用于制造分析。 這些功能包括能夠在批處理和流模式下分析千兆字節(jié)的數(shù)據(jù),能夠在許多變量之間找到復(fù)雜的多元非線性關(guān)系,以及將因果關(guān)系與相關(guān)性區(qū)分開來(lái)的機(jī)器學(xué)習(xí)算法。

在生產(chǎn)線上生產(chǎn)數(shù)以百萬(wàn)計(jì)的零件,并為他們收集了數(shù)千個(gè)工序和質(zhì)量測(cè)量的數(shù)據(jù),這對(duì)提高質(zhì)量和降低成本非常重要。實(shí)驗(yàn)設(shè)計(jì)(DoE),通過(guò)控制實(shí)驗(yàn),反復(fù)探索數(shù)千個(gè)原因,往往太耗時(shí),成本高昂。制造專家依靠其領(lǐng)域知識(shí)來(lái)檢測(cè)可能影響質(zhì)量的關(guān)鍵因素,再根據(jù)這些因素運(yùn)行 DoE。大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的進(jìn)步使得檢測(cè)關(guān)鍵因素能夠有效地影響質(zhì)量和產(chǎn)量。這與領(lǐng)域知識(shí)相結(jié)合,能夠快速檢測(cè)故障的根本原因。然而,在制造業(yè)中有一些獨(dú)特的數(shù)據(jù)科學(xué)挑戰(zhàn)。

(1)虛警和假陰性的不相等成本,在計(jì)算準(zhǔn)確率時(shí),必須認(rèn)識(shí)到虛警和假陰性可能產(chǎn)生不相等的成本。假設(shè)一個(gè)假陰性是一個(gè)壞的部分 / 實(shí)例,被錯(cuò)誤地預(yù)測(cè)為好的。另外,假設(shè)一個(gè)錯(cuò)誤的警報(bào)是一個(gè)好的部分,被錯(cuò)誤地預(yù)測(cè)為壞的。進(jìn)一步假設(shè)所生產(chǎn)的部件是安全關(guān)鍵部件,錯(cuò)誤地預(yù)測(cè)壞的部分是好的(假陰性),會(huì)使人的生命處于危險(xiǎn)之中。因此,假陰性的代價(jià)可能比假警報(bào)高得多。在將業(yè)務(wù)目標(biāo)轉(zhuǎn)化為技術(shù)目標(biāo)和候選評(píng)估方法時(shí),需要考慮這種權(quán)衡。

(2)數(shù)據(jù)收集和可追溯性問(wèn)題,數(shù)據(jù)收集問(wèn)題經(jīng)常發(fā)生,許多裝配線缺乏“端到端的可追溯性”。換句話說(shuō),通常沒(méi)有與正在生產(chǎn)部件和處理步驟相關(guān)聯(lián)的唯一標(biāo)識(shí)符。一種解決方法是使用時(shí)間戳來(lái)代替標(biāo)識(shí)符。另一種情況涉及不完整的數(shù)據(jù)集。這種情況下,在預(yù)測(cè)和分析中省略不完整信息部分或?qū)嵗?,或者使用一些估算方法(在咨詢了制造專家之后)?

(3)大量的特性,與傳統(tǒng)的數(shù)據(jù)挖掘中的數(shù)據(jù)集不同的是在制造分析中觀察到的特征可能數(shù)以千計(jì)。因此必須注意避免機(jī)器學(xué)習(xí)算法只能使用精簡(jiǎn)數(shù)據(jù)集(即具有少量特征的數(shù)據(jù)集)。

(4)多重共線性,當(dāng)產(chǎn)品通過(guò)裝配線時(shí),在生產(chǎn)流程的不同站點(diǎn)上采取不同的測(cè)量方法。這些測(cè)量中的一些可以是高度相關(guān)的,然而許多機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法特性相互獨(dú)立,對(duì)于提出的分析方法,應(yīng)該仔細(xì)研究多重共線性問(wèn)題。

(5)分類失衡問(wèn)題,好的和壞的部分(或廢品,即不通過(guò)質(zhì)量控制測(cè)試的部分)之間存在極大的不平衡。比例范圍可能從 9 ∶ 1 到甚至低于 99 000 000 ∶ 1。應(yīng)用標(biāo)準(zhǔn)分類技術(shù)區(qū)分好的零件和廢料是困難的,因此提出了幾種處理類不平衡方法,并應(yīng)用于制造分析 [8]。

(6)非平穩(wěn)數(shù)據(jù),由于各種因素,如供應(yīng)商或運(yùn)營(yíng)商的變化以及機(jī)器中的校準(zhǔn)偏差,基礎(chǔ)制造過(guò)程可能會(huì)發(fā)生變化。因此需要應(yīng)用更穩(wěn)健的數(shù)據(jù)非穩(wěn)態(tài)性質(zhì)的方法。 (7)模型可能難以解釋,生產(chǎn)和質(zhì)量控制工程師需要了解告知流程或設(shè)計(jì)更改的分析解決方案。否則生成的建議和決策可能會(huì)被忽略。

2 利用大數(shù)據(jù)工具鏈

從制造產(chǎn)品價(jià)值鏈?zhǔn)占臄?shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中后,需要一個(gè)數(shù)據(jù)分析系統(tǒng)對(duì)這些數(shù)據(jù)進(jìn)行分析。制造數(shù)據(jù)分析系統(tǒng)框架如圖 1 所示。數(shù)據(jù)首先從不同的數(shù)據(jù)庫(kù)提取、轉(zhuǎn)換和加載(ETL)到分布式文件系統(tǒng),如 Hadoop 分布式文件系統(tǒng)(HDFS)或 NoSQL 數(shù)據(jù)庫(kù)(如 MongoDB)中。接下來(lái),機(jī)器學(xué)習(xí)和分析工具執(zhí)行預(yù)測(cè)建?;蛎枋鲂苑治?。為了部署預(yù)測(cè)模型,前面提到的工具被用來(lái)將歷史數(shù)據(jù)上的訓(xùn)練模型轉(zhuǎn)換為開放的、封裝的統(tǒng)計(jì)數(shù)據(jù)挖掘模型和關(guān)聯(lián)的元數(shù)據(jù),稱為預(yù)測(cè)模型標(biāo)記語(yǔ)言(PMML),并將其存儲(chǔ)在一個(gè)計(jì)分引擎中。任何來(lái)源的新數(shù)據(jù)都使用存儲(chǔ)在計(jì)分引擎中的模型進(jìn)行評(píng)估 [9]。

用于制造分析的大數(shù)據(jù)軟件堆棧可以是開源、商業(yè)和專有工具的混合體,制造分析軟件堆棧示例如圖 2 所示。從已完成的項(xiàng)目中獲悉,現(xiàn)有的堆棧供應(yīng)商目前沒(méi)有提供完整的解決方案。盡管技術(shù)領(lǐng)域正在迅速發(fā)展,但目前最好的選擇是模塊化,重點(diǎn)是真正的分布式組件,成功的核心思想是將開源和商業(yè)組件混合在一起 [10]。

除了這里介紹的體系結(jié)構(gòu)之外,還有各種商用物聯(lián)網(wǎng)平臺(tái)。其中包括 GE 的 Predix(www.predix.com),博世的物聯(lián)網(wǎng)套件(www.bosch-iot-suite.com),IBM 的 Bluemix(www.ibm.com/cloud-computing/),ABB 基于 Microsoft Azure 的物聯(lián)網(wǎng)服務(wù)和人員平臺(tái)(https ://azure.microsoft.com)以及亞馬遜的物聯(lián)網(wǎng)云(https ://aws.amazon.com/iot)。些平臺(tái)提供了許多用于物聯(lián)網(wǎng)和分析的標(biāo)準(zhǔn)服務(wù),包括身份管理和數(shù)據(jù)安全,這里的案例研究中沒(méi)有涉及。另一方面,最好的方法提供了靈活性和可定制的功能,使實(shí)現(xiàn)比標(biāo)準(zhǔn)的商業(yè)解決方案更有效。但是實(shí)施這樣的解決方案可能需要在實(shí)施現(xiàn)場(chǎng)提供一個(gè)有能力的數(shù)據(jù)科學(xué)團(tuán)隊(duì)。這個(gè)選擇可以歸結(jié)為幾個(gè)因素,非功能性需求、成本、物聯(lián)網(wǎng)和分析技術(shù)。


基于物聯(lián)網(wǎng)的工業(yè)制造分析研究

3 降低廢品率的案例研究

任何在工廠組裝或生產(chǎn)的產(chǎn)品都要經(jīng)過(guò)一系列的質(zhì)量檢測(cè),以確定是否需要報(bào)廢。高報(bào)廢率是由于不及時(shí)向客戶交付產(chǎn)品的機(jī)會(huì)成本、人員浪費(fèi)時(shí)間、非可重復(fù)使用部件的浪費(fèi)及設(shè)備管理費(fèi)用造成的。降低廢品率是制造商需要解決的主要問(wèn)題之一。減少?gòu)U品的方法包括找出產(chǎn)品質(zhì)量低的根本原因。

3.1 數(shù)據(jù)處理

根源分析從整合生產(chǎn)線上所有可用的數(shù)據(jù)開始。裝配線、工作站和機(jī)器構(gòu)成了工業(yè)生產(chǎn)單元,可被視為等同于物聯(lián)網(wǎng)傳感器網(wǎng)絡(luò)。在制造過(guò)程中,有關(guān)過(guò)程狀態(tài)、機(jī)器狀態(tài)、工具和部件的信息不斷地被傳遞和存儲(chǔ)。在本案例研究中考慮工廠生產(chǎn)的數(shù)量、規(guī)模和頻率,以至于需要使用一個(gè)大數(shù)據(jù)工具棧,類似于圖 2 所示的數(shù)據(jù)工具棧,用于流、存儲(chǔ)、預(yù)處理和連接數(shù)據(jù)。這條數(shù)據(jù)管道幫助在批處理歷史數(shù)據(jù)和流實(shí)時(shí)數(shù)據(jù)上構(gòu)建機(jī)器學(xué)習(xí)模型。雖然批量數(shù)據(jù)分析幫助識(shí)別制造過(guò)程中的問(wèn)題,但流式數(shù)據(jù)分析使工廠工程師能夠定期訪問(wèn)最新問(wèn)題及其根本原因。使用 Kafka(https ://kafka.apache.org) 和 Spark streaming(http ://spark.apache.org/streaming)傳輸來(lái)自不同數(shù)據(jù)源的實(shí)時(shí)數(shù)據(jù) ;使用 Hadoo(http ://hadoop.apache.org)和 HBase(https ://hbase.apache.org)高效地存儲(chǔ)數(shù)據(jù) ;使用 Spark(http ://spark.apache.org) 和 MapReduce 框架分析數(shù)據(jù)。使用這些工具的兩個(gè)主要原因是它們作為開源產(chǎn)品的可用性,以及它們龐大而活躍的開發(fā)人員網(wǎng)絡(luò),通過(guò)這些網(wǎng)絡(luò)不斷地更新這些工具。


3.2 機(jī)器學(xué)習(xí)

隨 著 Spark MLLib(http ://spark.apache.org/mllib) 和SparkR(http ://spark.apache.org/docs/latest/index.html) 等 分布式計(jì)算工具的功能增加,其變得更加容易實(shí)現(xiàn)分布式和在線的機(jī)器學(xué)習(xí)模型,如支持向量機(jī)、梯度推進(jìn)樹及大量數(shù)據(jù)的決策樹。測(cè)試不同的機(jī)器參數(shù)和過(guò)程測(cè)量對(duì)整體產(chǎn)品質(zhì)量的影響,從相關(guān)分析到方差分析和卡方假設(shè)檢驗(yàn),有助于確定個(gè)體測(cè)量對(duì)產(chǎn)品質(zhì)量的影響。本設(shè)計(jì)訓(xùn)練了一些分類和回歸模型,這些模型可以區(qū)分通過(guò)質(zhì)量控制的部分和不通過(guò)質(zhì)量控制的部分,可以使用經(jīng)過(guò)訓(xùn)練的模型來(lái)推斷決策規(guī)則。根據(jù)純度最高的規(guī)則,純度定義為 Nb / N,其中 N 是滿足規(guī)則的產(chǎn)品數(shù)量,Nb 是滿足規(guī)則的有缺陷或壞部件的總數(shù)。

雖然這些模型可以識(shí)別變量之間的線性和非線性關(guān)系,但它們并不表示因果關(guān)系。因果關(guān)系對(duì)于確定真正的根本原因至關(guān)重要,使用貝葉斯因果模型來(lái)推斷所有數(shù)據(jù)的因果關(guān)系。

3.3 可視化

收集大數(shù)據(jù)的可視化平臺(tái)至關(guān)重要。工程師面臨的主要挑戰(zhàn)是對(duì)完整的制造過(guò)程沒(méi)有清晰而全面的概述。這樣的概述將幫助他們?cè)诎l(fā)生任何不良事件之前做出決定并評(píng)估其狀態(tài)。描述性分析使用 Tableau(www.tableau.com)和微軟 BI(https ://powerbi.microsoft.com/en-us)等工具幫助實(shí)現(xiàn)此目的。描述性分析包括許多視圖,如直方圖、雙變量圖和相關(guān)性圖。除了可視化統(tǒng)計(jì)描述外,還應(yīng)為所有預(yù)測(cè)模型提供一個(gè)清晰的視覺(jué)界面。所有影響特定質(zhì)量參數(shù)的測(cè)量都可以被可視化,后端的數(shù)據(jù)可按時(shí)間過(guò)濾。

4 結(jié) 語(yǔ)

 “物聯(lián)網(wǎng) + 中國(guó)制造 2025”是實(shí)現(xiàn)我國(guó)制造業(yè)與新一代信息技術(shù)深度結(jié)合的具體表現(xiàn),互聯(lián)制造業(yè)正經(jīng)歷一場(chǎng)技術(shù)革命,用戶會(huì)要求在所有產(chǎn)品中增加個(gè)性化和許多消費(fèi)電子產(chǎn)品功能。制造分析有利于發(fā)展智能制造和大規(guī)模個(gè)性化定制,提升網(wǎng)絡(luò)化協(xié)同制造水平,加速制造業(yè)服務(wù)化轉(zhuǎn)型。這將關(guān)閉設(shè)計(jì)、制造、營(yíng)銷、銷售和上市后跟蹤 / 監(jiān)視之間的循環(huán)。物聯(lián)網(wǎng)將成為“中國(guó)制造”轉(zhuǎn)型升級(jí)、提升附加值的重要手段。大數(shù)據(jù)和相關(guān)分析將成為工程連續(xù)過(guò)程中提取所需知識(shí)和提供智能的關(guān)鍵技術(shù)。









本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉