為什么自己設(shè)計的嵌入式系統(tǒng)不如工業(yè)級產(chǎn)品穩(wěn)定?
[導(dǎo)讀] 在知乎上看到一個網(wǎng)友的問題:為什么自己設(shè)計的嵌入式系統(tǒng)穩(wěn)定性遠(yuǎn)不如工業(yè)級產(chǎn)品?我覺得這是一個非常好的問題,尤其國內(nèi)很多中小企業(yè)可能關(guān)注點更多在于產(chǎn)品的功能,而不在性能,產(chǎn)品功能很炫可是穩(wěn)定性往往差強人意。所以就產(chǎn)品穩(wěn)定性,來聊聊我的一些認(rèn)知和體會。
什么是穩(wěn)定性?
穩(wěn)定性,英文中用(可靠性)Reliability engineering來研究,可靠性工程是系統(tǒng)工程的一個子學(xué)科,它主要研究設(shè)備無故障運行的能力??煽啃悦枋隽讼到y(tǒng)或組件在指定條件下持續(xù)指定時間段內(nèi)運行的能力。
一個產(chǎn)品一般從設(shè)計的角度基本包含哪些主要的設(shè)計呢?常見的嵌入式系統(tǒng),可能包含機械設(shè)計、硬件設(shè)計、軟件設(shè)計,那么從設(shè)計來談一個產(chǎn)品的可靠性,就必然要從這幾個主要的方面下功夫。另外工業(yè)級產(chǎn)品為什么表現(xiàn)的更加可靠呢?
為了要相對深入的談這個問題,來看看這個相關(guān)的一些術(shù)語指標(biāo)是怎么描述一個系統(tǒng)或者零件的可靠性的。
啥是可靠性概率?
可靠性定義為設(shè)備在規(guī)定條件下在指定時間段內(nèi)將執(zhí)行其預(yù)期功能的概率。從數(shù)學(xué)上講,這可以表示為系統(tǒng)的可靠性是指在時間t內(nèi)沒有發(fā)生某F類故障的概率。
作何理解呢? 系統(tǒng)開始工作的時間, 是發(fā)生類故障的時刻。也即表征系統(tǒng)由于某類故障而失效的概率
啥是失效概率
有可靠性概率,自然就有失效概率 ,失效概率剛好與可靠性概率是互補,滿足下面關(guān)系:
上面的概念是針對某類故障的統(tǒng)計規(guī)律,那么推廣開來,從系統(tǒng)而言去掉下標(biāo)F,也滿足上述關(guān)系。一個系統(tǒng)由不同的組件組成。
系統(tǒng)失效率
當(dāng)系統(tǒng)的壽命呈指數(shù)分布時,系統(tǒng)的可靠性為: ,其中 就是失效率(failure rate)的概念
這個曲線相信很多人應(yīng)該見過,這就是產(chǎn)品的澡盆曲線,在產(chǎn)品前期老化階段比較容易暴露故障,失效率比較高。不要問我為什么,這是無數(shù)先輩們統(tǒng)計所得的統(tǒng)計規(guī)律,對于工程應(yīng)用相信即可(當(dāng)然如果是做理論研究的則另當(dāng)別論)。這個規(guī)律也解釋了為何有的廠家出廠的產(chǎn)品需要做老化試驗的原因,因為做老化試驗可以將故障充分暴露出來,如此篩選出來的產(chǎn)品在客戶端將很少會出故障。
為啥費這么多話來討論這個失效率呢,來看看這個例表:
汽車嵌入式系統(tǒng)組件 | 失效率 |
---|---|
軍工級微處理器 | 0.022 |
車規(guī)級微處理器 | 0.12 |
電動馬達(dá) | 16.9 |
不同的組件的失效率是不一樣的,那么在設(shè)計之初在成本允許的情況下,就需要盡量選取失效率低的組件。
失效模式
不同的組件的失效模式是不一樣的,啥概念呢?也就是組件產(chǎn)生故障的原因各異,比如電路板上的電阻其失效模式就有可能是短路失效,斷路失效、參數(shù)漂移失效,對于軟件而言其失效模式就有可能有很多,比如棧溢出、RAM數(shù)據(jù)錯誤、芯片總線錯誤等等。每種失效模式,其失效率也是不一樣的。如要深入其了解這些指標(biāo)的含義可以參考IEC61508或者其他等同的標(biāo)準(zhǔn)。
如何提高產(chǎn)品的可靠性呢?
那么究竟如何能提高產(chǎn)品的可靠性呢?我想大體上可以從這幾個方面著手:
-
成功的開發(fā)流程 -
成功的項目管理 -
嚴(yán)格的質(zhì)量控制
開發(fā)流程
這是IEC61508界定軟件、硬件都須采用如下的V&V開發(fā)模型(注明IEC61508標(biāo)準(zhǔn)里圖不太一樣),簡單介紹一下這個模型:
現(xiàn)在流行很多的開發(fā)流程,比如敏捷開發(fā)模型就比較受追捧,個人并不反對敏捷開發(fā)模型,但是從產(chǎn)品開發(fā)的可靠性角度更推崇這種雙V模型,其實很多跑敏捷的項目在每一個迭代中其實可以融入這種雙V模型。這個模型從設(shè)計的需求>架構(gòu)>詳細(xì)子模塊設(shè)計每向下走一步,都需要verfication 測試檢驗前級,同時還最終輸出validation確認(rèn)設(shè)計。
在IEC 61508(功能安全等級標(biāo)準(zhǔn))等標(biāo)準(zhǔn)中都有體現(xiàn)這一套路,簡略看看相關(guān)標(biāo)準(zhǔn):
IEC 61508是適用于各種行業(yè)的基本功能安全標(biāo)準(zhǔn)。它將功能安全定義為:“與EUC(受控設(shè)備)和EUC控制系統(tǒng)相關(guān)的整體安全的一部分,它依賴于E/E/PE安全相關(guān)系統(tǒng)、其他技術(shù)安全相關(guān)系統(tǒng)和外部風(fēng)險降低設(shè)施的正確運行?!薄盎镜母拍钍牵喝魏伟踩嚓P(guān)的系統(tǒng)都必須正確工作或以可預(yù)測的(安全的)方式失效?!?/p>
個人對于V&V模型理解的幾個要點:
-
要可執(zhí)行的流程,不要形式化套路! -
標(biāo)準(zhǔn)規(guī)定的科學(xué)嚴(yán)謹(jǐn)套路,遵循從需求到設(shè)計的雙向可追溯,從設(shè)計到測試的雙向可追溯。 -
可靠性從一開始轉(zhuǎn)化市場需求時就需引入,中小型企業(yè)更多聚焦于功能實現(xiàn),而忽略了性能、可靠性需求。注意這些可靠性需求都是設(shè)計目標(biāo),沒有目標(biāo)如何能從體系上產(chǎn)出一個優(yōu)良的產(chǎn)品呢?如不遵循嚴(yán)格的體系流程,或許一個公司偶然能出一個高質(zhì)量產(chǎn)品,但個人認(rèn)為一定很難保證出來的產(chǎn)品的整體質(zhì)量 -
需求環(huán)節(jié):可靠性是需要提需求的,舉些栗子: -
環(huán)境需求,比如溫度、濕度、振動等,這些在需求階段就應(yīng)界定相關(guān)的測試等級,其實即便公司的產(chǎn)品不需要去做相關(guān)強制認(rèn)證,但是從可靠性角度,提出這樣的需求,勢必需要相應(yīng)的設(shè)計以及測試去保證。那么定然從這些維度會提升產(chǎn)品的可靠性。 -
EMC需求:比如常規(guī)的抗擾度測試要求,都需要需求階段明確提出。 -
..... -
設(shè)計環(huán)節(jié),可靠性需要提出需求,更需要設(shè)計去實現(xiàn)。對于每項可靠性需求,事實上都可以盡量轉(zhuǎn)化成設(shè)計的檢查項去追溯。比如硬件中的器件失效模型及影響分析FMEA(Failure mode and effects analysis),軟件中同樣也有對應(yīng)的失效模型可做分析以及影響分析,通過失效模型分析,可參考標(biāo)準(zhǔn)中的推薦做法去從設(shè)計的角度采取對策。 -
測試環(huán)節(jié):測試包含驗證(verification)和確認(rèn)(validation) ,V&V模型每向下一步,都應(yīng)向上一步去verification,每一個設(shè)計輸出,其實都應(yīng)有對應(yīng)的驗證去保障,最終的產(chǎn)品級還需要確認(rèn)環(huán)節(jié)。另一個重要的要點就是工業(yè)級產(chǎn)品開發(fā),往往在需求階段,設(shè)計就已然介入。
開發(fā)流程每個公司都各有不同,但是從產(chǎn)品生命周期以及產(chǎn)品可靠性自身規(guī)律角度,個人覺得還是應(yīng)該考慮這些要點。關(guān)于開發(fā)流程以及功能安全標(biāo)準(zhǔn)內(nèi)容很多,這里泛泛總結(jié)這些個人體會。
成功的項目管理
項目管理是在特定的時間內(nèi)領(lǐng)導(dǎo)團(tuán)隊實現(xiàn)目標(biāo)和達(dá)到成功標(biāo)準(zhǔn)的過程。項目管理的主要挑戰(zhàn)是在給定的約束條件下實現(xiàn)所有的項目目標(biāo)。這些信息通常在項目文檔中描述,在開發(fā)過程的開始創(chuàng)建。主要的限制是范圍、時間、質(zhì)量和預(yù)算。其次的挑戰(zhàn)是優(yōu)化必要投入的分配,并應(yīng)用它們來滿足預(yù)先確定的目標(biāo)。
一個可靠性很高的的產(chǎn)品開發(fā),與一個完善的項目管理是密不可分的。項目管理在項目的執(zhí)行過程中作用是非常重要的,從啟動、計劃、執(zhí)行、監(jiān)管、收尾中對項目進(jìn)行管理。
項目管理在這些過程中,所需的知識以及在每個階段需從事的活動可參考下圖(來源:PMBOK 第6版):
嚴(yán)格的質(zhì)量控制
好的設(shè)計發(fā)布,如沒有嚴(yán)格的生產(chǎn)質(zhì)量控制,所出售的產(chǎn)品質(zhì)量也定然沒有保障。對于這一點不怎么了解,就不做過多的描述了。
總結(jié)一下
回到問題本身,如想得到一個可靠的產(chǎn)品,個人認(rèn)為從產(chǎn)品設(shè)計流程、項目管理、以及生產(chǎn)質(zhì)控方面都應(yīng)有完善的要求且須很好的落實,工業(yè)級產(chǎn)品砸錢做那么多的認(rèn)證,不是沒有緣由的。這些認(rèn)證里有很多就是可靠性的具體考核。
-END-
推薦閱讀
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!