軟件定義汽車中的 MLOps:集中式平臺(tái)方法
軟件定義汽車 ( SDV ) 是指汽車設(shè)計(jì)的一種新范式,其中車輛的功能和特性主要由軟件而不是傳統(tǒng)的硬件組件定義和控制。
在 SDV 中,軟件更新可以動(dòng)態(tài)改變和增強(qiáng)車輛功能,從而形成更加靈活、適應(yīng)性更強(qiáng)的汽車生態(tài)系統(tǒng)。
軟件定義汽車中的 MLOP
MLOps(機(jī)器學(xué)習(xí)操作)涵蓋旨在簡(jiǎn)化和自動(dòng)化生產(chǎn)環(huán)境中機(jī)器學(xué)習(xí)模型整個(gè)生命周期的管理和部署的實(shí)踐、工具和方法。
與 SDV 的相關(guān)性
SDV 嚴(yán)重依賴 ML 模型來執(zhí)行關(guān)鍵功能,例如自動(dòng)駕駛、預(yù)測(cè)性維護(hù)、用戶個(gè)性化等。
這些模型的有效管理不僅重要,而且對(duì)于維持 SDV 的車輛性能、安全性和可靠性至關(guān)重要。
MLOPs 平臺(tái)、不同方法以及如何實(shí)現(xiàn)?
我們將研究 ML 平臺(tái)的范圍、構(gòu)建平臺(tái)的方法以及如何使用討論的方法之一來構(gòu)建平臺(tái)。
MLOPs 平臺(tái)
一個(gè)整體的軟件平臺(tái),可提高運(yùn)輸、監(jiān)控和管理 ML 模型生命周期的生產(chǎn)力和可擴(kuò)展性,從而促進(jìn) SDV 內(nèi)的功能。
集中式與分散式
MLOP 平臺(tái)可以集中化,在一個(gè)中心位置管理所有有助于促進(jìn)功能的 ML 模型。
它還可以由各個(gè)功能團(tuán)隊(duì)進(jìn)行分離和構(gòu)建,并縮小管理范圍,僅管理與該功能相關(guān)的模型。
我們將深入研究用于管理 ML 模型的集中式 ML 平臺(tái)以及構(gòu)建該平臺(tái)所需的條件。
為 SDV 構(gòu)建整體 ML 平臺(tái)需要什么
我們需要考慮以下組件來構(gòu)建一個(gè)集中式 ML 平臺(tái),有效管理有助于 SDV 內(nèi)的功能的 ML 模型。
數(shù)據(jù)工程
組織傾向于在企業(yè)級(jí)建立團(tuán)隊(duì)來幫助管理訓(xùn)練和開發(fā)機(jī)器學(xué)習(xí)模型的數(shù)據(jù)需求。
ML 平臺(tái)應(yīng)具有完善的實(shí)用程序來跟蹤訓(xùn)練 ML 模型所需的數(shù)據(jù)沿襲,例如數(shù)據(jù)提取、數(shù)據(jù)轉(zhuǎn)換和用于訓(xùn)練當(dāng)前模型的最終數(shù)據(jù)集。良好跟蹤的數(shù)據(jù)沿襲可以幫助使用該平臺(tái)的功能團(tuán)隊(duì)深入了解用于訓(xùn)練模型的數(shù)據(jù)點(diǎn),從而改進(jìn)模型以有效地幫助該功能。
通常的做法是采用 API 優(yōu)先的方法將企業(yè)級(jí)數(shù)據(jù)管理團(tuán)隊(duì)集成到平臺(tái)中。
模型開發(fā)
盡管平臺(tái)無法控制模型的開發(fā)方式,因?yàn)楣δ軋F(tuán)隊(duì)將負(fù)責(zé)協(xié)調(diào)該方面,但平臺(tái)的最佳利益是向功能團(tuán)隊(duì)提供標(biāo)準(zhǔn)化的方法/模板,以收集以下筆記本源跟蹤、訓(xùn)練集 id、驗(yàn)證集 id、測(cè)試集 id、預(yù)處理 id、后處理 id、模型 id 和生成的模型版本作為實(shí)驗(yàn)、設(shè)備類型和模型創(chuàng)建 id 的一部分。
該平臺(tái)還可以標(biāo)準(zhǔn)化模型開發(fā)時(shí)所需的工件,以便稍后在模型部署期間使用。
從模型開發(fā)的角度收集上述所有信息在模型管理/監(jiān)控階段非常有用。
模型驗(yàn)證/治理
一旦模型開發(fā)完畢、測(cè)試完畢并準(zhǔn)備部署到車輛上,MLOPs 平臺(tái)應(yīng)該提供一個(gè)接口來驗(yàn)證它,然后才能通過部署所需的框架/實(shí)用程序發(fā)布它。
在將模型部署到車輛之前,適當(dāng)?shù)幕趯徟ぷ髁鞯闹卫砟P蛯?duì)于審查該模型至關(guān)重要。
如果模型在部署前經(jīng)過治理流程,這對(duì) ML 平臺(tái)來說非常有利。它還為組織內(nèi)部處理模型建立了標(biāo)準(zhǔn)。
模型部署
這是平臺(tái)的核心;這是輪胎與道路接觸的地方。所有上述步驟構(gòu)建并設(shè)置了平臺(tái),使其處于一個(gè)非凡的位置,可以輕松處理模型。
前面步驟中采用的標(biāo)準(zhǔn)化技術(shù)將對(duì)所有模型進(jìn)行水平設(shè)置,并有助于減少差異性,同時(shí)開發(fā)服務(wù)將模型納入平臺(tái)并使用各種實(shí)用程序和框架將它們部署到車輛上以部署軟件。
該平臺(tái)應(yīng)能夠提取、跟蹤和管理已上傳的部署模型,并輕松與車輛部署實(shí)用程序和框架集成。同樣,在這種情況下,API 優(yōu)先方法是首選方法。
模范 OP
一旦模型上傳部署,就可以在對(duì)其執(zhí)行操作時(shí)應(yīng)用幾件事。
如果部分上傳導(dǎo)致平臺(tái)無法處理模型,平臺(tái)應(yīng)該能夠檢測(cè)到它們并進(jìn)行相應(yīng)的處理。
如果模型上傳后未能通過驗(yàn)證/治理過程,平臺(tái)應(yīng)該能夠處理這個(gè)問題。
模型已上傳并準(zhǔn)備部署。在這種情況下,平臺(tái)應(yīng)該能夠評(píng)估模型在車輛中運(yùn)行所需的軟件,并根據(jù)軟件準(zhǔn)備情況、版本兼容性和其他此類因素做出相應(yīng)的決策。
如果模型通過了上述所有標(biāo)準(zhǔn)并被部署,則平臺(tái)應(yīng)該能夠?qū)⑵湟苿?dòng)到已處理的模型特征,以從模型的部署和未來操作中收集更多見解。
模型監(jiān)控
當(dāng) ML 模型部署到車輛上時(shí),應(yīng)該特別強(qiáng)調(diào)模型監(jiān)控,因?yàn)檫@對(duì)于它們的正常運(yùn)行非常重要。
該平臺(tái)應(yīng)開發(fā)實(shí)用程序,幫助計(jì)算使用 ML 平臺(tái)部署的每個(gè)模型的數(shù)據(jù)/概念漂移??梢酝ㄟ^開發(fā)一個(gè)框架來計(jì)算漂移,該框架使用匯總的車輛報(bào)告并定期將其與與模型相關(guān)的閾值分?jǐn)?shù)進(jìn)行比較。
如果不滿足閾值標(biāo)準(zhǔn),則會(huì)向模型/特征所有者發(fā)送通知。
重新訓(xùn)練/回滾/雜項(xiàng)功能
模型 OP 和監(jiān)控有助于為功能團(tuán)隊(duì)提供儀表板和視圖,以便他們可以就模型再訓(xùn)練、模型回滾以及與在車輛內(nèi)操作模型相關(guān)的其他幾個(gè)功能做出決策。
該平臺(tái)應(yīng)該能夠處理可能發(fā)生的各種情況,例如,維護(hù)平臺(tái)中的版本數(shù)量,以便能夠在需要時(shí)輕松獲取適當(dāng)?shù)陌姹?如果新部署的版本出現(xiàn)意外的性能損失,則回滾到以前執(zhí)行的模型版本;影子部署關(guān)鍵功能的較新版本;將模型部署到預(yù)定義的車輛子集而不是整個(gè)車隊(duì)。
集中式 MLOP 平臺(tái)對(duì) SDV 的優(yōu)勢(shì)
從上述方法可以看出,MLOPs平臺(tái)通過標(biāo)準(zhǔn)化將模型部署到車輛軟件所需的MLOPs功能,有助于加快價(jià)值實(shí)現(xiàn)時(shí)間,從而提高整體效率。
以下是此方法的優(yōu)點(diǎn)的概述
· 幫助構(gòu)建可重復(fù)使用的工作流程/管道
· 提高功能/產(chǎn)品團(tuán)隊(duì)之間的一致性和生產(chǎn)力
· 為與 ML 模型相關(guān)的所有 ML 相關(guān)功能/操作提供一個(gè)中心位置。
· 降低車輛集成障礙和所需的專業(yè)知識(shí)。
構(gòu)建一個(gè)用于管理與軟件定義汽車相關(guān)的 ML 模型的尖端 ML 平臺(tái)還有許多其他優(yōu)勢(shì)。
本文有助于啟動(dòng)有關(guān) SDV 的思考過程以及模型管理如何對(duì)其成功至關(guān)重要。