微軟：其47000位程序員每月制造近30000個(gè)bug

時(shí)間：2020-05-14 15:02:01

關(guān)鍵字：微軟 BUG 程序員模型

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]4月24日消息微軟詳細(xì)介紹了他們?nèi)绾卫脵C(jī)器學(xué)習(xí)模型處理其軟件和服務(wù)中的BUG，“47000名開發(fā)人員每月產(chǎn)生近3萬個(gè)Bug，”微軟高級(jí)安全項(xiàng)目經(jīng)理Scott Christiansen解釋道。這家軟

4月24日消息微軟詳細(xì)介紹了他們?nèi)绾卫脵C(jī)器學(xué)習(xí)模型處理其軟件和服務(wù)中的BUG，“47000名開發(fā)人員每月產(chǎn)生近3萬個(gè)Bug，”微軟高級(jí)安全項(xiàng)目經(jīng)理Scott Christiansen解釋道。這家軟件制造商在GitHub和AzureDevOps倉庫中跟蹤這些Bug，但僅靠傳統(tǒng)的標(biāo)簽和優(yōu)先級(jí)排序很難跟蹤這些bug。

▲圖自微軟官網(wǎng)

微軟現(xiàn)在正在使用近20年的歷史數(shù)據(jù)、跨越1300萬個(gè)工作項(xiàng)目和Bug，創(chuàng)建了一個(gè)機(jī)器學(xué)習(xí)模型，可以以99%的準(zhǔn)確率將安全和非安全Bug區(qū)分開來。這是一個(gè)旨在幫助開發(fā)人員準(zhǔn)確識(shí)別和優(yōu)先處理需要修復(fù)的關(guān)鍵安全問題的模型。

“我們的目標(biāo)是建立一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)，以盡可能接近于安全專家的準(zhǔn)確度將Bug分類為安全/非安全和關(guān)鍵/非關(guān)鍵，”Christiansen解釋道。微軟向其機(jī)器學(xué)習(xí)模型提供了被標(biāo)記為安全和非安全的bug來訓(xùn)練它，并確保數(shù)據(jù)不會(huì)太過嘈雜。然后，該模型學(xué)習(xí)如何對安全漏洞進(jìn)行分類，并對每個(gè)漏洞貼上嚴(yán)重程度標(biāo)簽，如關(guān)鍵、重要或低影響等。

安全專家和數(shù)據(jù)科學(xué)家們在微軟公司合作創(chuàng)建了這個(gè)模型，確保在生產(chǎn)中可以對其進(jìn)行監(jiān)視，并對Bug的隨機(jī)抽樣進(jìn)行人工審查。該模型還不斷地用微軟的安全專家審查的新數(shù)據(jù)對其進(jìn)行重新訓(xùn)練。這種機(jī)器學(xué)習(xí)模型意味著微軟現(xiàn)在能以99%的準(zhǔn)確率識(shí)別出安全漏洞，并以97%的準(zhǔn)確率正確標(biāo)注漏洞。

了解到，對于微軟這樣規(guī)模的公司來說，透露其開發(fā)人員每月產(chǎn)生多少Bug是不尋常的，更不用說如何處理這些Bug了。微軟現(xiàn)在正計(jì)劃將其方法開源到GitHub上，讓其他擁有類似數(shù)據(jù)集的公司也能打造類似的模型。