微軟:其47000位程序員每月制造近30000個(gè)bug
4月24日消息 微軟詳細(xì)介紹了他們?nèi)绾卫脵C(jī)器學(xué)習(xí)模型處理其軟件和服務(wù)中的BUG,“47000名開發(fā)人員每月產(chǎn)生近3萬個(gè)Bug,”微軟高級(jí)安全項(xiàng)目經(jīng)理Scott Christiansen解釋道。這家軟件制造商在GitHub和AzureDevOps倉庫中跟蹤這些Bug,但僅靠傳統(tǒng)的標(biāo)簽和優(yōu)先級(jí)排序很難跟蹤這些bug。
▲圖自微軟官網(wǎng)
微軟現(xiàn)在正在使用近20年的歷史數(shù)據(jù)、跨越1300萬個(gè)工作項(xiàng)目和Bug,創(chuàng)建了一個(gè)機(jī)器學(xué)習(xí)模型,可以以99%的準(zhǔn)確率將安全和非安全Bug區(qū)分開來。這是一個(gè)旨在幫助開發(fā)人員準(zhǔn)確識(shí)別和優(yōu)先處理需要修復(fù)的關(guān)鍵安全問題的模型。
“我們的目標(biāo)是建立一個(gè)機(jī)器學(xué)習(xí)系統(tǒng),以盡可能接近于安全專家的準(zhǔn)確度將Bug分類為安全/非安全和關(guān)鍵/非關(guān)鍵,”Christiansen解釋道。微軟向其機(jī)器學(xué)習(xí)模型提供了被標(biāo)記為安全和非安全的bug來訓(xùn)練它,并確保數(shù)據(jù)不會(huì)太過嘈雜。然后,該模型學(xué)習(xí)如何對安全漏洞進(jìn)行分類,并對每個(gè)漏洞貼上嚴(yán)重程度標(biāo)簽,如關(guān)鍵、重要或低影響等。
安全專家和數(shù)據(jù)科學(xué)家們在微軟公司合作創(chuàng)建了這個(gè)模型,確保在生產(chǎn)中可以對其進(jìn)行監(jiān)視,并對Bug的隨機(jī)抽樣進(jìn)行人工審查。該模型還不斷地用微軟的安全專家審查的新數(shù)據(jù)對其進(jìn)行重新訓(xùn)練。這種機(jī)器學(xué)習(xí)模型意味著微軟現(xiàn)在能以99%的準(zhǔn)確率識(shí)別出安全漏洞,并以97%的準(zhǔn)確率正確標(biāo)注漏洞。
了解到,對于微軟這樣規(guī)模的公司來說,透露其開發(fā)人員每月產(chǎn)生多少Bug是不尋常的,更不用說如何處理這些Bug了。微軟現(xiàn)在正計(jì)劃將其方法開源到GitHub上,讓其他擁有類似數(shù)據(jù)集的公司也能打造類似的模型。