當(dāng)前位置:首頁 > 芯聞號(hào) > 充電吧
[導(dǎo)讀]五花八門的APP讓人像修圖越來越簡(jiǎn)單,磨皮、美白、亮膚都可以一鍵處理。 不過,如果把原片拍成這樣,各類APP可能就無能無力了。 圖片中人臉被大面積的陰影覆蓋,如果不想放棄原圖,只能用Photosho

五花八門的APP讓人像修圖越來越簡(jiǎn)單,磨皮、美白、亮膚都可以一鍵處理。

不過,如果把原片拍成這樣,各類APP可能就無能無力了。

圖片中人臉被大面積的陰影覆蓋,如果不想放棄原圖,只能用Photoshop等專業(yè)的修圖軟件處理。

不過,對(duì)于小白來說,Ps等軟件有一定技術(shù)難度,而且操作步驟復(fù)雜,那么有沒有一種簡(jiǎn)單,對(duì)小白友好的處理方法呢?

近日,來自伯克利,麻省理工學(xué)院和Google Research的研究人員聲稱,他們研發(fā)出一款最新AI算法,無需Ps,在幾秒內(nèi)中就可以精準(zhǔn)去除圖像中的“不需要”的陰影部分,而且對(duì)于面部圖像的處理尤為適用。

AI修圖神器

如果打開手機(jī)相冊(cè),你會(huì)發(fā)現(xiàn)戶外自拍照或多或少都會(huì)存在陰影問題,這是光線位置、自拍角度和周圍環(huán)境等因素造成的,比如在強(qiáng)光照下,周圍樹木、建筑,或者頭戴的帽子都可能在面部形成陰影。

不過,并不是所陰影都需要全部去除,比如頭發(fā)、五官的陰影會(huì)讓照片看起來更加自然美觀。

由伯克利,麻省理工學(xué)院和Google Research組成的研究團(tuán)隊(duì)稱,他們開發(fā)的基于神經(jīng)網(wǎng)絡(luò)的AI模型不僅可以去除面部陰影,還可以準(zhǔn)確識(shí)別哪些是需要處理的陰影,并自動(dòng)完成補(bǔ)光。

我們先來看一組實(shí)驗(yàn)對(duì)比圖。

可以看到,該AI算法的修復(fù)效果還是非常顯著的。原圖中,人臉的三分之二全部被陰影覆蓋,修復(fù)后,陰影被大面積去除,而且基本保持了人像的原貌,看不出任何圖片修復(fù)過的痕跡。

另外,我們看到臉頰側(cè)面,眉骨下面的陰影被適度保留了。下面這幅實(shí)驗(yàn)效果圖更為顯著,陰影被適度去除,并且增加了一定的光感。

研究人員稱,他們實(shí)驗(yàn)發(fā)現(xiàn),這項(xiàng)識(shí)別并去除陰影的AI算法在人像處理方面表現(xiàn)最佳,未來幾年,這項(xiàng)技術(shù)可能會(huì)被廣泛應(yīng)用到智能手機(jī)中,幫助用戶輕松處理復(fù)雜的修圖問題。

那么這項(xiàng)技術(shù)是如何做到呢?

研究人員稱,其方法主要依賴于一對(duì)神經(jīng)網(wǎng)絡(luò),一個(gè)是去除外部物體投射的外界陰影(Foreign Shadows),另一個(gè)是柔化由對(duì)象特征投射的面部陰影(Facial Shadows),并添加合成補(bǔ)光來提高照明率。在此框架的基礎(chǔ)上,通過以下具體技術(shù)實(shí)現(xiàn)達(dá)成了圖像修復(fù)效果:

大規(guī)模訓(xùn)練數(shù)據(jù)集:用于訓(xùn)練和評(píng)估針對(duì)異物陰影,面部陰影和虛擬補(bǔ)光的機(jī)器學(xué)習(xí)模型。

對(duì)稱面部圖像生成:用于顯式編碼對(duì)稱提示,以訓(xùn)練面部陰影模型。

研究人員強(qiáng)調(diào),他們的數(shù)據(jù)和模型獲得的肖像增強(qiáng)效果,在數(shù)字指標(biāo)和感知質(zhì)量方面均優(yōu)于所有基線方法。

接下來,我們來詳細(xì)介紹具體的技術(shù)原理和實(shí)驗(yàn)結(jié)果。

外界陰影&面部陰影

需要說明的是,圖像中陰影的檢測(cè)和去除一直是計(jì)算機(jī)視覺研究的中心問題,傳統(tǒng)的解決方案需要手動(dòng)標(biāo)記圖像中的“陰影”或“亮”的區(qū)域,然后通過全局優(yōu)化技術(shù)(例如圖形切割)來解決陰影問題。顯然這種手動(dòng)方式在很大程度上限制了技術(shù)的適用性。

而本次研究的AI算法利用機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)了全自動(dòng)化的陰影檢測(cè)和處理。如上文所說,這套算法解決方案分為兩個(gè)部分:一是外界陰影處理,而是面部陰影處理。

外界陰影。研究人員介紹,為了訓(xùn)練外界陰影的機(jī)器學(xué)習(xí)模型,他們構(gòu)建了一個(gè)真實(shí)人像的數(shù)據(jù)集,該數(shù)據(jù)集大約有5000張圖像,用于合成外界陰影的圖像。具體的運(yùn)行過程如下圖:

圖中的輸入蒙版Min是從目標(biāo)輪廓生成的, Min經(jīng)過人皮膚的次表面散射(SS)近似生成Mss,然后根據(jù)空間變化和像素強(qiáng)度的變化生成M,最后由陰影蒙版M,結(jié)合原始圖形It和陰影圖像Is混合生成外界陰影圖像。

面部陰影:在這里,研究人員使用Light Stage掃描的數(shù)據(jù)集來構(gòu)建由小光源照明的輸入/輸出對(duì),以及每張臉部可變和可補(bǔ)光的輸出圖像。

如圖,每個(gè)OLAT渲染的圖像與下方的光源構(gòu)成圖相對(duì)應(yīng),隨著Key Light轉(zhuǎn)件分配給可變數(shù)量的鄰居,渲染的圖像的光照強(qiáng)度逐漸減弱。

另外,在這里研究人員提出一種顯式編碼面部對(duì)稱性的方法。研究人員稱,人臉的對(duì)稱性是推理光照的有用線索:人臉的反射率和幾何形狀很可能是對(duì)稱的,但是投射在人臉上的陰影很可能是不對(duì)稱的,利用這一點(diǎn),將地標(biāo)(Landmarks)檢測(cè)系統(tǒng)應(yīng)用于輸入圖像,并使用恢復(fù)的地標(biāo)圖像生成輸入圖像的的鏡像版本。該鏡像圖像會(huì)附加到網(wǎng)絡(luò)中的輸入圖像中,從而允許網(wǎng)絡(luò)直接推斷出可能由于面部和外部陰影而引起的不對(duì)稱圖像內(nèi)容,進(jìn)而提高性能。

對(duì)比實(shí)驗(yàn):論文中,研究人員將以上兩種方法與當(dāng)前通用的修復(fù)模型進(jìn)行了比較。從比較中可以看到該模型的優(yōu)勢(shì)顯著。

在外界陰影處理方面,現(xiàn)有研究有圖像分割技術(shù)(Guo)、基于自注意機(jī)制的神經(jīng)網(wǎng)絡(luò)模型(Cun),以及基于學(xué)習(xí)的最新方法(Hu)。

研究人員選用SRD基準(zhǔn)數(shù)據(jù)集進(jìn)行評(píng)估,并計(jì)算了PSNR,SSIM,以及基本事實(shí)與輸出之間的學(xué)習(xí)感知度量LPIPS。結(jié)果該模型大大優(yōu)于這些基準(zhǔn)。如下圖:

另外,從測(cè)試的圖像上來看。 Guo等方法錯(cuò)誤地將深色圖像區(qū)域識(shí)別為陰影并將其刪除,同時(shí)也未能識(shí)別出真實(shí)陰影部分。Cun和Hu的深度學(xué)習(xí)方法,在正確識(shí)別陰影區(qū)域方面做得很好,但可能無法完全去除陰影,而且更改了圖像原來的整體亮度和色調(diào)。

對(duì)比之下,本次研究的模型能夠完全去除外來陰影,同時(shí)仍保留被攝體的整體外觀。

在面部陰影處理方面,研究人員與Sun等人的PR網(wǎng)絡(luò)進(jìn)行比較。結(jié)果如下圖,PR-net在包含粗糙臉部陰影的圖像上表現(xiàn)不佳,并且在訓(xùn)練過程中刪除串聯(lián)的“鏡像”輸入會(huì)降低所有這三個(gè)指標(biāo)的準(zhǔn)確性。

最后要說明的是面部陰影的柔和和補(bǔ)光效果。輸入的圖像很可能包含粗糙的面部陰影,例如臉頰、眼睛周圍(如下圖)。從下圖可以看出,將面部陰影柔化模型與可變的“光度” M結(jié)合應(yīng)用會(huì)產(chǎn)生更柔和的圖像陰影,如bc列。

研究人員介紹稱,鏡面反射也被抑制是一種理想的攝影實(shí)踐,因?yàn)殓R面高光通常會(huì)分散和遮蓋對(duì)象的表面。此外,該模型的亮度比分量通過在此處與檢測(cè)到的琴鍵相反的方向形成的強(qiáng)度為訓(xùn)練中使用的最大值的合成補(bǔ)光度,從而降低了由面部陰影(d)引起的對(duì)比度。

不過,目前算法還是存在一定的局限性,比如模型有時(shí)無法去除雙邊對(duì)稱的陰影。因?yàn)殛幱霸鰪?qiáng)模型的訓(xùn)練數(shù)據(jù)是通過增加光的大小來渲染的,所以簡(jiǎn)單的亮度設(shè)置會(huì)偏向于生成看起來模糊的圖像。

更多論文詳細(xì)內(nèi)容請(qǐng)參考:https://arxiv.org/pdf/2005.08925.pdf

引用鏈接:

https://fstoppers.com/post-production/artificial-intelligence-getting-insanely-good-removing-shadows-photographs-faces-509108

https://www.diyphotography.net/harsh-sunlight-no-problem-this-ai-removes-all-those-unwanted-shadows/

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉