當前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]聰明的人確實是可以做很多事的。近日,一位身兼數(shù)職的斜杠青年 Cyril Diagne 設(shè)計了一個復(fù)制粘貼的工具,只要你擁有一個支持 AR 功能的智能手機,在手機上預(yù)裝這款名為 AR Cut & Pa

聰明的人確實是可以做很多事的。

近日,一位身兼數(shù)職的斜杠青年 Cyril Diagne 設(shè)計了一個復(fù)制粘貼的工具,只要你擁有一個支持 AR 功能的智能手機,在手機上預(yù)裝這款名為 AR Cut & Paste 的工具,然后拍下你想復(fù)制的東西,便可將圖像復(fù)制粘貼進 Photoshop。

圖自:網(wǎng)絡(luò)

這里是視頻:

圖自:視頻截圖

正如上面幾張圖片所示,這款工具什么都可以一鍵復(fù)制,設(shè)計師們再也不用擔(dān)心素材不夠用了!不過,目前該工具的剪切延遲大約為 2.5 秒,粘貼延遲大約為 4 秒,流程還可以進一步加速。

令人期待的是,作者還給大家留了一個小驚喜:下周將會發(fā)布另一個 AI+UX 原型!

平面設(shè)計師的福音

也許是設(shè)計師出身的緣故, Cyril Diagne 總是有很多出人意料的想法。

比如,他曾經(jīng)研究出一種人臉涂鴉工具,借助 Tensorflow.js、FaceMesh 和 Three.js 即可在網(wǎng)頁瀏覽器上使用 AR 對臉部進行涂鴉。

圖自:github

還有一款可在 Instagram 個人主頁圖像上添加 3D 效果的 chrome 擴展程序,效果生成類似于 Facebook 3D 照片功能,讓 2D 照片也能呈現(xiàn)多角度的景象。

圖自:github

那么,這款工具又是如何實現(xiàn)將現(xiàn)實照片直接復(fù)制進 Photoshop 的呢?

據(jù)作者上傳到 github 的資料顯示,AR Cut & Paste 工具是一個 AR+ML 原型(prototype),它可以從周圍環(huán)境中拷貝固定對象,并粘貼在圖像編輯軟件中(Photoshop)。不過,這款工具目前只適用于 Photoshop 軟件,未來可能支持處理不同的輸出。

該原型作為 3 個獨立模塊運行:即移動應(yīng)用、本地服務(wù)器和顯著性檢測和背景去除服務(wù)。

具體使用方法如下:

首先,你需要在手機上預(yù)裝這款工具;

npm install

其次,你需要更新一下 IP 地址,并指向你的本地配置;

3: const URL = "http://192.168.1.29:8080";

最后,顯著目標檢測和背景移除由外部服務(wù)執(zhí)行(即 BASNet 技術(shù))。

curl https://download.pytorch.org/models/resnet34-333f7ec4.pth -o resnet34-333f7ec4.pt

docker build -t basnet .

docker run --rm -p 8080:8080 basnet

BASNet 是什么?

BASNet 是一種關(guān)于邊界的顯著性檢測,其聚合了多層深度特征的網(wǎng)絡(luò),它更關(guān)注整個圖像的全局對比度上,而不是局部或像素特征,所以,相比其他的顯著性檢測方法,能夠大大減少誤差。

在架構(gòu)上,主要分為兩個模塊:

圖自:BASNet : Boundary-Aware Salient Object Detection 論文

預(yù)測模塊:設(shè)計成編解碼網(wǎng)絡(luò),因為這種結(jié)構(gòu)能同時捕獲高層次的全局上下文和低層次的細節(jié)。編碼器有一個輸入卷積層和由基本res塊組織稱的六部分。為了更進一步捕捉全局信息,在編碼器和解碼器之間加了一個橋接塊,包含三個卷積層。解碼器與編碼器基本對稱,每個階段的輸入是解碼器的前一階段的上采樣和編碼器相應(yīng)階段輸出的級聯(lián)。取最后一層精度最高的圖作為預(yù)測模塊的輸出。

優(yōu)化模塊:通過殘差塊優(yōu)化粗糙的顯著圖。粗糙包括:1)模糊有噪聲的邊界;2)不均勻預(yù)測的區(qū)域概率。實際的粗糙預(yù)測圖兩種都包含。殘差優(yōu)化模塊最初被提出用來用于邊界優(yōu)化,然而,由于設(shè)計的模塊很淺,難以捕獲高級信息進行優(yōu)化。RRM采用殘差編解碼器架構(gòu),包含輸入層,編碼器,橋接層,解碼器和輸出層,編碼器和解碼器包含4個階段,每個階段只有一個卷積層。

總的損失等于每個輸出圖的損失的加權(quán)和。共有 8 個輸出,7 個來自預(yù)測模塊,1 個來自優(yōu)化模塊。

每層的損失包括三個部分:BCE loss、SSIM loss 和 IoU loss。

這樣一來,就能獲得高置信度顯著圖和清晰邊界。

然后,利用 OpenCV SIFT 找出手機在電腦屏幕上對準的位置。只需要一張手機照片和截圖,就可以得到準確的 x, y 屏幕坐標系。

這就是這款軟件的全部使用細節(jié)及技術(shù)細節(jié),感興趣的童鞋可以自己輸入代碼嘗試下。

需要注意的是,該設(shè)計的作者也表示,目前這只是一個研究原型,但根據(jù) Diagne 視頻的回復(fù),似乎已經(jīng)有數(shù)家公司在開發(fā)類似的軟件。相信在不久的將來你可能會在應(yīng)用商店看到類似的工具。

而這項設(shè)計的深遠意義則在于它巧妙地顛倒了通常的增強現(xiàn)實范式,不是將數(shù)字圖像投射到物理世界,而是將物理世界帶入數(shù)字世界。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉