亞馬遜推出圖像分析服務(wù)Rekognition

時(shí)間：2017-01-16 12:20:13

關(guān)鍵字：亞馬遜新鮮事圖像分析 rekognition

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]Invent大會(huì)上，亞馬遜推出了Rekognition，它是一種使用深度學(xué)習(xí)進(jìn)行圖像識(shí)別和分析的托管服務(wù)。Rekognition提供的功能包括物體和場(chǎng)景檢測(cè)、面部分析、面部比較和面部識(shí)別。

Invent大會(huì)上，亞馬遜推出了Rekognition，它是一種使用深度學(xué)習(xí)進(jìn)行圖像識(shí)別和分析的托管服務(wù)。Rekognition提供的功能包括物體和場(chǎng)景檢測(cè)、面部分析、面部比較和面部識(shí)別。

在過去5年里，圖像增長的速度一直在上升，預(yù)計(jì)2017年拍攝的照片將達(dá)到1.2萬億張，而2000年拍攝的照片大概只有800億張。2016年的Mary Meeker互聯(lián)網(wǎng)趨勢(shì) 報(bào)告估計(jì)，光是在Snapchat，每天就有10億張照片。

隨著越來越多的內(nèi)容變成數(shù)字圖像，企業(yè)組織該如何索引和解釋這些數(shù)據(jù)呢?亞馬遜Rekognition的總經(jīng)理Ranju Das將該服務(wù) 定位為“發(fā)現(xiàn)數(shù)據(jù)的意義”的一種方式。雖然有許多服務(wù)可以提供對(duì)數(shù)據(jù)的洞察，但是“亞馬遜通過Reckognition努力解決視覺內(nèi)容方面的問題。"

雖然亞馬遜的Rekognition是一個(gè)新的公共服務(wù)，但是它一直以來都有著良好的表現(xiàn)。AWS首席布道師Jeff Barr 解釋道：

經(jīng)過我們的計(jì)算機(jī)視覺團(tuán)隊(duì)多年的構(gòu)建，使用深度學(xué)習(xí)，這個(gè)完全托管的服務(wù)已經(jīng)能每天分析數(shù)十億的圖像。它已經(jīng)訓(xùn)練了數(shù)千個(gè)物體和場(chǎng)景。Rekognition從一開始就是為大規(guī)模運(yùn)行而設(shè)計(jì)的。

對(duì)該服務(wù)有興趣的企業(yè)組織可以嘗試控制臺(tái) 以快速獲得演示體驗(yàn)，然后再使用Rekognition的API編寫代碼。

物體和場(chǎng)景檢測(cè)

物體和場(chǎng)景檢測(cè)可用于識(shí)別圖像內(nèi)的物體。以含有許多物品的起居室為例，使用物體和場(chǎng)景檢測(cè)，亞馬遜的Rekognition能夠識(shí)別常見的物品，如花朵、咖啡桌和椅子等。

亞馬遜已經(jīng)確定了物體和場(chǎng)景檢測(cè)的以下使用場(chǎng)景：

照片共享應(yīng)用可以強(qiáng)化智能搜索，并快速找回珍貴的記憶，如婚禮、徒步旅行或日落。

度假租賃市場(chǎng)平臺(tái)可以自動(dòng)地給主機(jī)上傳的圖像打上標(biāo)簽，如壁爐、廚房或游泳池。

旅游網(wǎng)站和論壇可以將用戶生成的圖像按照標(biāo)簽分類，如海灘、露營或山脈。

亞馬遜已在其Amazon Prime Photo服務(wù)中使用Rekognition，它提供免費(fèi)的照片存儲(chǔ)。亞馬遜表示，該服務(wù)已經(jīng)包含了用戶上傳的“數(shù)十億張照片”。因此，亞馬遜可以提供有關(guān)已上傳照片內(nèi)容的元數(shù)據(jù)。

面部分析

使用面部分析，開發(fā)人員可以獲得照片的如下特征：

人口統(tǒng)計(jì)數(shù)據(jù)

表達(dá)的情緒

面部標(biāo)志

圖片質(zhì)量

一般屬性，比如某人是否張開了嘴巴

亞馬遜已經(jīng)確定面部分析的一些使用場(chǎng)景包括：

照片打印服務(wù)能給用戶推薦最好的照片。

在線約會(huì)應(yīng)用可以使用面部屬性來改善他們的匹配建議。

廣告服務(wù)可以向客戶顯示動(dòng)態(tài)和個(gè)性化的內(nèi)容。

亞馬遜確定的另一個(gè)使用場(chǎng)景是零售客戶服務(wù)領(lǐng)域?？紤]一下這種情況，購物者在商場(chǎng)內(nèi)尋找貨物。使用面部分析，商場(chǎng)可以確定客戶的情緒并在顧客沮喪然后決定離開之前與他(她)們展開主動(dòng)交流。

面部比較

亞馬遜將面部比較API 描述為一種實(shí)現(xiàn)如下功能的方式：

測(cè)量兩個(gè)圖像中的人臉屬于同一個(gè)人的可能性。使用Rekognition，我們可以依據(jù)相似度評(píng)分來實(shí)現(xiàn)近乎實(shí)時(shí)的基于照片的用戶驗(yàn)證。

面部比較API依賴于相似度屬性，它在應(yīng)用程序中可用于驅(qū)動(dòng)不同的行為。例如，考慮為了安保目的使用面部比較的應(yīng)用程序。我們需要將進(jìn)入一棟建筑物的相似度閾值設(shè)置得遠(yuǎn)高于進(jìn)入房間時(shí)調(diào)整燈光亮度的相似度閾值。

面部比較的其它使用場(chǎng)景包括：

尋找感興趣或關(guān)注的人的監(jiān)視場(chǎng)景。

物聯(lián)網(wǎng)和設(shè)備制造商能將基于人臉的驗(yàn)證直接植入它們的應(yīng)用。

酒店業(yè)務(wù)提供方在識(shí)別出貴賓之后為他們提供額外的客戶服務(wù)。

面部識(shí)別

我們可以為圖像構(gòu)建索引，然后可用于比較。亞馬遜搜索時(shí)使用的是圖像的元數(shù)據(jù)。

亞馬遜Rekognition在美國東部(弗吉尼亞北部)、美國西部(俄勒岡)和歐盟(愛爾蘭)地區(qū)可用。有一個(gè)免費(fèi)區(qū)間可供開發(fā)人員使用，開發(fā)人員每月可分析最多5000張圖片，每月可保存1000張臉部向量數(shù)據(jù)，保存一整年。超出的部分按照實(shí)際消費(fèi)量進(jìn)行計(jì)費(fèi)。