亞馬遜推出圖像分析服務(wù)Rekognition
Invent大會(huì)上,亞馬遜推出了Rekognition,它是一種使用深度學(xué)習(xí)進(jìn)行圖像識別和分析的托管服務(wù)。Rekognition提供的功能包括物體和場景檢測、面部分析、面部比較和面部識別。
在過去5年里,圖像增長的速度一直在上升, 預(yù)計(jì)2017年拍攝的照片將達(dá)到1.2萬億張 ,而2000年拍攝的照片 大概 只有800億張。2016年的Mary Meeker互聯(lián)網(wǎng)趨勢 報(bào)告 估計(jì),光是在Snapchat,每天就有10億張照片。
隨著越來越多的內(nèi)容變成數(shù)字圖像,企業(yè)組織該如何索引和解釋這些數(shù)據(jù)呢?亞馬遜Rekognition的總經(jīng)理Ranju Das將該服務(wù) 定位 為“發(fā)現(xiàn)數(shù)據(jù)的意義”的一種方式。雖然有許多服務(wù)可以提供對數(shù)據(jù)的洞察,但是“亞馬遜通過Reckognition努力解決視覺內(nèi)容方面的問題。"
雖然亞馬遜的Rekognition是一個(gè)新的公共服務(wù),但是它一直以來都有著良好的表現(xiàn)。AWS首席布道師Jeff Barr 解釋 道:
經(jīng)過我們的計(jì)算機(jī)視覺團(tuán)隊(duì)多年的構(gòu)建,使用深度學(xué)習(xí),這個(gè)完全托管的服務(wù)已經(jīng)能每天分析數(shù)十億的圖像。它已經(jīng)訓(xùn)練了數(shù)千個(gè)物體和場景。Rekognition從一開始就是為大規(guī)模運(yùn)行而設(shè)計(jì)的。
對該服務(wù)有興趣的企業(yè)組織可以嘗試 控制臺 以快速獲得演示體驗(yàn),然后再使用Rekognition的API編寫代碼。
物體和場景檢測
物體和場景檢測可用于識別圖像內(nèi)的物體。以含有許多物品的起居室為例,使用物體和場景檢測,亞馬遜的Rekognition能夠識別常見的物品,如花朵、咖啡桌和椅子等。
亞馬遜已經(jīng)確定了物體和場景檢測的以下使用場景:
照片共享應(yīng)用可以強(qiáng)化智能搜索,并快速找回珍貴的記憶,如婚禮、徒步旅行或日落。
度假租賃市場平臺可以自動(dòng)地給主機(jī)上傳的圖像打上標(biāo)簽,如壁爐、廚房或游泳池。
旅游網(wǎng)站和論壇可以將用戶生成的圖像按照標(biāo)簽分類,如海灘、露營或山脈。
亞馬遜已在其Amazon Prime Photo服務(wù)中使用Rekognition,它提供免費(fèi)的照片存儲(chǔ)。亞馬遜 表示 ,該服務(wù)已經(jīng)包含了用戶上傳的“數(shù)十億張照片”。因此,亞馬遜可以提供有關(guān)已上傳照片內(nèi)容的元數(shù)據(jù)。
面部分析
使用面部分析,開發(fā)人員可以獲得照片的如下特征:
人口統(tǒng)計(jì)數(shù)據(jù)
表達(dá)的情緒
面部標(biāo)志
圖片質(zhì)量
一般屬性,比如某人是否張開了嘴巴
亞馬遜已經(jīng)確定面部分析的一些使用場景包括:
照片打印服務(wù)能給用戶推薦最好的照片。
在線約會(huì)應(yīng)用可以使用面部屬性來改善他們的匹配建議。
廣告服務(wù)可以向客戶顯示動(dòng)態(tài)和個(gè)性化的內(nèi)容。
亞馬遜確定的另一個(gè)使用場景是零售客戶服務(wù)領(lǐng)域。考慮一下這種情況,購物者在商場內(nèi)尋找貨物。使用面部分析,商場可以確定客戶的情緒并在顧客沮喪然后決定離開之前與他(她)們展開主動(dòng)交流。
面部比較
亞馬遜將面部比較API 描述 為一種實(shí)現(xiàn)如下功能的方式:
測量兩個(gè)圖像中的人臉屬于同一個(gè)人的可能性。使用Rekognition,我們可以依據(jù)相似度評分來實(shí)現(xiàn)近乎實(shí)時(shí)的基于照片的用戶驗(yàn)證。
面部比較API依賴于相似度屬性,它在應(yīng)用程序中可用于驅(qū)動(dòng)不同的行為。例如,考慮為了安保目的使用面部比較的應(yīng)用程序。我們需要將進(jìn)入一棟建筑物的相似度閾值設(shè)置得遠(yuǎn)高于進(jìn)入房間時(shí)調(diào)整燈光亮度的相似度閾值。
面部比較的其它使用場景包括:
尋找感興趣或關(guān)注的人的監(jiān)視場景。
物聯(lián)網(wǎng)和設(shè)備制造商能將基于人臉的驗(yàn)證直接植入它們的應(yīng)用。
酒店業(yè)務(wù)提供方在識別出貴賓之后為他們提供額外的客戶服務(wù)。
面部識別
我們可以為圖像構(gòu)建索引,然后可用于比較。亞馬遜搜索時(shí)使用的是圖像的元數(shù)據(jù)。
亞馬遜Rekognition在美國東部(弗吉尼亞北部)、美國西部(俄勒岡)和歐盟(愛爾蘭)地區(qū)可用。有一個(gè)免費(fèi)區(qū)間可供開發(fā)人員使用,開發(fā)人員每月可分析最多5000張圖片,每月可保存1000張臉部向量數(shù)據(jù),保存一整年。超出的部分按照實(shí)際消費(fèi)量進(jìn)行計(jì)費(fèi)。