目前為止, Galaxy Z Fold 產(chǎn)品線上試驗(yàn)了屏下攝像頭,但沒(méi)有更廣泛的搭載
人臉識(shí)別,是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉,進(jìn)而對(duì)檢測(cè)到的人臉進(jìn)行臉部識(shí)別的一系列相關(guān)技術(shù),通常也叫做人像識(shí)別、面部識(shí)別。
人臉識(shí)別系統(tǒng)以人臉識(shí)別技術(shù)為核心,是一項(xiàng)新興的生物識(shí)別技術(shù),是當(dāng)今國(guó)際科技領(lǐng)域攻關(guān)的高精尖技術(shù)。它廣泛采用區(qū)域特征分析算法,融合了計(jì)算機(jī)圖像處理技術(shù)與生物統(tǒng)計(jì)學(xué)原理于一體,利用計(jì)算機(jī)圖像處理技術(shù)從視頻中提取人像特征點(diǎn),利用生物統(tǒng)計(jì)學(xué)的原理進(jìn)行分析建立數(shù)學(xué)模型,具有廣闊的發(fā)展前景。2006年,美國(guó)已經(jīng)要求和它有出入免簽證協(xié)議的國(guó)家在10月26日之前必須使用結(jié)合了人臉識(shí)別的電子護(hù)照系統(tǒng),到 2006年底已經(jīng)有50多個(gè)國(guó)家實(shí)現(xiàn)了這樣的系統(tǒng)。2012年4月,鐵路部門宣布車站安檢區(qū)域?qū)惭b用于身份識(shí)別的高科技安檢系統(tǒng)人臉識(shí)別系統(tǒng);可以對(duì)人臉明暗偵測(cè),自動(dòng)調(diào)整動(dòng)態(tài)曝光補(bǔ)償, 人臉追蹤偵測(cè),自動(dòng)調(diào)整影像放大。
三星可能正在開(kāi)發(fā)一個(gè)屏下人臉識(shí)別系統(tǒng),其中包括兩個(gè)屏下攝像頭。
三星早在 2021 年 3 月就向 KIPRIS(韓國(guó)知識(shí)產(chǎn)權(quán)信息服務(wù))提交了專利申請(qǐng),該文件已于上周公開(kāi),并被一家荷蘭出版物收錄。
專利介紹稱,該方法從兩個(gè)角度獲取用戶的多張圖像,以更好地構(gòu)建面部的 3D 模型并將其用于身份驗(yàn)證。不過(guò),三星特別提到了使用屏下攝像頭。
了解到,到目前為止,三星只是在其 Galaxy Z Fold 產(chǎn)品線上試驗(yàn)了屏下攝像頭,而沒(méi)有更廣泛的搭載。
從專利來(lái)看,可能需要在手機(jī)底部附近放置一個(gè)攝像頭,靠近屏下指紋所在的位置,甚至可能將兩者組合成一個(gè)光學(xué)模塊。
此外,專利中提到了測(cè)量瞳孔大小,人類的瞳孔大小會(huì)根據(jù)照明條件而變化,預(yù)計(jì)可以用作額外的安全措施,以防止使用照片或面具等東西來(lái)欺騙人臉識(shí)別。
現(xiàn)在AI發(fā)展的如火如荼,我們已逐步進(jìn)入智能時(shí)代。雖然人工智能偏技術(shù)類,學(xué)習(xí)和理解需要一定的技術(shù)背景和數(shù)學(xué)做支撐。但拆開(kāi)看,其原理、方法、思路并不復(fù)雜,「不懂技術(shù)」的產(chǎn)品經(jīng)理也能理解。
人工智能牽扯很多學(xué)科,知識(shí)點(diǎn)盤根錯(cuò)節(jié),需要具備多學(xué)科的知識(shí)儲(chǔ)備。從學(xué)習(xí)路徑上看,比較適合做成系列,從淺入深,從基礎(chǔ)到應(yīng)用,逐漸深入。但無(wú)形中提高了學(xué)習(xí)門檻,降低了學(xué)習(xí)的興趣,導(dǎo)致很難堅(jiān)持。
有感于此,我想以一種輕松、探索的視角,跟大家一起摸索,用簡(jiǎn)單、直白的方式來(lái)學(xué)習(xí)AI。這樣,雖然會(huì)有錯(cuò)誤、遺漏等,但學(xué)習(xí)難度會(huì)降低,那就在過(guò)程中完善吧,畢竟「模糊的正確大于精確的錯(cuò)誤」。
一、人臉識(shí)別產(chǎn)品
我們從人臉識(shí)別開(kāi)始,逐步了解其技術(shù)路徑的演變和原理等,今天先從最簡(jiǎn)單的原理講起。
人臉識(shí)別其實(shí)很早就有了,多年前就以人臉考勤的方式出現(xiàn),但由于使用效果不好,用戶體驗(yàn)不佳,逐步被市場(chǎng)淘汰。
而這一波人工智能的火熱,計(jì)算能力、模型等都是其重要推動(dòng)力,但更重要的是產(chǎn)品能夠落地,能夠在實(shí)際業(yè)務(wù)場(chǎng)景中使用。
尤其是人臉識(shí)別,產(chǎn)品在識(shí)別精度、速度、用戶友好度等多個(gè)方面都有明顯提升,用戶和市場(chǎng)的接受度明顯上升。
二、圖像表示
了解人臉識(shí)別,先要從圖像表示講起。
大家都知道,計(jì)算機(jī)能夠識(shí)別和處理的是二進(jìn)制,不管我們輸入的是文本、圖像、聲音,計(jì)算機(jī)都是用一定長(zhǎng)度的二進(jìn)制串進(jìn)行存儲(chǔ)和處理。
我們先以黑白圖片為例,看看計(jì)算機(jī)是怎么表示的。
計(jì)算機(jī)程序可以將黑白圖片可以表示為灰度圖像。在灰度圖像中,一個(gè)像素使用8個(gè)比特位,從而可以表示256個(gè)灰度階,表示范圍是0-255。其中0代表純黑色,255代表純白色。
一個(gè)字節(jié)可以表示一個(gè)像素,那怎么表示一張圖片呢,用矩陣進(jìn)行表示。
簡(jiǎn)單來(lái)說(shuō),就是表格,比如可以使用8行8列來(lái)表示一張8*8的灰度圖片。
這樣我們就解決了圖像的表示問(wèn)題,建立了圖像和矩陣的等價(jià)關(guān)系。圖片可以轉(zhuǎn)化為矩陣,通過(guò)矩陣也可以恢復(fù)原始圖片。
通過(guò)矩陣表示圖像后,圖像的各種處理就轉(zhuǎn)化為數(shù)學(xué)問(wèn)題,可以使用數(shù)學(xué)的理論和方法進(jìn)行解決,而這正是計(jì)算機(jī)所擅長(zhǎng)的。
我們輸入圖片,希望計(jì)算機(jī)能夠?qū)?nèi)容識(shí)別出來(lái),將結(jié)果輸出。
仍以數(shù)字為例,當(dāng)輸入圖片并用矩陣表示后,通過(guò)將灰度值轉(zhuǎn)化為灰度,可以輕松辨識(shí)其所表示的內(nèi)容。
但在計(jì)算機(jī)的世界里,只有0和1。想要通過(guò)辨識(shí)矩陣內(nèi)容并將結(jié)果輸出,就必須建立矩陣到結(jié)果的映射。這樣,輸入一張圖片,經(jīng)過(guò)處理和計(jì)算后,才能輸出一個(gè)數(shù)字。
人臉識(shí)別的主要算法以及原理
主流的人臉識(shí)別技術(shù)基本上可以歸結(jié)為三類,即:基于幾何特征的方法、基于模板的方法和基于模型的方法。
1. 基于幾何特征的方法是最早、最傳統(tǒng)的方法,通常需要和其他算法結(jié)合才能有比較好的效果;
2. 基于模板的方法可以分為基于相關(guān)匹配的方法、特征臉?lè)椒?、線性判別分析方法、奇異值分解方法、神經(jīng)網(wǎng)絡(luò)方法、動(dòng)態(tài)連接匹配方法等。
3. 基于模型的方法則有基于隱馬爾柯夫模型,主動(dòng)形狀模型和主動(dòng)外觀模型的方法等。
人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成,正因?yàn)檫@些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個(gè)人臉千差萬(wàn)別,因此對(duì)這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以做為人臉識(shí)別的重要特征。幾何特征最早是用于人臉側(cè)面輪廓的描述與識(shí)別,首先根據(jù)側(cè)面輪廓曲線確定若干顯著點(diǎn),并由這些顯著點(diǎn)導(dǎo)出一組用于識(shí)別的特征度量如距離、角度等。Jia 等由正面灰度圖中線附近的積分投影模擬側(cè)面輪廓圖是一種很有新意的方法。
采用幾何特征進(jìn)行正面人臉識(shí)別一般是通過(guò)提取人眼、口、鼻等重要特征點(diǎn)的位置和眼睛等重要器官的幾何形狀作為分類特征,但Roder對(duì)幾何特征提取的精確性進(jìn)行了實(shí)驗(yàn)性的研究,結(jié)果不容樂(lè)觀。
可變形模板法可以視為幾何特征方法的一種改進(jìn),其基本思想是 :設(shè)計(jì)一個(gè)參數(shù)可調(diào)的器官模型 (即可變形模板),定義一個(gè)能量函數(shù),通過(guò)調(diào)整模型參數(shù)使能量函數(shù)最小化,此時(shí)的模型參數(shù)即做為該器官的幾何特征。
這種方法思想很好,但是存在兩個(gè)問(wèn)題,一是能量函數(shù)中各種代價(jià)的加權(quán)系數(shù)只能由經(jīng)驗(yàn)確定,難以推廣,二是能量函數(shù)優(yōu)化過(guò)程十分耗時(shí),難以實(shí)際應(yīng)用。 基于參數(shù)的人臉表示可以實(shí)現(xiàn)對(duì)人臉顯著特征的一個(gè)高效描述,但它需要大量的前處理和精細(xì)的參數(shù)選擇。同時(shí),采用一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系,忽略了局部細(xì)微特征,造成部分信息的丟失,更適合于做粗分類,而且目前已有的特征點(diǎn)檢測(cè)技術(shù)在精確率上還遠(yuǎn)不能滿足要求,計(jì)算量也較大。