185-0822-7772
四川海輝千訊網(wǎng)絡科技有限公司
地址:成都雙流區(qū)東升街道藏衛(wèi)路南二段699號附6號1層
電話:185-0822-7772(王)  
189-8000-5257(佘)
郵箱:ibfs@qq.com
成都弱電公司訊:
您還記得電影里的這些情節(jié)嗎?《變形金剛2》中,年輕的男主角和他的小伙伴們過關(guān)卡時,雖然騙過了值班軍人,卻被軍方的人臉辨認技術(shù)發(fā)現(xiàn)。2018年翻拍版的《機械戰(zhàn)警》中,機械戰(zhàn)警第一次面對大眾公開亮相,就在人群中不停地掃描所有人臉,同時將獲取的人臉在通緝犯資料庫中作比對,瞬間就發(fā)現(xiàn)看熱鬧的人群中有一個逃逸多年的通緝犯,并將其制服。另外還有許多電影中,但凡是美國的機要部門,進門就要掃描各種生物特征,從早年電影中的指紋、虹膜,到現(xiàn)在的人臉。
人臉辨認到底是什么?
人臉辨認,是視覺模式辨認的一個細分問題,也大概是最難解決的一個問題。
其實我們?nèi)嗣繒r每刻都在進行視覺模式辨認,我們通過眼睛獲得視覺信息,這些信息經(jīng)過大腦的處理被辨認為有意義的概念。所以我們知道了放在我們面前的是水杯、書本,還是什么別的東西。
我們也無時無刻不在進行人臉辨認,我們天天生活中碰到無數(shù)的人,從中認出那些熟人,和他們打招呼,打交道,忽略另外的陌生人。甚至躲開那些我們欠了錢還暫時還不上的人。
然而這項看似簡樸的任務,對機器來說卻并不那么容易實現(xiàn)。
對計算機來講,一幅圖像信息,無論是靜態(tài)的圖片,還是動態(tài)視頻中的一幀,都是一個由眾多像素點組成的矩陣。好比一個1080p的數(shù)字圖像,是一個由1980*1080個像素點組成矩陣,每個像素點,假如是8bit的rgb格式,則是3個取值在0-255的數(shù)。
機器需要在這些數(shù)據(jù)中,找出某一部分數(shù)據(jù)代表了何種概念:哪一部分數(shù)據(jù)是水杯,哪一部分是書本,哪一部分是人臉,這是視覺模式辨認中的粗分類問題。
而人臉辨認,需要在所有機器認為是人臉的那部分數(shù)據(jù)中,區(qū)分這個人臉屬于誰,這是個細分類問題。
人臉可以分為多少類呢?
取決與所處理問題的人臉庫大小,人臉庫中有多少目標人臉,就需要機器進行相應數(shù)量的細分類。假如想要機器認出每個他看到的人,則這世界上有多少人,人臉就可以分為多少類,而這些類別之間的區(qū)別是非常細微的。由此可見人臉辨認問題的難度。
更不肯提,這件事還要受到光照,角度,人臉部的裝飾物等各種因素的影響。這也不難解釋為什么人臉辨認技術(shù)目前還沒有大量應用在日常生活中,大部分人只能在科幻電影中接觸人臉辨認了。
傻傻分不清楚——一些容易被混淆的概念
一些不太被人熟悉的事物,經(jīng)常會伴隨著大量的概念混淆。
好比對西方宗教不太了解的國人,可能搞不清楚為什么有些人信上帝但不信耶穌;都是在教堂工作的大叔,為什么有些要禁欲,有些卻能結(jié)婚。
而人臉辨認作為一個新事物,也伴隨著大量的概念混淆,而分清這些概念,對于理解人臉辨認還是比較重要的。