您好,歡迎來(lái)到深圳市智慧安防行業(yè)協(xié)會(huì)——(原深圳市視頻報(bào)警安防行業(yè)協(xié)會(huì))
當(dāng)前位置:協(xié)會(huì)首頁(yè) > 行業(yè)速遞 > 李子青:解密刷臉與生物特征識(shí)別

李子青:解密刷臉與生物特征識(shí)別

時(shí)間:2016-06-08 10:30:45 來(lái)源:深圳市智慧安防行業(yè)協(xié)會(huì) 作者:新浪財(cái)經(jīng)

  【智慧安防網(wǎng)訊】“CC講壇”(第十三期)于2016年6月6日,在北京大學(xué)百周年紀(jì)念講堂舉行。中國(guó)科學(xué)院自動(dòng)化研究所研究員、生物識(shí)別與安全技術(shù)研究中心室主任李子青出席并做了題為《解密刷臉與生物特征識(shí)別》的演講。
  
  李子青:解密刷臉與生物特征識(shí)別
  
  以下為演講實(shí)錄:
  
  人臉識(shí)別在最近一兩年特別地火。有幾個(gè)原因,第一是技術(shù)的進(jìn)步所帶來(lái)的發(fā)展;第二個(gè)是應(yīng)用有強(qiáng)勁的需求;第三,是大佬們的推波助瀾以及資本的熱捧。
  
  現(xiàn)在的人臉識(shí)別技術(shù)可以輕松地搞定普通的應(yīng)用。比如,我們要用人臉識(shí)別來(lái)搜papi醬,那么它返回的結(jié)果,現(xiàn)在基本上可以做到都是papi醬本人。結(jié)果當(dāng)中可能也會(huì)包含一些其他的不是papi醬本人的女孩子,但對(duì)這種人臉?biāo)阉鞯膽?yīng)用來(lái)說(shuō)也無(wú)傷大雅。況且,人家可能也是集美貌與才華于一身,對(duì)吧?再高端的一些應(yīng)用,比如說(shuō)刷臉支付,現(xiàn)在還存在著一些技術(shù)和安全性上的問(wèn)題。相信馬云他本人會(huì)授權(quán),他自己的賬戶(hù)用刷臉來(lái)轉(zhuǎn)賬,那就too young too simple,sometimes naive!
  
  早在十多年以前,人臉識(shí)別就小火了一把。比爾·蓋茨他本人非??春蒙锾卣髯R(shí)別技術(shù)的應(yīng)用與未來(lái)。他在2001年就對(duì)外界媒體公開(kāi)了自家的人臉識(shí)別技術(shù)。那是我研發(fā)的一個(gè)完整的、全自動(dòng)的、實(shí)時(shí)的人臉識(shí)別系統(tǒng)。后面有一個(gè)人肉背景,帶眼鏡的,那就是我年輕的時(shí)候。因?yàn)槲覀冞@個(gè)演示很成功。這個(gè)記者最后說(shuō)了一句,他說(shuō):“你們這幫人,這個(gè)星期的薪水,已經(jīng)有著落了?!?/span>
  
  早在那之前,比爾蓋茨他發(fā)布一個(gè)Windows的新版本,在發(fā)布會(huì)上遇到了藍(lán)屏死機(jī),所以在接受CNN采訪之前,我們做了各種各樣的預(yù)案。包括精心部署這個(gè)燈光,并且請(qǐng)比爾·蓋茨他老人家能夠正面配合一下,看著攝像頭,還有請(qǐng)您不要太得意,夸張的表情可能會(huì)對(duì)識(shí)別造成錯(cuò)誤。
  
  人臉識(shí)別,這樣一個(gè)事情是我們一生下來(lái)就在做的。這是幾百萬(wàn)年所進(jìn)化的我們一個(gè)能力。自動(dòng)的人臉識(shí)別算法,世界上第一個(gè)做這個(gè)事情的是一個(gè)英國(guó)人。他受一家政府機(jī)構(gòu)的委托來(lái)開(kāi)展研究。他當(dāng)時(shí)所采用的方法是一種半自動(dòng)的方法,就是用手工在圖像上標(biāo)定人臉上面的關(guān)鍵點(diǎn),然后測(cè)量?jī)裳壑g的距離、嘴唇的厚度,以此作為特征來(lái)進(jìn)行人臉的比對(duì)。其實(shí)我很多的朋友,當(dāng)我告訴他我是做人臉識(shí)別的。他就會(huì)告訴我:“我知道怎么做,就是兩眼之間的距離,眼睛大小、嘴唇大小?!钡珜?shí)際上,現(xiàn)在的技術(shù)不是這樣的。在那之后,有非常多的重大的技術(shù)突破,比較關(guān)鍵的是2001年的一個(gè)叫AdaBoost,這樣一個(gè)人臉檢測(cè)技術(shù),它很能快速地從照片當(dāng)中、圖片當(dāng)中把人臉框出來(lái)。最近的10年,深度學(xué)習(xí)的研究與應(yīng)用使得人臉識(shí)別和人工智能的核心技術(shù)得到了極大的提升。圖像硬件的發(fā)展也有力地給這個(gè)人臉識(shí)別提供了很好的圖像基礎(chǔ)。
  
  人臉識(shí)別的流程大概是這樣的。首先我們?cè)趫D像當(dāng)中找到這個(gè)人臉,然后把每個(gè)人臉進(jìn)行一種預(yù)處理,給它進(jìn)行光照、姿態(tài)、表情等等一些校正。然后在這個(gè)基礎(chǔ)之上,我們用算法對(duì)它這個(gè)人臉部分進(jìn)行一個(gè)特征的提取,把圖片變成一個(gè)二維碼。在此基礎(chǔ)上進(jìn)行特征的對(duì)比,然后進(jìn)行身份識(shí)別的判決。這里面遇到的技術(shù)難點(diǎn),首先是要解決光照問(wèn)題。比如說(shuō)在全黑的條件下,我們連圖像都采不到。怎么能進(jìn)行人臉識(shí)別?像在左邊這樣一個(gè)條件下,一個(gè)極端的光照我們現(xiàn)在的算法還不能很好地去對(duì)它進(jìn)行一個(gè)有效的、正確的比對(duì)。其他的包括姿態(tài)、表情、還有配飾。比如說(shuō)戴個(gè)墨鏡,還有頭發(fā)的遮擋。經(jīng)常女孩子會(huì)比較難以識(shí)別,因?yàn)樗念^發(fā)遮擋住了。還有化妝,很多人會(huì)問(wèn)我,“我到韓國(guó)去整個(gè)容,那么我進(jìn)海關(guān)怎么辦?”實(shí)際上我認(rèn)為靠人臉識(shí)別的話如果你完全不一樣了,應(yīng)該是當(dāng)成不同的人。還有人問(wèn)我,“我雙胞胎,長(zhǎng)得一模一樣,那你能區(qū)分出來(lái)嗎?”我說(shuō):“NO!”因?yàn)榭块L(zhǎng)相、靠人臉的話,那雙胞胎他就是同一張人臉。還有一些問(wèn)題就是比如說(shuō)年齡的跨度,我從小到大,我的面容變化非常地巨大,這也是一個(gè)問(wèn)題。
  
  前面提到就是為了給比爾·蓋茨做演示,我們精心地布置了燈光。在那之后,我就在想如何解決這個(gè)光照問(wèn)題,這是第一步要解決的。直接的一個(gè)解決方案就是說(shuō)我們可以像數(shù)碼相機(jī)那樣在前面加個(gè)閃光燈。“啪”的一下,只要能采到正面的照片,那么我們就能以很高的準(zhǔn)確率進(jìn)行識(shí)別。但是如果說(shuō)每次做人臉識(shí)別的時(shí)候,都要用閃光燈閃一下給人的體驗(yàn)是非常差的,那個(gè)是不太可行。但是我們有其它的方法,比如說(shuō),用近紅外主動(dòng)光源。大家可能看到聊天攝像頭上面和那種監(jiān)控視頻上面,晚上都有一些肉眼看不見(jiàn)但是傳感器、攝像頭它能看得見(jiàn)的這樣一種方式。所以,我發(fā)明了這樣一個(gè)近紅外人臉識(shí)別的這樣一個(gè)方法。這樣一個(gè)產(chǎn)品長(zhǎng)相是這樣的,是不是大家看著非常的土?這是第二代的樣品。第一代的樣品更土,是裝在一個(gè)蒙牛牛奶的包裝盒里邊的,所有的電路、包括二極管、包括一些傳感器什么東西都包在里面。但是它work,它解決了問(wèn)題。使得2004年,當(dāng)時(shí)的這樣一個(gè)人臉識(shí)別率得到了極大的提升?,F(xiàn)在這個(gè)產(chǎn)品是長(zhǎng)成是這樣的。比以前要高大上多了,這樣一個(gè)產(chǎn)品的話在全世界各地每年銷(xiāo)售有幾十萬(wàn)臺(tái)。
  
  大數(shù)據(jù)和深度學(xué)習(xí)極大地推進(jìn)了人臉識(shí)別和人工智能,包括AlphaGO。這樣一個(gè)技術(shù)的發(fā)展這里面有三個(gè)要素,第一個(gè)是大數(shù)據(jù)。要學(xué)習(xí)到這個(gè)模型的這樣一個(gè)數(shù)據(jù),它要能囊括能夠概括我們大多數(shù)場(chǎng)景下能夠看到的這樣一些數(shù)據(jù)。第二個(gè)就是深度網(wǎng)絡(luò)的結(jié)構(gòu)。它層數(shù)很深,并且它是一個(gè)非線性變換,使得這樣一個(gè)函數(shù)它能處理像人臉識(shí)別、語(yǔ)音識(shí)別和機(jī)器下棋,這樣一些非常復(fù)雜的問(wèn)題。第三個(gè)要素就是深度學(xué)習(xí)的運(yùn)算量非常的大,我們希望能在有限的、可以等待的時(shí)間內(nèi),把這個(gè)模型訓(xùn)練學(xué)習(xí)完成,這就需要有GPU的加速。這三個(gè)要素缺一不可!
  
  在很多情況下,人臉的姿態(tài)和表情是不受控制的。那么如何去解決這個(gè)問(wèn)題?我們?yōu)榇搜邪l(fā)了三維可形變的模型。它具體就是把輸入圖像往一個(gè)內(nèi)部的、三維模型上面給它貼上去,然后根據(jù)關(guān)鍵點(diǎn)的位置用三維模型把這個(gè)姿態(tài)給它轉(zhuǎn)過(guò)來(lái)。轉(zhuǎn)到正面之后,我們?cè)侔堰@個(gè)表情再給它歸一化,給它變成一個(gè)中性的表情,最后就得到這樣一個(gè)輸出。這樣的話就能夠提高在大姿態(tài)、大的表情條件下的人臉識(shí)別的準(zhǔn)確率。最新的進(jìn)展就是我們把前面所說(shuō)的,三維可形變模型與深度學(xué)習(xí)處理進(jìn)一步結(jié)合,使得它更加強(qiáng)悍,能夠解決更加困難的問(wèn)題。
  
  各種各樣的生物特征識(shí)別,包括人臉、指紋、虹膜、眼睛等等一些,它都存在著一些問(wèn)題。首先就是識(shí)別錯(cuò)誤的問(wèn)題。因?yàn)闆](méi)有哪一個(gè)算法,哪一個(gè)人工智能的技術(shù)能夠保證百分之百。第二個(gè)就是這個(gè)系統(tǒng)會(huì)受到各種各樣的假體的攻擊。關(guān)于識(shí)別率錯(cuò)誤的問(wèn)題,一個(gè)很典型的案例,就是趙薇的司機(jī)把趙薇老公的房子給賣(mài)了??赡苓@個(gè)新聞大家都知道,原因是趙薇的司機(jī)騙過(guò)了人臉識(shí)別系統(tǒng)。這司機(jī)得長(zhǎng)成啥樣?他才能夠騙過(guò)這個(gè)人臉識(shí)別系統(tǒng),并且準(zhǔn)確率、相似度高達(dá)98.3%,所以說(shuō)我就在網(wǎng)上搜了一下,這是趙薇老公,我也曾經(jīng)試圖去搜索那個(gè)司機(jī)的人臉,但是沒(méi)搜到。但是很機(jī)智的我,搜出了一個(gè)老司機(jī)的表情包。大家仔細(xì)看一下是不是挺像的,所以說(shuō)我們應(yīng)該為那套人臉識(shí)別系統(tǒng)點(diǎn)贊,很智能、很準(zhǔn)確!
  
  各種各樣的假體攻擊,人臉識(shí)別的話包括照片的打印、視頻的播放,比如說(shuō)安卓4.0,它推出了人臉解鎖。馬上就有人說(shuō),“我拿這個(gè)手機(jī)拍一張照片,對(duì)著這個(gè)手機(jī)就能解鎖了?!边€有就是人臉的面具。對(duì)付照片打印還是比較簡(jiǎn)單的,我們可以采取人機(jī)交互的方法。比如說(shuō)我可以下指令,你給我眨個(gè)眼睛,那我就看你是不是眨了眼睛。你給我張張嘴,你給我搖搖頭。當(dāng)這個(gè)防假體攻擊的技術(shù)出現(xiàn)之后,又出現(xiàn)了另外一種攻擊形態(tài)。他把這個(gè)照片打印出來(lái),然后把眼睛和嘴巴的地方給它摳出來(lái),你讓我眨眼我就眨眼,你要我張嘴我就張嘴,你讓我搖頭我就搖頭,所以說(shuō)這個(gè)技術(shù)就是有矛又有盾,我們是螺旋式的上升和技術(shù)進(jìn)步。網(wǎng)上可以買(mǎi)賣(mài)到的仿人皮的這樣一個(gè)人臉。除了這個(gè)人臉之外,指紋這個(gè)假體是更加普遍。你在百度上面去搜一下,就能搜出各種各樣的仿制的指紋的方法。它可以代打卡嘛!我可以不用去上班了。我也是非常希望我們每一個(gè)中國(guó)人都能在一個(gè)良好的環(huán)境當(dāng)中去生存,就是能夠活得有尊嚴(yán),所以說(shuō)這種騙術(shù)我們一定要給它鏟除。
  
  為了解決生物識(shí)別防假體攻擊這樣一個(gè)問(wèn)題,歐盟組織了12個(gè)團(tuán)隊(duì)來(lái)開(kāi)展系統(tǒng)性的、合作研究,其中11個(gè)團(tuán)隊(duì)是歐盟成員國(guó)的團(tuán)隊(duì),我們作為唯一的一個(gè)非歐團(tuán)隊(duì)受邀參加這樣一個(gè)項(xiàng)目。我們?cè)谶@個(gè)項(xiàng)目當(dāng)中提出了,用多光譜的方法。就是多光譜,包括紫外、近紅外、熱紅外成像,這是我們?nèi)庋鄄豢梢?jiàn),但是在各種光譜情況下的成像,它可能能分辨出。這個(gè)真人和假體的區(qū)別這樣一種技術(shù)它是需要一種特殊的硬件的。
  
  下面我來(lái)比較一下機(jī)器的識(shí)別與人工的這樣一個(gè)識(shí)別。招商銀行統(tǒng)計(jì)人工核驗(yàn)的錯(cuò)誤率大概是百分之五,而機(jī)器自動(dòng)識(shí)別的錯(cuò)誤率大概在千分之一到萬(wàn)分之一之間,所以說(shuō)這個(gè)機(jī)器已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了人工的這樣一個(gè)識(shí)別,但是這是有條件的。
  
  這個(gè)案例是在深圳羅湖海關(guān)抓有案底的這樣一些水客。因?yàn)槿四軌蜃R(shí)別的面孔大概只有幾千張,特別是對(duì)不熟悉的人,我很難去給他識(shí)別出來(lái)。像我本人的話,我是特別的臉盲,我覺(jué)得我頂多只能識(shí)別不到一千張臉,遠(yuǎn)遠(yuǎn)低于這個(gè)平均水平。這個(gè)系統(tǒng)在頭三天的啟用就成功地識(shí)別兩百多個(gè)水客。
  
  那比較一下機(jī)器識(shí)別與人工識(shí)別在正常的條件下,機(jī)器人臉識(shí)別的成功率、準(zhǔn)確率是遠(yuǎn)遠(yuǎn)高于人工識(shí)別的,但是機(jī)器它做人臉識(shí)別的時(shí)候,它只看人臉這樣一部分。它沒(méi)有用到一些外部的一些信息、線索,比如說(shuō)什么發(fā)型,高矮胖瘦啊。它是不看的,而人可以看這個(gè)。另外,機(jī)器的話,剛才我說(shuō)了,我可以在大數(shù)據(jù)當(dāng)中去搜索人臉。比如說(shuō),我們做的一個(gè)案例,搜索一千萬(wàn)張只需要不到一秒的時(shí)間,而剛才我說(shuō)了人他一生當(dāng)中只能認(rèn)識(shí)幾千個(gè)人,但是機(jī)器呢比較容易受到這種偽造的攻擊,用一張照片或者一段視頻,或者拿個(gè)手機(jī),但是人能夠比較容易地去識(shí)別這樣一個(gè)假體攻擊。
  
  除了人臉之外,還有各種各樣的生物特征。我們比較熟悉的就是指紋、虹膜,像那些大片里面掌紋、掌靜脈、步態(tài)、簽名、指靜脈。那么我們把不同的多種的生物特征給它結(jié)合起來(lái),這樣的話有可能提升它的準(zhǔn)確性與安全性。比如說(shuō)我拍臉的時(shí)候,我同樣把這個(gè)瞳孔,這個(gè)虹膜給它拍出來(lái)。這樣既不影響你使用的便捷性,又能提升你的識(shí)別率;指紋的話,我既采指紋又采指靜脈,那這樣的話其實(shí)也是不會(huì)影響它使用的便捷性,但是可以提高它的準(zhǔn)確性和安全性。
  
  最后談一下技術(shù)發(fā)展。深度學(xué)習(xí)已經(jīng)是目前人臉識(shí)別、物體識(shí)別、語(yǔ)音識(shí)別和人工智能的一種核心的這樣一個(gè)方法。大家有個(gè)感覺(jué),深度學(xué)習(xí)在最近幾年其實(shí)沒(méi)有什么太多發(fā)展,它之所以應(yīng)用成功是因?yàn)槲覀冊(cè)谧龊芏喙こ躺厦娴氖占瘮?shù)據(jù)。然后進(jìn)行訓(xùn)練,然后調(diào)參數(shù)、調(diào)應(yīng)用,我不認(rèn)為把這個(gè)技術(shù)的提升可以歸結(jié)為一個(gè)工程化的成果,我認(rèn)為深度學(xué)習(xí)理論本身,還是有很大的潛力可以挖出來(lái)。很多的工程應(yīng)用問(wèn)題都可以歸結(jié)成一個(gè)優(yōu)化的問(wèn)題,那么在定義了目標(biāo)函數(shù)之后,我們要去尋優(yōu)要去求解一個(gè)最優(yōu)解,這里面就涉及到一個(gè)全局優(yōu)化的問(wèn)題。比如說(shuō)我知道,全球的最高峰是珠穆朗瑪峰,但是如果說(shuō)我順著爬上去任何一座山的話,也許我就爬到香山上面了,那就不是珠穆朗瑪峰了。所以說(shuō)要如何能跳出,要避免這樣一個(gè)不太好的局部極值,能夠找到全局的最優(yōu)點(diǎn)。其實(shí)這個(gè)已經(jīng)是在數(shù)學(xué)界、理論界是一個(gè)還是沒(méi)有很好解決的問(wèn)題。
  
  那么進(jìn)一步要把這個(gè)人工智能提升到更高的一個(gè)臺(tái)階,需要我們進(jìn)行一個(gè)跨界的努力,需要我們對(duì)自己的大腦進(jìn)行這樣一個(gè)更加深刻的認(rèn)識(shí)。那么現(xiàn)在已經(jīng)知道,人的大腦里面有不同的區(qū)域是執(zhí)行不同的功能的。這部分是識(shí)別人臉的,這部分是識(shí)別貓的,那這部分識(shí)別人臉里面是不是有張三李四。也在不同的一個(gè)細(xì)胞,這就是所謂稀疏表達(dá)問(wèn)題,或者在腦科學(xué)里面叫祖母細(xì)胞的問(wèn)題。
企業(yè)資訊
熵基科技連續(xù)五年榮登全球安防50強(qiáng)榜單,位列第15名
11月18日,全球知名的科技媒體a&s《安全&自動(dòng)化》正式揭曉了備受矚目的2024年度全球安防50強(qiáng)榜單。熵基科
共繪藍(lán)圖,2024熵基科技全球合作伙伴大會(huì)圓滿成功
近日,以“共繪藍(lán)圖”為主題的2024熵基科技全球合作伙伴大會(huì)在東莞成功落下帷幕。作為熵基科技規(guī)模最大、面向全球全品類(lèi)核心伙伴的頂
一文讀懂熵基國(guó)密門(mén)禁
在數(shù)字化轉(zhuǎn)型的洪流中,信息安全不僅是企業(yè)穩(wěn)健運(yùn)營(yíng)的基石,更是公共部門(mén)安全無(wú)虞的保障。隨著數(shù)據(jù)價(jià)值的日益凸顯,其保密性和安全性成為
項(xiàng)目活動(dòng)
熱門(mén)專(zhuān)題
  • 熵基科技出席數(shù)字經(jīng)濟(jì)及智慧城市空間未來(lái)應(yīng)用創(chuàng)新峰會(huì)
  • 2021年智能安防機(jī)器人市場(chǎng)或?qū)⑦M(jìn)入井噴期
  • 2021年的智慧城市建設(shè)該怎么發(fā)展?聽(tīng)聽(tīng)行業(yè)大咖的觀點(diǎn)
  • 達(dá)實(shí)信息:顛覆傳統(tǒng)經(jīng)營(yíng)模式 構(gòu)建互聯(lián)網(wǎng)+門(mén)禁新時(shí)代