當(dāng)前位置：協(xié)會(huì)首頁(yè) > 行業(yè)速遞 > 李子青：解密刷臉與生物特征識(shí)別

李子青：解密刷臉與生物特征識(shí)別

時(shí)間:2016-06-08 10:30:45 來(lái)源:深圳市智慧安防行業(yè)協(xié)會(huì) 作者:新浪財(cái)經(jīng)

　　【智慧安防網(wǎng)訊】“CC講壇”（第十三期）于2016年6月6日，在北京大學(xué)百周年紀(jì)念講堂舉行。中國(guó)科學(xué)院自動(dòng)化研究所研究員、生物識(shí)別與安全技術(shù)研究中心室主任李子青出席并做了題為《解密刷臉與生物特征識(shí)別》的演講。
　　

　　李子青：解密刷臉與生物特征識(shí)別
　　
　　以下為演講實(shí)錄：
　　
　　人臉識(shí)別在最近一兩年特別地火。有幾個(gè)原因，第一是技術(shù)的進(jìn)步所帶來(lái)的發(fā)展；第二個(gè)是應(yīng)用有強(qiáng)勁的需求；第三，是大佬們的推波助瀾以及資本的熱捧。
　　
　　現(xiàn)在的人臉識(shí)別技術(shù)可以輕松地搞定普通的應(yīng)用。比如，我們要用人臉識(shí)別來(lái)搜papi醬，那么它返回的結(jié)果，現(xiàn)在基本上可以做到都是papi醬本人。結(jié)果當(dāng)中可能也會(huì)包含一些其他的不是papi醬本人的女孩子，但對(duì)這種人臉?biāo)阉鞯膽?yīng)用來(lái)說(shuō)也無(wú)傷大雅。況且，人家可能也是集美貌與才華于一身，對(duì)吧？再高端的一些應(yīng)用，比如說(shuō)刷臉支付，現(xiàn)在還存在著一些技術(shù)和安全性上的問(wèn)題。相信馬云他本人會(huì)授權(quán)，他自己的賬戶(hù)用刷臉來(lái)轉(zhuǎn)賬，那就too young too simple，sometimes naive！
　　
　　早在十多年以前，人臉識(shí)別就小火了一把。比爾·蓋茨他本人非?？春蒙锾卣髯R(shí)別技術(shù)的應(yīng)用與未來(lái)。他在2001年就對(duì)外界媒體公開(kāi)了自家的人臉識(shí)別技術(shù)。那是我研發(fā)的一個(gè)完整的、全自動(dòng)的、實(shí)時(shí)的人臉識(shí)別系統(tǒng)。后面有一個(gè)人肉背景，帶眼鏡的，那就是我年輕的時(shí)候。因?yàn)槲覀冞@個(gè)演示很成功。這個(gè)記者最后說(shuō)了一句，他說(shuō)：“你們這幫人，這個(gè)星期的薪水，已經(jīng)有著落了?！?/span>
　　
　　早在那之前，比爾蓋茨他發(fā)布一個(gè)Windows的新版本，在發(fā)布會(huì)上遇到了藍(lán)屏死機(jī)，所以在接受CNN采訪之前，我們做了各種各樣的預(yù)案。包括精心部署這個(gè)燈光，并且請(qǐng)比爾·蓋茨他老人家能夠正面配合一下，看著攝像頭，還有請(qǐng)您不要太得意，夸張的表情可能會(huì)對(duì)識(shí)別造成錯(cuò)誤。
　　
　　人臉識(shí)別，這樣一個(gè)事情是我們一生下來(lái)就在做的。這是幾百萬(wàn)年所進(jìn)化的我們一個(gè)能力。自動(dòng)的人臉識(shí)別算法，世界上第一個(gè)做這個(gè)事情的是一個(gè)英國(guó)人。他受一家政府機(jī)構(gòu)的委托來(lái)開(kāi)展研究。他當(dāng)時(shí)所采用的方法是一種半自動(dòng)的方法，就是用手工在圖像上標(biāo)定人臉上面的關(guān)鍵點(diǎn)，然后測(cè)量?jī)裳壑g的距離、嘴唇的厚度，以此作為特征來(lái)進(jìn)行人臉的比對(duì)。其實(shí)我很多的朋友，當(dāng)我告訴他我是做人臉識(shí)別的。他就會(huì)告訴我：“我知道怎么做，就是兩眼之間的距離，眼睛大小、嘴唇大小?！钡珜?shí)際上，現(xiàn)在的技術(shù)不是這樣的。在那之后，有非常多的重大的技術(shù)突破，比較關(guān)鍵的是2001年的一個(gè)叫AdaBoost，這樣一個(gè)人臉檢測(cè)技術(shù)，它很能快速地從照片當(dāng)中、圖片當(dāng)中把人臉框出來(lái)。最近的10年，深度學(xué)習(xí)的研究與應(yīng)用使得人臉識(shí)別和人工智能的核心技術(shù)得到了極大的提升。圖像硬件的發(fā)展也有力地給這個(gè)人臉識(shí)別提供了很好的圖像基礎(chǔ)。
　　
　　人臉識(shí)別的流程大概是這樣的。首先我們?cè)趫D像當(dāng)中找到這個(gè)人臉，然后把每個(gè)人臉進(jìn)行一種預(yù)處理，給它進(jìn)行光照、姿態(tài)、表情等等一些校正。然后在這個(gè)基礎(chǔ)之上，我們用算法對(duì)它這個(gè)人臉部分進(jìn)行一個(gè)特征的提取，把圖片變成一個(gè)二維碼。在此基礎(chǔ)上進(jìn)行特征的對(duì)比，然后進(jìn)行身份識(shí)別的判決。這里面遇到的技術(shù)難點(diǎn)，首先是要解決光照問(wèn)題。比如說(shuō)在全黑的條件下，我們連圖像都采不到。怎么能進(jìn)行人臉識(shí)別？像在左邊這樣一個(gè)條件下，一個(gè)極端的光照我們現(xiàn)在的算法還不能很好地去對(duì)它進(jìn)行一個(gè)有效的、正確的比對(duì)。其他的包括姿態(tài)、表情、還有配飾。比如說(shuō)戴個(gè)墨鏡，還有頭發(fā)的遮擋。經(jīng)常女孩子會(huì)比較難以識(shí)別，因?yàn)樗念^發(fā)遮擋住了。還有化妝，很多人會(huì)問(wèn)我，“我到韓國(guó)去整個(gè)容，那么我進(jìn)海關(guān)怎么辦？”實(shí)際上我認(rèn)為靠人臉識(shí)別的話如果你完全不一樣了，應(yīng)該是當(dāng)成不同的人。還有人問(wèn)我，“我雙胞胎，長(zhǎng)得一模一樣，那你能區(qū)分出來(lái)嗎？”我說(shuō)：“NO！”因?yàn)榭块L(zhǎng)相、靠人臉的話，那雙胞胎他就是同一張人臉。還有一些問(wèn)題就是比如說(shuō)年齡的跨度，我從小到大，我的面容變化非常地巨大，這也是一個(gè)問(wèn)題。
　　
　　前面提到就是為了給比爾·蓋茨做演示，我們精心地布置了燈光。在那之后，我就在想如何解決這個(gè)光照問(wèn)題，這是第一步要解決的。直接的一個(gè)解決方案就是說(shuō)我們可以像數(shù)碼相機(jī)那樣在前面加個(gè)閃光燈。“啪”的一下，只要能采到正面的照片，那么我們就能以很高的準(zhǔn)確率進(jìn)行識(shí)別。但是如果說(shuō)每次做人臉識(shí)別的時(shí)候，都要用閃光燈閃一下給人的體驗(yàn)是非常差的，那個(gè)是不太可行。但是我們有其它的方法，比如說(shuō)，用近紅外主動(dòng)光源。大家可能看到聊天攝像頭上面和那種監(jiān)控視頻上面，晚上都有一些肉眼看不見(jiàn)但是傳感器、攝像頭它能看得見(jiàn)的這樣一種方式。所以，我發(fā)明了這樣一個(gè)近紅外人臉識(shí)別的這樣一個(gè)方法。這樣一個(gè)產(chǎn)品長(zhǎng)相是這樣的，是不是大家看著非常的土？這是第二代的樣品。第一代的樣品更土，是裝在一個(gè)蒙牛牛奶的包裝盒里邊的，所有的電路、包括二極管、包括一些傳感器什么東西都包在里面。但是它work，它解決了問(wèn)題。使得2004年，當(dāng)時(shí)的這樣一個(gè)人臉識(shí)別率得到了極大的提升?，F(xiàn)在這個(gè)產(chǎn)品是長(zhǎng)成是這樣的。比以前要高大上多了，這樣一個(gè)產(chǎn)品的話在全世界各地每年銷(xiāo)售有幾十萬(wàn)臺(tái)。
　　
　　大數(shù)據(jù)和深度學(xué)習(xí)極大地推進(jìn)了人臉識(shí)別和人工智能，包括AlphaGO。這樣一個(gè)技術(shù)的發(fā)展這里面有三個(gè)要素，第一個(gè)是大數(shù)據(jù)。要學(xué)習(xí)到這個(gè)模型的這樣一個(gè)數(shù)據(jù)，它要能囊括能夠概括我們大多數(shù)場(chǎng)景下能夠看到的這樣一些數(shù)據(jù)。第二個(gè)就是深度網(wǎng)絡(luò)的結(jié)構(gòu)。它層數(shù)很深，并且它是一個(gè)非線性變換，使得這樣一個(gè)函數(shù)它能處理像人臉識(shí)別、語(yǔ)音識(shí)別和機(jī)器下棋，這樣一些非常復(fù)雜的問(wèn)題。第三個(gè)要素就是深度學(xué)習(xí)的運(yùn)算量非常的大，我們希望能在有限的、可以等待的時(shí)間內(nèi)，把這個(gè)模型訓(xùn)練學(xué)習(xí)完成，這就需要有GPU的加速。這三個(gè)要素缺一不可！
　　
　　在很多情況下，人臉的姿態(tài)和表情是不受控制的。那么如何去解決這個(gè)問(wèn)題？我們?yōu)榇搜邪l(fā)了三維可形變的模型。它具體就是把輸入圖像往一個(gè)內(nèi)部的、三維模型上面給它貼上去，然后根據(jù)關(guān)鍵點(diǎn)的位置用三維模型把這個(gè)姿態(tài)給它轉(zhuǎn)過(guò)來(lái)。轉(zhuǎn)到正面之后，我們?cè)侔堰@個(gè)表情再給它歸一化，給它變成一個(gè)中性的表情，最后就得到這樣一個(gè)輸出。這樣的話就能夠提高在大姿態(tài)、大的表情條件下的人臉識(shí)別的準(zhǔn)確率。最新的進(jìn)展就是我們把前面所說(shuō)的，三維可形變模型與深度學(xué)習(xí)處理進(jìn)一步結(jié)合，使得它更加強(qiáng)悍，能夠解決更加困難的問(wèn)題。
　　
　　各種各樣的生物特征識(shí)別，包括人臉、指紋、虹膜、眼睛等等一些，它都存在著一些問(wèn)題。首先就是識(shí)別錯(cuò)誤的問(wèn)題。因?yàn)闆](méi)有哪一個(gè)算法，哪一個(gè)人工智能的技術(shù)能夠保證百分之百。第二個(gè)就是這個(gè)系統(tǒng)會(huì)受到各種各樣的假體的攻擊。關(guān)于識(shí)別率錯(cuò)誤的問(wèn)題，一個(gè)很典型的案例，就是趙薇的司機(jī)把趙薇老公的房子給賣(mài)了?？赡苓@個(gè)新聞大家都知道，原因是趙薇的司機(jī)騙過(guò)了人臉識(shí)別系統(tǒng)。這司機(jī)得長(zhǎng)成啥樣？他才能夠騙過(guò)這個(gè)人臉識(shí)別系統(tǒng)，并且準(zhǔn)確率、相似度高達(dá)98.3%，所以說(shuō)我就在網(wǎng)上搜了一下，這是趙薇老公，我也曾經(jīng)試圖去搜索那個(gè)司機(jī)的人臉，但是沒(méi)搜到。但是很機(jī)智的我，搜出了一個(gè)老司機(jī)的表情包。大家仔細(xì)看一下是不是挺像的，所以說(shuō)我們應(yīng)該為那套人臉識(shí)別系統(tǒng)點(diǎn)贊，很智能、很準(zhǔn)確！
　　
　　各種各樣的假體攻擊，人臉識(shí)別的話包括照片的打印、視頻的播放，比如說(shuō)安卓4.0，它推出了人臉解鎖。馬上就有人說(shuō)，“我拿這個(gè)手機(jī)拍一張照片，對(duì)著這個(gè)手機(jī)就能解鎖了?！边€有就是人臉的面具。對(duì)付照片打印還是比較簡(jiǎn)單的，我們可以采取人機(jī)交互的方法。比如說(shuō)我可以下指令，你給我眨個(gè)眼睛，那我就看你是不是眨了眼睛。你給我張張嘴，你給我搖搖頭。當(dāng)這個(gè)防假體攻擊的技術(shù)出現(xiàn)之后，又出現(xiàn)了另外一種攻擊形態(tài)。他把這個(gè)照片打印出來(lái)，然后把眼睛和嘴巴的地方給它摳出來(lái)，你讓我眨眼我就眨眼，你要我張嘴我就張嘴，你讓我搖頭我就搖頭，所以說(shuō)這個(gè)技術(shù)就是有矛又有盾，我們是螺旋式的上升和技術(shù)進(jìn)步。網(wǎng)上可以買(mǎi)賣(mài)到的仿人皮的這樣一個(gè)人臉。除了這個(gè)人臉之外，指紋這個(gè)假體是更加普遍。你在百度上面去搜一下，就能搜出各種各樣的仿制的指紋的方法。它可以代打卡嘛！我可以不用去上班了。我也是非常希望我們每一個(gè)中國(guó)人都能在一個(gè)良好的環(huán)境當(dāng)中去生存，就是能夠活得有尊嚴(yán)，所以說(shuō)這種騙術(shù)我們一定要給它鏟除。
　　
　　為了解決生物識(shí)別防假體攻擊這樣一個(gè)問(wèn)題，歐盟組織了12個(gè)團(tuán)隊(duì)來(lái)開(kāi)展系統(tǒng)性的、合作研究，其中11個(gè)團(tuán)隊(duì)是歐盟成員國(guó)的團(tuán)隊(duì)，我們作為唯一的一個(gè)非歐團(tuán)隊(duì)受邀參加這樣一個(gè)項(xiàng)目。我們?cè)谶@個(gè)項(xiàng)目當(dāng)中提出了，用多光譜的方法。就是多光譜，包括紫外、近紅外、熱紅外成像，這是我們?nèi)庋鄄豢梢?jiàn)，但是在各種光譜情況下的成像，它可能能分辨出。這個(gè)真人和假體的區(qū)別這樣一種技術(shù)它是需要一種特殊的硬件的。
　　
　　下面我來(lái)比較一下機(jī)器的識(shí)別與人工的這樣一個(gè)識(shí)別。招商銀行統(tǒng)計(jì)人工核驗(yàn)的錯(cuò)誤率大概是百分之五，而機(jī)器自動(dòng)識(shí)別的錯(cuò)誤率大概在千分之一到萬(wàn)分之一之間，所以說(shuō)這個(gè)機(jī)器已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了人工的這樣一個(gè)識(shí)別，但是這是有條件的。
　　
　　這個(gè)案例是在深圳羅湖海關(guān)抓有案底的這樣一些水客。因?yàn)槿四軌蜃R(shí)別的面孔大概只有幾千張，特別是對(duì)不熟悉的人，我很難去給他識(shí)別出來(lái)。像我本人的話，我是特別的臉盲，我覺(jué)得我頂多只能識(shí)別不到一千張臉，遠(yuǎn)遠(yuǎn)低于這個(gè)平均水平。這個(gè)系統(tǒng)在頭三天的啟用就成功地識(shí)別兩百多個(gè)水客。
　　
　　那比較一下機(jī)器識(shí)別與人工識(shí)別在正常的條件下，機(jī)器人臉識(shí)別的成功率、準(zhǔn)確率是遠(yuǎn)遠(yuǎn)高于人工識(shí)別的，但是機(jī)器它做人臉識(shí)別的時(shí)候，它只看人臉這樣一部分。它沒(méi)有用到一些外部的一些信息、線索，比如說(shuō)什么發(fā)型，高矮胖瘦啊。它是不看的，而人可以看這個(gè)。另外，機(jī)器的話，剛才我說(shuō)了，我可以在大數(shù)據(jù)當(dāng)中去搜索人臉。比如說(shuō)，我們做的一個(gè)案例，搜索一千萬(wàn)張只需要不到一秒的時(shí)間，而剛才我說(shuō)了人他一生當(dāng)中只能認(rèn)識(shí)幾千個(gè)人，但是機(jī)器呢比較容易受到這種偽造的攻擊，用一張照片或者一段視頻，或者拿個(gè)手機(jī)，但是人能夠比較容易地去識(shí)別這樣一個(gè)假體攻擊。
　　
　　除了人臉之外，還有各種各樣的生物特征。我們比較熟悉的就是指紋、虹膜，像那些大片里面掌紋、掌靜脈、步態(tài)、簽名、指靜脈。那么我們把不同的多種的生物特征給它結(jié)合起來(lái)，這樣的話有可能提升它的準(zhǔn)確性與安全性。比如說(shuō)我拍臉的時(shí)候，我同樣把這個(gè)瞳孔，這個(gè)虹膜給它拍出來(lái)。這樣既不影響你使用的便捷性，又能提升你的識(shí)別率；指紋的話，我既采指紋又采指靜脈，那這樣的話其實(shí)也是不會(huì)影響它使用的便捷性，但是可以提高它的準(zhǔn)確性和安全性。
　　
　　最后談一下技術(shù)發(fā)展。深度學(xué)習(xí)已經(jīng)是目前人臉識(shí)別、物體識(shí)別、語(yǔ)音識(shí)別和人工智能的一種核心的這樣一個(gè)方法。大家有個(gè)感覺(jué)，深度學(xué)習(xí)在最近幾年其實(shí)沒(méi)有什么太多發(fā)展，它之所以應(yīng)用成功是因?yàn)槲覀冊(cè)谧龊芏喙こ躺厦娴氖占瘮?shù)據(jù)。然后進(jìn)行訓(xùn)練，然后調(diào)參數(shù)、調(diào)應(yīng)用，我不認(rèn)為把這個(gè)技術(shù)的提升可以歸結(jié)為一個(gè)工程化的成果，我認(rèn)為深度學(xué)習(xí)理論本身，還是有很大的潛力可以挖出來(lái)。很多的工程應(yīng)用問(wèn)題都可以歸結(jié)成一個(gè)優(yōu)化的問(wèn)題，那么在定義了目標(biāo)函數(shù)之后，我們要去尋優(yōu)要去求解一個(gè)最優(yōu)解，這里面就涉及到一個(gè)全局優(yōu)化的問(wèn)題。比如說(shuō)我知道，全球的最高峰是珠穆朗瑪峰，但是如果說(shuō)我順著爬上去任何一座山的話，也許我就爬到香山上面了，那就不是珠穆朗瑪峰了。所以說(shuō)要如何能跳出，要避免這樣一個(gè)不太好的局部極值，能夠找到全局的最優(yōu)點(diǎn)。其實(shí)這個(gè)已經(jīng)是在數(shù)學(xué)界、理論界是一個(gè)還是沒(méi)有很好解決的問(wèn)題。
　　
　　那么進(jìn)一步要把這個(gè)人工智能提升到更高的一個(gè)臺(tái)階，需要我們進(jìn)行一個(gè)跨界的努力，需要我們對(duì)自己的大腦進(jìn)行這樣一個(gè)更加深刻的認(rèn)識(shí)。那么現(xiàn)在已經(jīng)知道，人的大腦里面有不同的區(qū)域是執(zhí)行不同的功能的。這部分是識(shí)別人臉的，這部分是識(shí)別貓的，那這部分識(shí)別人臉里面是不是有張三李四。也在不同的一個(gè)細(xì)胞，這就是所謂稀疏表達(dá)問(wèn)題，或者在腦科學(xué)里面叫祖母細(xì)胞的問(wèn)題。

上一篇：智慧城市之大合作：航天智慧＋華為
下一篇：程杰：從大數(shù)據(jù)角度來(lái)看智能交通

企業(yè)資訊

: 熵基科技連續(xù)五年榮登全球安防50強(qiáng)榜單，位列第15名; 11月18日，全球知名的科技媒體a&s《安全&自動(dòng)化》正式揭曉了備受矚目的2024年度全球安防50強(qiáng)榜單。熵基科

: 共繪藍(lán)圖，2024熵基科技全球合作伙伴大會(huì)圓滿成功; 近日，以“共繪藍(lán)圖”為主題的2024熵基科技全球合作伙伴大會(huì)在東莞成功落下帷幕。作為熵基科技規(guī)模最大、面向全球全品類(lèi)核心伙伴的頂

: 一文讀懂熵基國(guó)密門(mén)禁; 在數(shù)字化轉(zhuǎn)型的洪流中，信息安全不僅是企業(yè)穩(wěn)健運(yùn)營(yíng)的基石，更是公共部門(mén)安全無(wú)虞的保障。隨著數(shù)據(jù)價(jià)值的日益凸顯，其保密性和安全性成為

項(xiàng)目活動(dòng)

會(huì)員專(zhuān)區(qū)