您好,歡迎來到深圳市智慧安防行業(yè)協(xié)會——(原深圳市視頻報警安防行業(yè)協(xié)會)
當(dāng)前位置:協(xié)會首頁 > 行業(yè)速遞 > 智能識別技術(shù):管住與用好互聯(lián)網(wǎng)大數(shù)據(jù)

智能識別技術(shù):管住與用好互聯(lián)網(wǎng)大數(shù)據(jù)

時間:2017-10-10 17:47:16 來源:砍柴網(wǎng) 作者:未知

內(nèi)容摘要:隨著互聯(lián)網(wǎng)多模態(tài)數(shù)據(jù)的大量出現(xiàn)和傳播,“管不住”和“用不好”兩大問題也日益突出。“管不住”是指多模態(tài)大數(shù)據(jù)中隱藏著大量涉恐、涉暴等有害信息,極大地危害著國家安全和社會穩(wěn)定,目前還缺乏自動的分析與識別技術(shù)。
互聯(lián)網(wǎng)發(fā)展之初受到網(wǎng)絡(luò)帶寬、數(shù)據(jù)存儲等相關(guān)技術(shù)的限制,信息的傳播以單模態(tài)形式為主,如文字報道、圖像相冊等。進入大數(shù)據(jù)時代,信息的傳播變得豐富多彩,人們從互聯(lián)網(wǎng)中同時接受圖像、視頻、文本等不同模態(tài)的信息。例如,當(dāng)我們在互聯(lián)網(wǎng)上瀏覽一篇精彩的新聞報道時,不僅可以看到詳細(xì)的文字描述,還能看到記者在現(xiàn)場拍攝的照片,甚至還有相關(guān)的視頻報道。這體現(xiàn)了互聯(lián)網(wǎng)數(shù)據(jù)從單模態(tài)到多模態(tài)的轉(zhuǎn)變。



智能識別技術(shù)讓計算機看懂世界

隨著互聯(lián)網(wǎng)多模態(tài)數(shù)據(jù)的大量出現(xiàn)和傳播,“管不住”和“用不好”兩大問題也日益突出?!肮懿蛔 笔侵付嗄B(tài)大數(shù)據(jù)中隱藏著大量涉恐、涉暴等有害信息,極大地危害著國家安全和社會穩(wěn)定,目前還缺乏自動的分析與識別技術(shù)?!坝貌缓谩笔侵脯F(xiàn)有技術(shù)一般是單模態(tài)分析與識別,僅針對信息有限的單模態(tài)數(shù)據(jù),難以對多模態(tài)數(shù)據(jù)進行有效利用。如何讓計算機看懂世界,實現(xiàn)對互聯(lián)網(wǎng)多模態(tài)大數(shù)據(jù)的有效監(jiān)管與利用,是目前急需解決的重大問題。

針對上述問題,北京大學(xué)彭宇新教授團隊在國家自然科學(xué)基金、國家863計劃、國家科技支撐計劃等支持下,歷經(jīng)10余年技術(shù)攻關(guān),在圖像視頻概念檢測、視覺目標(biāo)檢測、多模態(tài)數(shù)據(jù)分析與識別、互聯(lián)網(wǎng)輿情監(jiān)測四個方面取得了多項重大技術(shù)突破和發(fā)明創(chuàng)新。在2016年北京市科學(xué)技術(shù)獎評選中,“互聯(lián)網(wǎng)多模態(tài)內(nèi)容分析與識別關(guān)鍵技術(shù)及應(yīng)用”項目榮獲一等獎。

突破單模態(tài)分析與識別技術(shù)

單模態(tài)分析與識別是突破互聯(lián)網(wǎng)多模態(tài)內(nèi)容識別的基礎(chǔ)和關(guān)鍵技術(shù)。圖像、視頻和文本是單模態(tài)信息的重要形式,如何使計算機能夠自動分析與識別圖像、視頻和文本的內(nèi)容便成為了研究與應(yīng)用的難點問題。

圖像、視頻中一般包含某種語義概念,如籃球比賽、奧運會等;同時也包含視覺目標(biāo),如行人、汽車、旗幟等。

“雖然人類能夠很容易地識別與理解這些概念與目標(biāo),但在計算機看來,數(shù)字圖像就是由一個個像素點構(gòu)成,這樣人類的語義概念及視覺目標(biāo)與計算機看到的二進制數(shù)值之間就存在難以逾越的‘語義鴻溝’。”北京大學(xué)彭宇新說。

由于圖像、視頻的語義概念比較抽象、視覺目標(biāo)復(fù)雜多變,如“奧運會”這一概念很難從視覺上準(zhǔn)確定義,而“旗幟”等目標(biāo)不具有固定的形態(tài),導(dǎo)致計算機自動分析與識別的難度很大。

彭宇新團隊針對圖像視頻概念檢測難題,發(fā)明了基于注意力模型和增量深度學(xué)習(xí)的分類方法,一方面注意力模型能夠定位圖像的顯著性區(qū)域以提高檢測精度;另一方面增量學(xué)習(xí)在新概念增加過程中,能夠利用已經(jīng)學(xué)習(xí)到的知識加速新知識學(xué)習(xí),同時通過動態(tài)擴容以支持新概念的檢測。該方法使得特定概念的檢測精度突破90%。針對復(fù)雜場景下視覺目標(biāo)檢測問題,發(fā)明了級聯(lián)分類器與極角拓?fù)浼s束相結(jié)合的判別方法,一方面通過級聯(lián)分類器從海量數(shù)據(jù)中快速篩選出可能包含特定目標(biāo)的候選區(qū)域,加快檢測速度;另一方面通過極角拓?fù)浼s束對候選區(qū)域進行二次判別,提高檢測精度。該方法提高了低分辨率、形變、仿射變換等復(fù)雜情況下的檢測效果,使得特定視覺目標(biāo)檢測精度突破90%?;谏鲜鲅芯砍晒?,彭宇新教授團隊參加了國際權(quán)威評測TRECVID的視頻高層概念檢測比賽,獲得第一名,參賽隊伍包括卡內(nèi)基梅隆大學(xué)、牛津大學(xué)、IBMWatson研究中心等國際著名大學(xué)和研究機構(gòu)。

在文本內(nèi)容分析上,熱點話題檢測與敏感信息發(fā)現(xiàn)是互聯(lián)網(wǎng)輿情監(jiān)測的兩個主要應(yīng)用需求。熱點話題與敏感信息通常包含特定的人名、地名、機構(gòu)名等實體信息,有效地識別實體信息是文本內(nèi)容分析的關(guān)鍵。針對上述問題,項目團隊發(fā)明了基于知識元的多模態(tài)語義分析方法和基于情感觀點的話題追蹤方法,有效解決了互聯(lián)網(wǎng)內(nèi)容的語言規(guī)范性差、噪音大、時效性高導(dǎo)致實體難以識別和利用的問題。在國際權(quán)威評測TREC2014年和2015年的微博信息檢索比賽中獲得第一名。

多模態(tài)內(nèi)容的語義協(xié)同

“與互聯(lián)網(wǎng)數(shù)據(jù)的發(fā)展趨勢一樣,我們的研究思路也是從‘單’到‘多’,以單模態(tài)內(nèi)容的分析與識別技術(shù)為基礎(chǔ),重點研究多模態(tài)內(nèi)容的分析與識別技術(shù)。”彭宇新說到。

多模態(tài)數(shù)據(jù)在語義表達上具有“共通性”,在內(nèi)容上也是互相關(guān)聯(lián)的。據(jù)此,項目團隊提出了基于多模態(tài)分解與融合的語義協(xié)同方法,綜合分析圖像、視頻、文本等多模態(tài)內(nèi)容以獲得更加全面準(zhǔn)確的識別結(jié)果,并通過跨模態(tài)語義互補性實現(xiàn)多模態(tài)數(shù)據(jù)的綜合分析與有效利用。

項目團隊首先提出了多模態(tài)分解方法,能夠?qū)Π环N或多種模態(tài)的輸入數(shù)據(jù),按照模態(tài)的不同自動分發(fā)到對應(yīng)的分析與識別模塊。例如,對于視頻,首先進行鏡頭分割和關(guān)鍵幀提取,然后分發(fā)到鏡頭檢索、片斷檢索、概念檢測、視覺目標(biāo)檢測、人臉識別和視頻字幕識別等模塊?;诙嗄B(tài)信息的分發(fā)結(jié)果,對各模態(tài)內(nèi)容分別進行分析與識別,提取文本、圖像、視頻鏡頭、視頻片斷、視覺對象(如視覺目標(biāo)、人臉)等語義描述信息。進一步對多模態(tài)數(shù)據(jù)進行關(guān)聯(lián)分析,構(gòu)建多模態(tài)關(guān)聯(lián)圖來融合不同模態(tài)的分析結(jié)果,從跨模態(tài)關(guān)聯(lián)層面糾正單模態(tài)語義描述中的錯誤結(jié)果,以實現(xiàn)多模態(tài)信息的語義協(xié)同優(yōu)化。

基于上述成果,項目團隊于2009年—2016年多次參加國際權(quán)威評測TRECVID的視頻語義搜索比賽,均獲得第一名。

管住與用好互聯(lián)網(wǎng)大數(shù)據(jù)

“除了‘科技頂天’,在關(guān)鍵核心技術(shù)上取得突破,我們也追求‘市場立地’,將我們的技術(shù)實現(xiàn)產(chǎn)業(yè)化,服務(wù)于社會。這也是我們北大計算機研究所的創(chuàng)立者王選院士對我們的要求?!迸碛钚抡f道。

瞄準(zhǔn)互聯(lián)網(wǎng)大數(shù)據(jù)“管不住”和“用不好”這兩大難題,項目團隊以上述技術(shù)為核心,形成了互聯(lián)網(wǎng)多模態(tài)內(nèi)容分析與識別系統(tǒng)、方正智思互聯(lián)網(wǎng)輿情監(jiān)測分析系統(tǒng)、方正智思智能分析系統(tǒng)等系列產(chǎn)品,實現(xiàn)了對互聯(lián)網(wǎng)文本、圖像、視頻等多模態(tài)內(nèi)容的全面監(jiān)測與數(shù)據(jù)利用。

項目團隊的系統(tǒng)和產(chǎn)品已成功應(yīng)用于國家相關(guān)部門等上百家重要單位,涵蓋多個行業(yè)領(lǐng)域,在維護我國互聯(lián)網(wǎng)內(nèi)容安全、促進網(wǎng)絡(luò)文化健康發(fā)展等方面發(fā)揮了巨大作用。
企業(yè)資訊
共繪藍圖,2024熵基科技全球合作伙伴大會圓滿成功
近日,以“共繪藍圖”為主題的2024熵基科技全球合作伙伴大會在東莞成功落下帷幕。作為熵基科技規(guī)模最大、面向全球全品類核心伙伴的頂
一文讀懂熵基國密門禁
在數(shù)字化轉(zhuǎn)型的洪流中,信息安全不僅是企業(yè)穩(wěn)健運營的基石,更是公共部門安全無虞的保障。隨著數(shù)據(jù)價值的日益凸顯,其保密性和安全性成為
門禁“隱形冠軍”?是時候重新認(rèn)識熵基科技了
在智慧出入口與身份識別、辦公等領(lǐng)域深耕多年的熵基科技,早已不局限于傳統(tǒng)的門禁與考勤系統(tǒng),而是悄然邁入了智能物聯(lián)(AIoT)的廣闊
項目活動
熱門專題
  • 熵基科技出席數(shù)字經(jīng)濟及智慧城市空間未來應(yīng)用創(chuàng)新峰會
  • 2021年智能安防機器人市場或?qū)⑦M入井噴期
  • 2021年的智慧城市建設(shè)該怎么發(fā)展?聽聽行業(yè)大咖的觀點
  • 達實信息:顛覆傳統(tǒng)經(jīng)營模式 構(gòu)建互聯(lián)網(wǎng)+門禁新時代