摘要:隨著平安城市的推進(jìn)和反恐進(jìn)程加快,對(duì)于安防系統(tǒng)的建設(shè)要求也越來越高。人們對(duì)音頻監(jiān)控已經(jīng)開始重視起來,更多的行業(yè)和場(chǎng)景中對(duì)于影音同步監(jiān)控的需求越來越強(qiáng)烈。
4月5日,“和頤酒店事件”震驚全國(guó)。酒店內(nèi)的視頻監(jiān)控記錄下了一名女子遭遇暴行的全過程。然而,即使在真實(shí)的監(jiān)控畫面面前,仍然有很多網(wǎng)友大呼“不相信”、期待事件的反轉(zhuǎn)。
現(xiàn)在,讓我們來設(shè)想一下。如果頤和酒店的攝像機(jī)集合了音頻系統(tǒng),如果頤和酒店的安保系統(tǒng)里面有音頻系統(tǒng),那么,在畫面+聲音的雙重證據(jù)下,質(zhì)疑的聲音會(huì)不會(huì)少一些,我們離真相是否更近一些?
音頻監(jiān)控在智慧安防中大有可為
音頻監(jiān)控是智慧安防建設(shè)系統(tǒng)的重要組成部分,它是一種防范能力較強(qiáng)的綜合系統(tǒng),直觀、準(zhǔn)確、及時(shí)和信息內(nèi)容豐富,是其突出的特點(diǎn)。
對(duì)于音視頻一體化監(jiān)控來說,攝像機(jī)相當(dāng)于眼睛,拾音器相當(dāng)于耳朵。眼睛看到的圖像和耳朵聽到的聲音通過光纖、網(wǎng)絡(luò)等神經(jīng)系統(tǒng)傳輸?shù)酱鎯?chǔ)服務(wù)器就構(gòu)成一個(gè)完整的音視頻監(jiān)控系統(tǒng),為智慧安防或智慧城市提供 高品質(zhì)完整的基礎(chǔ)數(shù)據(jù)。
傳統(tǒng)的視頻監(jiān)控系統(tǒng)都沒有聲音,就像早期的無聲電影,人們只能看到無聲的影像。而現(xiàn)在很多的智慧安防,已經(jīng)要求增加音頻采集,例如在平安城市、公檢法辦案區(qū)、金融機(jī)構(gòu)、公共交通、教育監(jiān)考、行政服務(wù)、執(zhí)法取證等領(lǐng)域,越來越多的優(yōu)質(zhì)項(xiàng)目需要高清晰、高保真的音視頻同步監(jiān)控系統(tǒng),在優(yōu)質(zhì)安防工程中已凸顯出音頻監(jiān)控的重要性,成為平安城市和智能政務(wù)的新亮點(diǎn)。
音頻監(jiān)控系統(tǒng)及其作用
一套完整的音頻監(jiān)控系統(tǒng)包括拾音器和語音降噪設(shè)備、網(wǎng)絡(luò)錄音對(duì)講系統(tǒng)、音頻智能分析系統(tǒng)。
拾音器:拾音器是音頻監(jiān)控系統(tǒng)的核心,主要是通過聲音的震動(dòng)來采集現(xiàn)場(chǎng)的聲音。拾音器一般分為數(shù)字拾音器和模擬拾音器,數(shù)字拾音器就是通過數(shù)字信號(hào)處理系統(tǒng)將模擬的音頻信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并進(jìn)行相應(yīng)的數(shù)字信號(hào)處理的聲音傳感設(shè)備。模擬拾音器就只是用一般的模擬電路放大咪頭采集到的聲音。
網(wǎng)絡(luò)錄音對(duì)講系統(tǒng):主要包括遠(yuǎn)程錄音系統(tǒng)和對(duì)講系統(tǒng)。一旦采集到聲音,就會(huì)自動(dòng)啟動(dòng)錄音功能,并主要通過語音卡和音箱,實(shí)現(xiàn)實(shí)時(shí)監(jiān)聽的功能。
音頻智能分析系統(tǒng):音頻智能分析類似于視頻監(jiān)控系統(tǒng)中的智能分析。通過聲紋采集和比對(duì),來分析出聲音的具體特征,并能分析出當(dāng)時(shí)的應(yīng)用場(chǎng)景。
智能的音頻系統(tǒng)能做些什么
音頻監(jiān)控經(jīng)過多年的發(fā)展,技術(shù)正趨于成熟。
通過對(duì)聲紋的識(shí)別可以鑒定個(gè)人的身份。人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過程,人在講話時(shí)使用的發(fā)聲器官(舌、牙齒、喉頭、肺、鼻腔)在尺寸和形態(tài)方面差異很大,所以每個(gè)人的聲紋圖譜都有獨(dú)特的,既有相對(duì)穩(wěn)定性,也有一些變異。但盡管如此,由于每個(gè)人的發(fā)音器官都不盡相同,因此在一般情況下,可以通過音頻系統(tǒng)來區(qū)別不同的人的聲音或判斷是否是同一人的聲音。
通過音頻監(jiān)控的場(chǎng)景分析來判斷當(dāng)時(shí)場(chǎng)景下的異常行為。這種技術(shù)是基于各類異常聲音在時(shí)域、頻域的特征,結(jié)合模式識(shí)別的分類方法對(duì)異常事件報(bào)警。
其實(shí),現(xiàn)在已經(jīng)有些廠商的技術(shù)已經(jīng)可以做到通過聲音的識(shí)別來判斷說話人的情緒、所處的環(huán)境等問題。
音頻監(jiān)控的推廣難點(diǎn)
前面說過,傳統(tǒng)的監(jiān)控系統(tǒng)很少有集合音頻系統(tǒng)。只是在特點(diǎn)的項(xiàng)目中,根據(jù)項(xiàng)目需求,才會(huì)在原有的監(jiān)控系統(tǒng)中添加音頻系統(tǒng)。以下的幾方面制約了音頻監(jiān)控在安防行業(yè)的應(yīng)用。
1、成本問題。無論是新建一套完整的音頻系統(tǒng)還是在原有的監(jiān)控系統(tǒng)或是報(bào)警系統(tǒng)中集合音頻產(chǎn)品,都將增加成本,這成為音頻監(jiān)控推廣難的重要原因。同時(shí),在一些除去公安、銀行等行業(yè)中,音頻系統(tǒng)并不是不可或缺,因此再考慮到成本的問題,音頻系統(tǒng)是可以剔除的。
2、技術(shù)難點(diǎn)。在原有的安防系統(tǒng)中集合音頻系統(tǒng)并不是難事,一般技術(shù)層面的難點(diǎn)基本可以解決。但有些特殊的行業(yè),對(duì)于音頻要求極高。在空曠且嘈雜的環(huán)境中,要求音頻系統(tǒng)抗干擾能力強(qiáng)、有強(qiáng)大的去噪音技術(shù)。而特殊安靜環(huán)境,則要求能聽到很細(xì)微的聲音,比如說公安督查的審訊和槍械室,輕微的聲音都可以第一時(shí)間采集到,要求拾音器的靈敏度必須非常高,而且要達(dá)到原聲的效果??傊煌I(lǐng)域的環(huán)境,音頻監(jiān)控設(shè)備的要求也截然不同。而這也正是音頻監(jiān)控技術(shù)標(biāo)準(zhǔn)始終沒有得到統(tǒng)一規(guī)范的重要原因。
3、隱私問題。音頻監(jiān)控提供了便利和安全,也可能帶來隱私問題。有人擔(dān)心,聲紋可以不經(jīng)他們同意來鑒定說話者,是否侵犯他們的隱私和言論自由。這些技術(shù)一旦成熟,它必將產(chǎn)生許多隱私問題,這是非常容易理解的。如何獲得聲紋以及何時(shí)獲得聲紋是合法這個(gè)問題是非常模糊的。
而隨著平安城市的推進(jìn)和反恐進(jìn)程加快,對(duì)于安防系統(tǒng)的建設(shè)要求也越來越高。人們對(duì)音頻監(jiān)控已經(jīng)開始重視起來,更多的行業(yè)和場(chǎng)景中對(duì)于影音同步監(jiān)控的需求越來越強(qiáng)烈。無論是公檢法機(jī)構(gòu),還是機(jī)場(chǎng)、鐵路、銀行等重點(diǎn)單位,越來越多的優(yōu)質(zhì)安防工程急需清晰、逼真的影音同步監(jiān)控系統(tǒng)。