摘要:今年早些時候,Google DeepMind的AlphaGo打敗了韓國的圍棋大師李世乭九段。在媒體描述DeepMind勝利的時候,將人工智能(AI)、機器學習(machine learning)和深度學習(deep learning)都用上了。這三者在AlphaGo擊敗李世乭的過程中都起了作用,但它們說的并不是一回事。
有人說,人工智能(AI)是未來,人工智能是科幻,人工智能也是我們日常生活中的一部分。這些評價可以說都是正確的,就看你指的是哪一種人工智能。
今年早些時候,Google DeepMind的AlphaGo打敗了韓國的圍棋大師李世乭九段。在媒體描述DeepMind勝利的時候,將人工智能(AI)、機器學習(machine learning)和深度學習(deep learning)都用上了。這三者在AlphaGo擊敗李世乭的過程中都起了作用,但它們說的并不是一回事。
今天我們就用最簡單的方法——同心圓,可視化地展現(xiàn)出它們三者的關系和應用。
摘要:其實全景攝像機在十幾年前就有了,但它始終無法吸引人們的眼球,“輕如鴻毛”一般的茍活了十幾年。就在這兩年,全景攝像機站在高清的風口上,以細分市場的特色需求突然間,就火了。
在那個青蔥萌得出一把老血的年代,曾天真的以為攝像機除了“槍機”以外應該還有種東西叫做“炮機”,能一看看一片的那種。后來當找到全景攝像機才感慨:原來你丫就是!
其實全景攝像機在十幾年前就有了,但它始終無法吸引人們的眼球,“輕如鴻毛”一般的茍活了十幾年。就在這兩年,全景攝像機站在高清的風口上,以細分市場的特色需求突然間,就火了。
全景攝像機的優(yōu)勢也無需贅述,其以獨立實現(xiàn)大范圍無死角監(jiān)控的優(yōu)勢,吸引了業(yè)內許多設備開發(fā)商以及終端用戶的關注。今年,許多廠商開始步伐一致的推全景攝像機,很多產品陷入高度的同質化之中。從外觀到工藝再到功能,相似者十之八九,總是那么的不謀而合。隨便拿出一款產品或許就會與其他品牌撞個滿懷。接下來,不用想,如果沒有新的亮點或提前產品升級,就等著新一輪的價格混戰(zhàn)。
似乎,行業(yè)愈發(fā)成熟,產品的區(qū)分度就會變得愈發(fā)微弱,而行業(yè)的許多尷尬卻會顯得愈發(fā)明顯。
千篇一律的同質化,廠商們知而為之?
從實際來說,安防廠商們知而為之的背后,實則是既有底蘊不足的歷史痼疾,也更有安防廠商們對現(xiàn)實的無奈、妥協(xié)與幻想。
從底蘊來講,無論是工業(yè)設計能力還是在核心元器件上,安防品牌廠商都不是強勢者。在工業(yè)設計上,國產工業(yè)設計“尚處于起步階段”。而在核心元器件的控制能力上同樣如此,安防品牌廠商中絕大多數(shù)并不具備核心元器件的控制能力。在行業(yè)成功者的先發(fā)優(yōu)勢下,要獲取競爭力,其實可供選擇的區(qū)間并不大。
在此現(xiàn)實下,我們可以姑且認為,安防廠商們千篇一律的同質化,在很大程度上不是不想有所改變,而是心有余而力不足,臣妾做不到啊。
但從實際來說,底蘊不足,核心元器件可供選擇的區(qū)間不大,只是同質化的表象、誘因。更為主要的原因則是廠商們對現(xiàn)實的妥協(xié)和對跟隨戰(zhàn)略所抱有的幻想。
安防品牌廠商如此為之,實則是廠商在對消費者口味喜好研究之下做出的選擇。實際上廠商必然是知道什么樣的產品能夠引領消費新趨勢。面對被市場高度接受的產品,就像之前的SDI、AHD、CVI、TVI,現(xiàn)在的全景攝像機,廠商采取跟隨戰(zhàn)略,一方面能夠降低自身的試誤成本和用戶教育成本,而另一方面則能夠降低消費者的決策風險,實現(xiàn)雙方利益的最大化。所以采取跟隨戰(zhàn)略,實則是保險舉措,在理論上,雖不能大紅大紫,但至少能夠求得一個安穩(wěn)。
全景攝像機到底怎么玩出新意?
在攝像機前端,我們發(fā)現(xiàn),全景攝像機在很多領域還是有著廣闊的應用前景。其實,安防廠商選擇推全景攝像機并沒有錯,但為什么很多企業(yè)推出新品卻賣不好或沒有好利潤,全景攝像機該怎么玩出新意?
1、清晰度。你的全景升級200萬了嗎?
目前,市場上普遍推的全景攝像機在清晰度上,用戶體驗并不好。如多鏡頭全景攝像機,是通過對分畫面進行圖像拼接操作得到全景效果。換句話說就是:類似于將多臺槍機照向不同方向,再把畫面拼起來,將四個單獨的畫面按用戶需求集成為180°或者360°的高清全景畫面,很多廠商虛報清晰度參數(shù),這種情況下,單獨看某個區(qū)域的監(jiān)控畫面,清晰度根本不夠,更別提后期的人臉識別、智能分析延展了。
現(xiàn)在,市場上一般推的是100萬-130萬的全景攝像機,不僅個別產品價格上已經(jīng)開始做爛了,因清晰度限制,產品在圍繞清晰度所做的差異化功能開發(fā)極為有限。因此,產業(yè)鏈頂端芯片商海思、國科等開始在市場上推出200萬全景攝像機芯片。200萬像素升級是必然趨勢。那有企業(yè)就要出來說兩句了,價格戰(zhàn)已經(jīng)打的這么厲害了,200萬價格貴,升級了也不一定起量啊。
不過在推動產業(yè)升級這條艱巨的路上,芯片商把終端市場心理需求已經(jīng)一起考慮進去了。目前,國內芯片商以高性能高性價比優(yōu)勢,贏得廣闊市場,并且不斷技術升級,推動產品更新?lián)Q代。例如,芯片商國科從去年開始進入安防IPC市場,一直主張的是不打價格戰(zhàn),并且為了下游品牌廠商盡量避免同質化,在芯片的開發(fā)上不僅發(fā)力技術創(chuàng)新,而且在芯片應用的差異化上也下了很多功夫。
對于廠家來講,推出全景攝像機200萬,僅僅只是像素上的第一步升級,與此同時,H.265的升級也是勢在必行。真正達到了高清并解決了碼流的問題,那么更多差異化功能的開發(fā),如智能分析、人臉識別、車牌識別、大數(shù)據(jù)等應用便是水到渠成了。對于產業(yè)升級的新市場,少數(shù)有前瞻性的企業(yè)已經(jīng)快速跟上市場發(fā)展的節(jié)奏。
2、定位。你的產品和品牌夠識別度嗎?
長著網(wǎng)紅的臉,卻分不清誰是誰?,F(xiàn)在全景攝像機市場,滿大街的公模。就算在功能技術上沒有特別大的優(yōu)勢,至少你的產品或品牌也要能像papi醬樣有識別度吧。
好,你說我又沒有技術功能優(yōu)勢,又沒有papi醬的識別度,那你就只能通過勤奮努力,塑造一個像王寶強一樣絕對讓人信任的品牌,就算是離婚,所有的粉絲也是站在寶寶這邊的……
總的說,中小安防企業(yè)在當下怎么活?在此,一句此前已經(jīng)說過無數(shù)次的話,其實也同樣適用:那些堅持挖掘自身獨特優(yōu)勢,能夠打造出具備產品區(qū)分度的廠商,在產業(yè)升級時代,雖然面臨強大競爭壓力,但是在垂直細分領域,其實具備更大的發(fā)展勢能,可以很好的活。
如上圖,人工智能是最早出現(xiàn)的,也是最大、最外側的同心圓;其次是機器學習,稍晚一點;最內側,是深度學習,當今人工智能大爆炸的核心驅動。
五十年代,人工智能曾一度被極為看好。之后,人工智能的一些較小的子集發(fā)展了起來。先是機器學習,然后是深度學習。深度學習又是機器學習的子集。深度學習造成了前所未有的巨大的影響。
| 從概念的提出到走向繁榮
1956年,幾個計算機科學家相聚在達特茅斯會議(Dartmouth Conferences),提出了“人工智能”的概念。其后,人工智能就一直縈繞于人們的腦海之中,并在科研實驗室中慢慢孵化。之后的幾十年,人工智能一直在兩極反轉,或被稱作人類文明耀眼未來的預言;或者被當成技術瘋子的狂想扔到垃圾堆里。坦白說,直到2012年之前,這兩種聲音還在同時存在。
過去幾年,尤其是2015年以來,人工智能開始大爆發(fā)。很大一部分是由于GPU的廣泛應用,使得并行計算變得更快、更便宜、更有效。當然,無限拓展的存儲能力和驟然爆發(fā)的數(shù)據(jù)洪流(大數(shù)據(jù))的組合拳,也使得圖像數(shù)據(jù)、文本數(shù)據(jù)、交易數(shù)據(jù)、映射數(shù)據(jù)全面海量爆發(fā)。
讓我們慢慢梳理一下計算機科學家們是如何將人工智能從最早的一點點苗頭,發(fā)展到能夠支撐那些每天被數(shù)億用戶使用的應用的。
| 人工智能(Artificial Intelligence)——為機器賦予人的智能
早在1956年夏天那次會議,人工智能的先驅們就夢想著用當時剛剛出現(xiàn)的計算機來構造復雜的、擁有與人類智慧同樣本質特性的機器。這就是我們現(xiàn)在所說的“強人工智能”(General AI)。這個無所不能的機器,它有著我們所有的感知(甚至比人更多),我們所有的理性,可以像我們一樣思考。
人們在電影里也總是看到這樣的機器:友好的,像星球大戰(zhàn)中的C-3PO;邪惡的,如終結者。強人工智能現(xiàn)在還只存在于電影和科幻小說中,原因不難理解,我們還沒法實現(xiàn)它們,至少目前還不行。
我們目前能實現(xiàn)的,一般被稱為“弱人工智能”(Narrow AI)。弱人工智能是能夠與人一樣,甚至比人更好地執(zhí)行特定任務的技術。例如,Pinterest上的圖像分類;或者Facebook的人臉識別。
這些是弱人工智能在實踐中的例子。這些技術實現(xiàn)的是人類智能的一些具體的局部。但它們是如何實現(xiàn)的?這種智能是從何而來?這就帶我們來到同心圓的里面一層,機器學習。
| 機器學習—— 一種實現(xiàn)人工智能的方法
機器學習最基本的做法,是使用算法來解析數(shù)據(jù)、從中學習,然后對真實世界中的事件做出決策和預測。與傳統(tǒng)的為解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數(shù)據(jù)來“訓練”,通過各種算法從數(shù)據(jù)中學習如何完成任務。
機器學習直接來源于早期的人工智能領域。傳統(tǒng)算法包括決策樹學習、推導邏輯規(guī)劃、聚類、強化學習和貝葉斯網(wǎng)絡等等。眾所周知,我們還沒有實現(xiàn)強人工智能。早期機器學習方法甚至都無法實現(xiàn)弱人工智能。
機器學習最成功的應用領域是計算機視覺,雖然也還是需要大量的手工編碼來完成工作。人們需要手工編寫分類器、邊緣檢測濾波器,以便讓程序能識別物體從哪里開始,到哪里結束;寫形狀檢測程序來判斷檢測對象是不是有八條邊;寫分類器來識別字母“ST-O-P”。使用以上這些手工編寫的分類器,人們總算可以開發(fā)算法來感知圖像,判斷圖像是不是一個停止標志牌。
這個結果還算不錯,但并不是那種能讓人為之一振的成功。特別是遇到云霧天,標志牌變得不是那么清晰可見,又或者被樹遮擋一部分,算法就難以成功了。這就是為什么前一段時間,計算機視覺的性能一直無法接近到人的能力。它太僵化,太容易受環(huán)境條件的干擾。
隨著時間的推進,學習算法的發(fā)展改變了一切。
| 深度學習——一種實現(xiàn)機器學習的技術
人工神經(jīng)網(wǎng)絡(Artificial Neural Networks)是早期機器學習中的一個重要的算法,歷經(jīng)數(shù)十年風風雨雨。神經(jīng)網(wǎng)絡的原理是受我們大腦的生理結構——互相交叉相連的神經(jīng)元啟發(fā)。但與大腦中一個神經(jīng)元可以連接一定距離內的任意神經(jīng)元不同,人工神經(jīng)網(wǎng)絡具有離散的層、連接和數(shù)據(jù)傳播的方向。
例如,我們可以把一幅圖像切分成圖像塊,輸入到神經(jīng)網(wǎng)絡的第一層。在第一層的每一個神經(jīng)元都把數(shù)據(jù)傳遞到第二層。第二層的神經(jīng)元也是完成類似的工作,把數(shù)據(jù)傳遞到第三層,以此類推,直到最后一層,然后生成結果。
每一個神經(jīng)元都為它的輸入分配權重,這個權重的正確與否與其執(zhí)行的任務直接相關。最終的輸出由這些權重加總來決定。
我們仍以停止(Stop)標志牌為例。將一個停止標志牌圖像的所有元素都打碎,然后用神經(jīng)元進行“檢查”:八邊形的外形、救火車般的紅顏色、鮮明突出的字母、交通標志的典型尺寸和靜止不動運動特性等等。神經(jīng)網(wǎng)絡的任務就是給出結論,它到底是不是一個停止標志牌。神經(jīng)網(wǎng)絡會根據(jù)所有權重,給出一個經(jīng)過深思熟慮的猜測——“概率向量”。
這個例子里,系統(tǒng)可能會給出這樣的結果:86%可能是一個停止標志牌;7%的可能是一個限速標志牌;5%的可能是一個風箏掛在樹上等等。然后網(wǎng)絡結構告知神經(jīng)網(wǎng)絡,它的結論是否正確。
即使是這個例子,也算是比較超前了。直到前不久,神經(jīng)網(wǎng)絡也還是為人工智能圈所淡忘。其實在人工智能出現(xiàn)的早期,神經(jīng)網(wǎng)絡就已經(jīng)存在了,但神經(jīng)網(wǎng)絡對于“智能”的貢獻微乎其微。主要問題是,即使是最基本的神經(jīng)網(wǎng)絡,也需要大量的運算。神經(jīng)網(wǎng)絡算法的運算需求難以得到滿足。
不過,還是有一些虔誠的研究團隊,以多倫多大學的Geoffrey Hinton為代表,堅持研究,實現(xiàn)了以超算為目標的并行算法的運行與概念證明。但也直到GPU得到廣泛應用,這些努力才見到成效。
我們回過頭來看這個停止標志識別的例子。神經(jīng)網(wǎng)絡是調制、訓練出來的,時不時還是很容易出錯的。它最需要的,就是訓練。需要成百上千甚至幾百萬張圖像來訓練,直到神經(jīng)元的輸入的權值都被調制得十分精確,無論是否有霧,晴天還是雨天,每次都能得到正確的結果。
只有這個時候,我們才可以說神經(jīng)網(wǎng)絡成功地自學習到一個停止標志的樣子;或者在Facebook的應用里,神經(jīng)網(wǎng)絡自學習了你媽媽的臉;又或者是2012年吳恩達(Andrew Ng)教授在Google實現(xiàn)了神經(jīng)網(wǎng)絡學習到貓的樣子等等。
吳教授的突破在于,把這些神經(jīng)網(wǎng)絡從基礎上顯著地增大了。層數(shù)非常多,神經(jīng)元也非常多,然后給系統(tǒng)輸入海量的數(shù)據(jù),來訓練網(wǎng)絡。在吳教授這里,數(shù)據(jù)是一千萬YouTube視頻中的圖像。吳教授為深度學習(deep learning)加入了“深度”(deep)。這里的“深度”就是說神經(jīng)網(wǎng)絡中眾多的層。
現(xiàn)在,經(jīng)過深度學習訓練的圖像識別,在一些場景中甚至可以比人做得更好:從識別貓,到辨別血液中癌癥的早期成分,到識別核磁共振成像中的腫瘤。Google的AlphaGo先是學會了如何下圍棋,然后與它自己下棋訓練。它訓練自己神經(jīng)網(wǎng)絡的方法,就是不斷地與自己下棋,反復地下,永不停歇。
| 深度學習,給人工智能以璀璨的未來
深度學習使得機器學習能夠實現(xiàn)眾多的應用,并拓展了人工智能的領域范圍。深度學習摧枯拉朽般地實現(xiàn)了各種任務,使得似乎所有的機器輔助功能都變?yōu)榭赡?。無人駕駛汽車,預防性醫(yī)療保健,甚至是更好的電影推薦,都近在眼前,或者即將實現(xiàn)。
人工智能就在現(xiàn)在,就在明天。有了深度學習,人工智能甚至可以達到我們暢想的科幻小說一般。你的C-3PO我拿走了,你有你的終結者就好了。