經(jīng)過3天的訓(xùn)練后,這套系統(tǒng)已經(jīng)可以擊敗AlphaGoLee,也就是去年擊敗韓國頂尖棋手李世石的那套系統(tǒng),且比分高達(dá)100比0。經(jīng)過40天訓(xùn)練后,它總計運行了大約2900萬次自我對弈,得以擊敗AlphaGoMaster(今年早些時候擊敗世界冠軍柯潔的系統(tǒng)),比分為89比11。DeepMind團隊將關(guān)于AlphaGoZero的相關(guān)研究以論文的形式,發(fā)表在了《自然》雜志上。
值得注意的是,雖然AlphaGoZero在幾周的訓(xùn)練期間學(xué)會了一些關(guān)鍵概念,但該系統(tǒng)學(xué)習(xí)的方法與人類有所不同。自我學(xué)習(xí)能力的出現(xiàn),對于人工智能和機器學(xué)習(xí)來說,是一個新的突破?!斑^去人們普遍認(rèn)為機器學(xué)習(xí)是基于海量的大數(shù)據(jù),但是從AlphaGoZero身上,我們發(fā)現(xiàn)算法比數(shù)據(jù)更重要?!盇lphaGo項目的主要負(fù)責(zé)人戴維?席爾瓦說道。
這一消息的發(fā)布引發(fā)了網(wǎng)友熱烈的討論,網(wǎng)友紛紛表示,連阿法狗都在努力,你有什么理由逃避。甚至,就連柯潔都回應(yīng)稱:一個純凈、純粹自我學(xué)習(xí)的alphago是最強的...對于alphago的自我進(jìn)步來講...人類太多余了。
阿爾法狗再進(jìn)化有哪些積極意義?
我們可以看到AlphaGoZero與它的前輩們相比,技術(shù)發(fā)展有了質(zhì)的飛躍。AlphaGo此前的版本的學(xué)習(xí),結(jié)合了數(shù)百萬人類圍棋專家的棋譜,以及強化學(xué)習(xí)的監(jiān)督學(xué)習(xí)進(jìn)行了自我訓(xùn)練。AlphaGoZero的能力則在這個基礎(chǔ)上有了質(zhì)的提升,最大的區(qū)別是,它不再需要人類數(shù)據(jù),它一開始就沒有接觸過人類棋譜,研發(fā)團隊只是讓它自由隨意地在棋盤上下棋,然后進(jìn)行自我博弈。值得一提的是,AlphaGoZero還非常“低碳環(huán)?!?,由于算法的提升和數(shù)據(jù)的減少,使得AlphaGoZero只用到了一臺機器和4個TPU,與它前輩AlphaGo用到的48個TPU相比,極大地節(jié)省了資源,這是一個非常偉大的進(jìn)步,是AlphaGoZero帶來的第一個積極意義。
但這僅僅只是很小的一點,AlphaGoZero的誕生還有更大的意義。DeepMind團隊希望通過培養(yǎng)自主學(xué)習(xí)的能力,來解決更多其他領(lǐng)域目前無法解決的棘手問題。
在這次《自然》雜志上發(fā)表的論文中,戴維?席爾瓦表示:在過去,機器學(xué)習(xí)未能得到廣泛應(yīng)用,主要原因之一就在于很多人類無法解決的領(lǐng)域中,也缺少大量的數(shù)據(jù)樣本來讓機器進(jìn)行學(xué)習(xí),例如醫(yī)療圖像處理等。AlphaGoZero能夠擺脫人類的依賴,不需要人類給出數(shù)據(jù)和樣本,這為更廣泛的行業(yè)應(yīng)用提供了新的可能性。
“AlphaGoZero是我們最強版本,它提升了很多。Zero提高了計算效率,并且沒有使用到任何人類圍棋數(shù)據(jù),”DeepMind聯(lián)合創(chuàng)始人兼CEO戴密斯?哈薩比斯說,“最終,我們想要利用它的算法突破,去幫助解決各種緊迫的現(xiàn)實世界問題,如蛋白質(zhì)折疊或設(shè)計新材料。”
“人工智能威脅論”是時候提上日程了
但是,AlphaGoZero誕生的意義,遠(yuǎn)不止于此,也遠(yuǎn)不只是有美好的一面。有很多人對于AlphaGoZero的這種進(jìn)化表示了深切的擔(dān)憂。
果殼網(wǎng)編輯、美國加州伯克利大學(xué)博士生@Ent_evo就是這其中之一,他專門針對這條新聞發(fā)表了一篇博文,在文中評論道:這對人類驕傲感是個很大的打擊。當(dāng)年AlphaGo好歹還學(xué)習(xí)了大量的人類經(jīng)驗,但是AlphaGoZero根本就不需要人類圍棋棋手積攢了這么多年的歷史,人類經(jīng)驗是好是壞,對AI而言完全無關(guān),這是所有AI末世中最令人恐懼的一個場景。
人類被人工智能打敗并不會否認(rèn)掉我們存在的意義,但如果那個第一根本不需要你,根本不在乎你,你做的任何事情都對它的追求沒有影響。如果AI拿走了人類和現(xiàn)實的關(guān)聯(lián),讓人類發(fā)現(xiàn)自己甚至已經(jīng)無法影響自己的歷史進(jìn)程了,這一切會令人恐慌。隨著AI證明自己在越來越多的領(lǐng)域不再需要人,一定會有人反過來無法接受自己不再被需要的事實。當(dāng)一切創(chuàng)造都被接管的時候,大概剩下的也只有毀滅了。
這不禁讓人想起著名物理學(xué)家斯蒂芬?霍金在2017全球移動互聯(lián)網(wǎng)大會(GMIC)發(fā)表的演講。他表示,人工智能的崛起可能是人類文明的終結(jié)。
霍金在會上表示,人工智能的威脅分短期和長期兩種。短期威脅包括自動駕駛、智能性自主武器,以及隱私問題;長期擔(dān)憂主要是人工智能系統(tǒng)失控帶來的風(fēng)險,如人工智能系統(tǒng)可能不聽人類指揮。
這已經(jīng)不是霍金第一次提出“人工智能威脅論”。在今年3月,霍金向英國《獨立報》表示,人類必須建立有效機制盡早識別威脅所在,防止人工智能對人類帶來的威脅進(jìn)一步上升。
總結(jié)
人工智能威脅論的提出由來已久,但是小編個人一直都不以為然。直到AlphaGoZero的出現(xiàn),正如@Ent_evo所說,當(dāng)人工智能不再需要人類,人類的一切對于人工智能來說都無關(guān)緊要的時候,那么人類一定會被逐漸邊緣化,進(jìn)而走向毀滅。不過,霍金先生也表示,雖然他對人工智能有各種擔(dān)憂,但他對人工智能技術(shù)本身還是抱有樂觀的態(tài)度。就像上文提到的那樣,可以預(yù)見的是,在不久的將來,人工智能能夠幫助人類完成很多人類無法企及的任務(wù)。人類到底是會被人工智能無限地幫助,還是無限地被邊緣化,是一件不確定的事,因此,我們也不應(yīng)該因噎廢食,新的技術(shù)我們還是應(yīng)該張開懷抱去迎接。