AlphaGo Zero的啟示:企業(yè)正在創(chuàng)新游戲中失敗?
AlphaGo Zero的啟示:企業(yè)正在創(chuàng)新游戲中失敗?
2017-10-30 10:50:41 來源:億歐網(wǎng)
搶沙發(fā)
2017-10-30 10:50:41 來源:億歐網(wǎng)
摘要:科學是一種比體育運動更深入、更混亂的實踐。我們必須繼續(xù)把時間、空間和資金投入到更大、更危險的飛躍上。企業(yè)在關(guān)注人工智能技術(shù)在應(yīng)用層價值的同時,也該對科研能力引起重視。
關(guān)鍵詞:
創(chuàng)新游戲

網(wǎng)易科技訊10月27日消息,據(jù)金融時報報道,我們很難不對人工智能(AI)產(chǎn)生深刻印象,甚至有點兒警惕。1997年,當IBM超級計算機“深藍”擊敗了世界上最偉大的國際象棋選手加里·卡斯帕羅夫 (Garry Kasparov)時,它還是非常昂貴的硬件設(shè)備,并需要人類的密切關(guān)照和指導。
而對于計算機來說,圍棋是比國際象棋更難掌握的游戲??墒?,當AlphaGo在2016年低調(diào)地出現(xiàn)時,并經(jīng)過短短幾個月的訓練后,它輕松地擊敗了世界上最優(yōu)秀的圍棋選手。上周,AI研究公司DeepMind推出了AlphaGo Zero。它的速度更快,使用更少的硬件,曾以100:0的絕對優(yōu)勢擊敗其前身AlphaGo。更值得關(guān)注的是,它完全是自學成才,而且只經(jīng)歷了72小時的練習就取得了這樣的成就。
AlphaGo Zero的研究取得令人震驚的進展,已經(jīng)引發(fā)了人們對機器人導致大規(guī)模失業(yè)的擔憂。然而,這種焦慮與美國、英國令人不安的高就業(yè)率和令人失望的生產(chǎn)率息息相關(guān)。雖然目前還有大量的工作存在,但顯然沒有太多創(chuàng)新。對于這一悖論,有多種可能的解釋,但最簡單的解釋就是:AlphaGo Zero是個異常值。與其相關(guān)的生產(chǎn)力和技術(shù)進步都是毫無意義的,因為AlphaGo Zero背后的研究并不是我們試圖創(chuàng)造新想法的典型方式。
卡斯帕羅夫?qū)@個問題的看法讓人著迷。他在最近的著作《深度思考》(Deep Thinking)中,引用了已故計算機科學家阿蘭·珀利斯(Alan Perlis)的名言,即“優(yōu)化過程阻礙了進化!”在計算機象棋的例子中,珀利斯的格言可以解釋為:研究人員選擇實用的捷徑方式來獲得快速結(jié)果,而更深入、更危險的研究卻被忽略掉。IBM“深藍”的重點不是獲得知識,而是取得勝利,但勝利的終點在科學上往往意味著進入“死胡同”。
這是一個恥辱。像阿蘭·圖靈(Alan Turing)和克勞德·香農(nóng)(Claude Shannon)這樣的計算機先驅(qū)們認為,國際象棋可能是一個可以在更有意義的領(lǐng)域發(fā)展AI的研究課題。這種希望很快被殘酷的力量所排擠,這種方法只會教我們很少的知識,但卻在國際象棋中表現(xiàn)得很強大。
很容易看出,為什么商業(yè)公司對如今由AlphaGo所提煉的早期模式識別技術(shù)幾乎不感興趣的原因??ㄋ古亮_夫描述了在國際象棋中使用這種模式的方式:機器認為,當它們犧牲了自己的皇后時,很快就贏得了比賽。這臺機器由此得出結(jié)論,爭取每次獲勝機會都要犧牲自己的皇后。
然而最終,這些模式識別技術(shù)已被證明,遠比最好的象棋程序所使用的方法更加強大和普遍適用。問題是,我們是否希望改變自己的世界,或者僅僅是想要贏得一場國際象棋比賽。這不僅僅是一個關(guān)于國際象棋的警示故事。在其他方面,企業(yè)似乎也正在收斂野心。企業(yè)研究實驗室曾經(jīng)資助過許多最重要的基礎(chǔ)研究,比如曾在索尼和IBM工作的江崎玲于奈(Jack Kilby)贏得了諾貝爾物理學獎,德州儀器的杰克·基爾比(Jack Kilby)也是如此,通用電氣公司的歐文·朗繆爾(Irving Langmuir)贏得諾貝爾化學。貝爾實驗室有太多的諾貝爾獎得主,還有香農(nóng)本人。
這是一個公司敢于投資基礎(chǔ)科學的時代。然而,這種情況已經(jīng)改變了,正如三位經(jīng)濟學家阿希什·阿羅拉(Ashish Arora)、沙隆·莎朗·貝倫佐(Sharon Belenzon)以及安德烈·帕塔科尼(Andrea Patacconi)研究報告所顯示的那樣:企業(yè)仍在大力投資創(chuàng)新,但重點放在實際應(yīng)用上,而非基礎(chǔ)科學上。研究往往外包給更小的機構(gòu),而這些機構(gòu)的知識產(chǎn)權(quán)很容易被買賣。
企業(yè)研究人員提出更多專利,但在學術(shù)期刊上卻不那么顯眼。正如阿羅拉教授所言,研究和開發(fā)已經(jīng)變得“研究更少、開發(fā)更多”。他說,AlphaGo的研究是一個例外。這很重要,因為大多數(shù)基礎(chǔ)研究最終都被應(yīng)用在商業(yè)上。我們喜歡“金蛋”,但我們可能會餓死“金鵝”。
如果像大學這樣的研究機構(gòu)填補了這個空白,所有這些都不應(yīng)該是災難性的。然而,這并不是理所當然的事情。正如經(jīng)濟學家本杰明·瓊斯(Benjamin Jones)所記錄的那樣,新的想法很難找到。其中一個跡象就是研究團隊的復雜性,他們的規(guī)模更大,充滿了越來越專業(yè)研究人員,而且成本越來越高。
或許,簡單地勸說公司在基礎(chǔ)研究上投入更多資金是幼稚的,但總得有人去做。一個有趣的方法是政府為“創(chuàng)新突破”提供獎勵。這樣的獎項調(diào)動了公共資金,制定出公共目標,同時也調(diào)動了私營部門的靈活性和多樣性。但是這種獎勵只在特定的情況下起作用。
舉例來說,職業(yè)體育已經(jīng)成為“邊際收益”的流行趨勢,即快速優(yōu)化以尋找最微小的優(yōu)勢。事實證明,幾十年前,企業(yè)研究也出現(xiàn)了同樣的轉(zhuǎn)變。邊際改善并沒有什么錯,但決不能允許它們進行更多的投機研究??茖W是一種比體育運動更深入、更混亂的實踐。我們必須繼續(xù)把時間、空間和資金投入到更大、更危險的飛躍上。
第三十四屆CIO班招生
國際CIO認證培訓
首席數(shù)據(jù)官(CDO)認證培訓
責編:yulina
免責聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個人認為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,請及時通知本站,予以刪除。