云端將蓬勃,邊緣將綻放
1996 年底時(shí),康柏公司的兩名高管 George Favaloro 和 Sean O'Sullivan 意識(shí)到無處不在的互聯(lián)網(wǎng)連接存在會(huì)改變信息處理的位置。計(jì)算過程可以在通過互聯(lián)網(wǎng)訪問的服務(wù)器上進(jìn)行,而不是在辦公室服務(wù)器室或桌面上。這種被他們稱為“云”的計(jì)算方式在發(fā)生著這種轉(zhuǎn)變。不過,這個(gè)詞(在那時(shí))并沒有被堅(jiān)持下去,那之后,康柏在 2002 年被惠普吞并。
但是,他們確定的關(guān)于“云”的主題卻扎根了下來。2006 年,當(dāng)時(shí)的谷歌首席執(zhí)行官埃里克施密特說:“我認(rèn)為人們并不真正了解這個(gè)機(jī)會(huì)究竟有多大,它的前提是數(shù)據(jù)服務(wù)和架構(gòu)應(yīng)該在服務(wù)器上。我們稱之為云計(jì)算,他們存在于某個(gè)‘云’上”。
從那時(shí)起,云計(jì)算已成為 IT 企業(yè)發(fā)展最快的領(lǐng)域之一。亞馬遜的 AWS 業(yè)務(wù)部門成立于 11 年前,它有著超過 120 億美元的收入。云計(jì)算為軟件帶來了全新的商業(yè)模式:軟件即服務(wù)模式。這個(gè)模式創(chuàng)建了 Salesforce、Workday 和 Zendesk 等巨頭。
今天,許多企業(yè)計(jì)算都發(fā)生在私有或虛擬私有云的遠(yuǎn)程數(shù)據(jù)中心上。當(dāng)然,企業(yè)計(jì)算是當(dāng)下很重要的。我們有著智能設(shè)備,比如智能手機(jī),平板和功能強(qiáng)大的筆記本電腦。然而,我們作為消費(fèi)者體驗(yàn)的大部分聰明的東西,比如在 Facebook 上的排名內(nèi)容,亞馬遜上推薦的產(chǎn)品,Siri 中響應(yīng)的口頭命令,都發(fā)生在互聯(lián)網(wǎng)這龐然大物擁有的基礎(chǔ)設(shè)施的云端。
這種向“云”的轉(zhuǎn)變并不是計(jì)算中的第一次變化。從大型機(jī)和小型計(jì)算機(jī)轉(zhuǎn)向臺(tái)式個(gè)人計(jì)算機(jī)已經(jīng)將處理器周期從受到嚴(yán)密保護(hù)的計(jì)算機(jī)房轉(zhuǎn)移到數(shù)百萬用戶的個(gè)人辦公桌上。如果你愿意,這就是計(jì)算的邊緣化。這種轉(zhuǎn)變始于 20 世紀(jì) 70 年代中期,并且隨著 DOS 和 IBM PC 標(biāo)準(zhǔn)的發(fā)展而加速到 80 年代。
互聯(lián)網(wǎng)的到來使我們能夠?qū)⒂?jì)算轉(zhuǎn)回“云”,遠(yuǎn)離網(wǎng)絡(luò)邊緣和用戶的桌面。但即將發(fā)生的人工智能海嘯將使云計(jì)算能力的增長(zhǎng),以及計(jì)算能力的轉(zhuǎn)變,從云端又回到網(wǎng)絡(luò)邊緣。
猛烈地發(fā)展,為什么?
最終,你要在被需要的地方提供智能。隨著一切變得聰明,從燈泡到相機(jī),再到簡(jiǎn)單的傳感器,他們需要有自己的能力來決定做什么并最終從身邊環(huán)境中學(xué)習(xí)。
為了大大簡(jiǎn)化過程,一個(gè)智能設(shè)備需要做兩件事。首先是學(xué)習(xí)(或接受訓(xùn)練)其環(huán)境。第二個(gè)是弄清楚(或推斷)在任何階段要做什么。
但今天的 AI 系統(tǒng)在設(shè)備上很少有這些東西。在大多數(shù)情況下,AI 系統(tǒng)(如 Amazon Echo)將數(shù)據(jù)發(fā)送回云服務(wù)器進(jìn)行處理和思考。你的 Echo 就像鸚鵡一樣回應(yīng),它重復(fù)著在全球數(shù)據(jù)中心的某個(gè)服務(wù)器上為它計(jì)算出來的洞察力。
此外,這些設(shè)備不會(huì)從他們的環(huán)境或經(jīng)驗(yàn)中學(xué)習(xí)任何東西。學(xué)習(xí)過程是發(fā)生在云端的。目前,他們通過基于云的人工智能的偶爾更新而變得更聰明。
智能需要本地化的原因是多方面的。一個(gè)原因是延遲。如果需要快速做出決定,那么將數(shù)據(jù)發(fā)送回云端的過程可能對(duì)整個(gè)過程是有害的,這是因?yàn)榘l(fā)送回云端最有可能通過移動(dòng)網(wǎng)絡(luò)并需要等待響應(yīng)。
一個(gè)處在 4G 網(wǎng)絡(luò)的歐洲的設(shè)備要連接到數(shù)據(jù)中心,其延遲可能為 50 毫秒。如果要發(fā)送大量的數(shù)據(jù)(比如來自視頻流的剪輯),那么總的傳輸時(shí)間將會(huì)達(dá)到以秒為單位級(jí)別。即使機(jī)器視覺過程只需要幾毫秒,整個(gè)端到端交易也可能會(huì)持續(xù)一兩秒鐘。
對(duì)于許多應(yīng)用來說,延遲是不可接受的?,F(xiàn)階段沒有哪種運(yùn)輸方式可以依靠云端,無論自動(dòng)駕駛汽車或無人機(jī)。因?yàn)槠囆旭偹俣忍?,而行人太弱。機(jī)器人外科醫(yī)生也不能容忍這種延遲。患者的代謝紊亂不會(huì)等待 IP 數(shù)據(jù)包穿越大西洋到亞馬遜網(wǎng)絡(luò)服務(wù)的服務(wù)器。如果智能門鈴,智能指甲鉗或智能微波爐需要在響應(yīng)簡(jiǎn)單的請(qǐng)求之前有上 1-2 秒的延遲,消費(fèi)者將變得非常不滿。
第二個(gè)原因是設(shè)備很快就需要變得足夠強(qiáng)大才能在網(wǎng)絡(luò)邊緣學(xué)習(xí)。為什么?因?yàn)檫@些設(shè)備將在原地使用,并且他們將越來越多地進(jìn)行環(huán)境化。放置設(shè)備的環(huán)境將是其操作的一個(gè)關(guān)鍵輸入。我知道這在現(xiàn)如今聽起來很奇怪,尤其想到身邊相對(duì)愚蠢的設(shè)備時(shí)。但自治的本質(zhì)就需要去學(xué)習(xí)和適應(yīng)本地環(huán)境。我們希望自動(dòng)駕駛汽車能在行駛時(shí)自動(dòng)處理在巴黎,波特蘭或浦那的道路,這種處理不是基于在帕洛阿爾托廣闊的林蔭大道上學(xué)到的一些柏拉圖式的理想。對(duì)于自動(dòng)駕駛汽車來說是正確的東西,也將會(huì)被運(yùn)用于自動(dòng)護(hù)理器,自動(dòng)吸塵器和自動(dòng)圖書管理器。
然而現(xiàn)如今大部分 AI 系統(tǒng)都沒有這種智能水平。即使他們可以推斷設(shè)備上的行為,他們也很少了解設(shè)備上自身的環(huán)境。大部分學(xué)習(xí)都發(fā)生在云端上面。
是的,推理預(yù)測(cè)(即讓人工智能在給定環(huán)境的當(dāng)前狀態(tài)下預(yù)測(cè)下一步該做什么)顯然是一個(gè)推動(dòng)邊緣的候選者,但這也成為推動(dòng)模型訓(xùn)練(學(xué)習(xí))的必要條件
邊界情況下的訓(xùn)練
人工智能的訓(xùn)練階段傳統(tǒng)上需要比推斷或預(yù)測(cè)階段更多的處理能力。任何父母都知道這一點(diǎn),教孩子如何打開門(訓(xùn)練階段)要比他們知道之后再去打開(推理階段)要困難得多。
舉個(gè)例子,在 2011 年,Google Brain 通過觀看 YouTube 視頻進(jìn)行了訓(xùn)練,來識(shí)別貓和人,它在谷歌的一個(gè)數(shù)據(jù)中心運(yùn)行著 2000 個(gè) CPU。許多開發(fā)人員在云中訓(xùn)練模型,在那里可以存在機(jī)架式 GPU,然后將計(jì)算成本較低的推理模型推向邊緣更便宜的設(shè)備。
但這已經(jīng)開始發(fā)生了變化。蘋果公司的 iPhone 在夜間使用空閑 GPU 周期來了解你的圖片。谷歌最近推出了“聯(lián)合網(wǎng)絡(luò)學(xué)習(xí)”,它可以實(shí)現(xiàn):
更智能的型號(hào),更低的延遲和更低的功耗,同時(shí)還確保隱私性。此方法還有另一個(gè)直接的好處:除了提供共享模型的更新外,更新后的模型可以被立即使用,并通過你使用手機(jī)的方式為個(gè)性化體驗(yàn)提供動(dòng)力。
谷歌應(yīng)用這些智能的一個(gè)例子是他們應(yīng)用在 GBoard Android 鍵盤上的打字預(yù)測(cè)。所有用戶體驗(yàn)到的將是根據(jù)其他用戶行為進(jìn)行改進(jìn)后的預(yù)測(cè)。
我們可能會(huì)看到的是一個(gè)多方面的基礎(chǔ)設(shè)施,其中學(xué)習(xí)過程發(fā)生在網(wǎng)絡(luò)邊緣和云端上。這種聯(lián)合網(wǎng)絡(luò)學(xué)習(xí)將是很有效的。它將允許網(wǎng)絡(luò)從數(shù)千(或數(shù)百萬甚至數(shù)十億)邊緣設(shè)備的經(jīng)驗(yàn)和他們的環(huán)境經(jīng)驗(yàn)中學(xué)習(xí)。但是,在聯(lián)合環(huán)境中,邊緣設(shè)備可以進(jìn)行一些學(xué)習(xí)并且有效率地將增量(或權(quán)重)發(fā)送回云端,其中的中心模型可以被更有效的更新,而不是將原始經(jīng)驗(yàn)數(shù)據(jù)既費(fèi)力又迂腐地發(fā)送回云進(jìn)行分析。
這種機(jī)制可以嵌入有損的方法,比如差分隱私,來確保數(shù)據(jù)庫(kù)中的聚合數(shù)據(jù)不會(huì)泄露關(guān)于特定個(gè)人或他們習(xí)慣的信息。但這仍然允許捕獲數(shù)據(jù)中的重要模式,也同時(shí)保護(hù)個(gè)人隱私。
從云轉(zhuǎn)移到云和邊緣的智能轉(zhuǎn)移軌跡也會(huì)產(chǎn)生其他影響,包括必須制造的芯片類型。
硅在新架構(gòu)上的應(yīng)用
自英特爾 4004 型處理器于 1971 年推出以來,英特爾的通用微處理器,即中央處理器(或稱 CPU ) 一直主導(dǎo)著技術(shù)行業(yè)。幾十年來,英特爾、通用 CPU 和摩爾定律一直是三巨頭。通用 CPU 為我們提供了非常好的服務(wù)。它允許標(biāo)準(zhǔn)操作系統(tǒng)(首先是 DOS,然后是 Windows ) 的出現(xiàn),這創(chuàng)建了一個(gè)公共平臺(tái),而它反過來又降低了 IT 開發(fā)人員和用戶的成本(它還創(chuàng)造了 Wintel 壟斷,這種壟斷首先不是因?yàn)榉磯艛?,而是因?yàn)榛ヂ?lián)網(wǎng)和移動(dòng)電話的出現(xiàn)而被打破)。
然而,由于機(jī)器學(xué)習(xí)的差異化需求,事實(shí)證明 CPU 性能太普通了。更糟糕的是,制造業(yè)和量子物理的局限使得摩爾定律的改進(jìn)停滯不前。2016 年 8 月份的《自然》雜志的封面上以此為標(biāo)題。業(yè)內(nèi)大部分人都同意。
事實(shí)上,目前人工智能投資的繁榮是由通用 CPU 的一個(gè)轉(zhuǎn)變所推動(dòng)的。這是在 2012 年由一個(gè)神經(jīng)網(wǎng)絡(luò)觸發(fā)的,這個(gè)神經(jīng)網(wǎng)絡(luò)運(yùn)行在一對(duì)圖形處理單元(GPU 等)而不是一組 CPU 上。
在研究員 Alex Krizhevsky 和他的同事們贏得 2012 年 Imagenet 競(jìng)賽后,深度神經(jīng)網(wǎng)絡(luò)與 GPU 配對(duì)的優(yōu)勢(shì)變得顯而易見。其余都是近期的歷史。
如果說前 30 年的計(jì)算能夠在通用 CPU 上創(chuàng)造價(jià)值,未來幾十年將在更復(fù)雜的處理體系結(jié)構(gòu)生態(tài)上創(chuàng)造價(jià)值。其中一些已經(jīng)開始出現(xiàn):Nvidia 的 GPU 及其 CUDA 生態(tài)系統(tǒng);谷歌的 TPU 芯片和 Tensorflow 控制軟件;基于人工智能的 FPGAs(可在微軟的 Azure 云中找到);新的神經(jīng)形態(tài)芯片;和快速接近的量子計(jì)算。
從電子游戲到數(shù)學(xué)矩陣
深度學(xué)習(xí)的核心要求是需要執(zhí)行大量(通常是數(shù)十億)的大規(guī)模計(jì)算。現(xiàn)代機(jī)器學(xué)習(xí)方法,基本上是神經(jīng)網(wǎng)絡(luò),代表了所謂張量中的數(shù)據(jù)結(jié)構(gòu)。
理解張量并不簡(jiǎn)單,除非你參加了一門嚴(yán)肅的數(shù)學(xué)課程,或者觀看了這段精彩的 12 分鐘 YouTube 視頻。張量是一種數(shù)學(xué)結(jié)構(gòu),是一種成熟的多維形式的矩陣。簡(jiǎn)單地說,矩陣就是一個(gè)包含值的行和列的表格(就像電子表格)。
神經(jīng)網(wǎng)絡(luò)的 Commons 方法使用矩陣來表示高維數(shù)據(jù)。在一個(gè)簡(jiǎn)單的計(jì)算機(jī)視覺應(yīng)用的基本機(jī)器學(xué)習(xí)模型中,可能需要將數(shù)百或數(shù)千或行或列的矩陣相乘,并且要這樣做很多次。這會(huì)導(dǎo)致數(shù)千萬或數(shù)十億的計(jì)算量。
這些類型的計(jì)算在電子游戲中司空見慣,GPU 最初是在鐵桿 PC 游戲玩家中站穩(wěn)腳跟的。這些 GPU 有專用管道,有數(shù)千個(gè)處理器針對(duì)矩陣數(shù)學(xué)進(jìn)行了優(yōu)化。當(dāng)涉及矩陣計(jì)算時(shí),它們會(huì)把通用 CPU 遠(yuǎn)遠(yuǎn)的丟在身后。
有趣的是,加密貨幣的礦工也喜歡 GPU。在中國(guó),世界上大部分比特幣都是采用加密方式開采,對(duì) GPU 卡的需求使得熱衷游戲的玩家買不到心儀的顯卡。(當(dāng)比特幣價(jià)格下跌時(shí),礦工們迅速將他們的 GPU 卡在 eBay 上出售。)
加速?gòu)埩亢途W(wǎng)絡(luò)
當(dāng)然,如果神經(jīng)網(wǎng)絡(luò)的底層數(shù)據(jù)結(jié)構(gòu)和計(jì)算是通過張量進(jìn)行的,為什么不直接優(yōu)化處理器來處理硅中的張量計(jì)算,而不是將其轉(zhuǎn)換成矩陣表示呢?
谷歌就是這樣做的。它自身巨大的處理需求導(dǎo)致了它開發(fā)自己定制的硅芯片——即傳感器處理單元。TPU 是專為加快谷歌數(shù)據(jù)中心的深度學(xué)習(xí)而設(shè)計(jì)的。這些算法被用于許多谷歌服務(wù),包括谷歌照片和安卓手機(jī)上的語音識(shí)別。這些 TPU 運(yùn)行速度比傳統(tǒng)芯片快 15 - 30 倍。據(jù)估計(jì),TPUs 的使用使得谷歌能夠滿足不斷增長(zhǎng)的深度學(xué)習(xí)需求,并使公司免于建立十幾個(gè)數(shù)據(jù)中心。(更多關(guān)于 TPU 的技術(shù)細(xì)節(jié)可以在谷歌團(tuán)隊(duì)的這篇博客上找到)
Google 一直為其 TPU 做準(zhǔn)備。很快,任何開發(fā)人員都可以在 Google 的云計(jì)算平臺(tái) Google Cloud 上訪問 TPU(通過 Googles TensorFlow 的控制框架)。最初,這將為開發(fā)人員提供 180 萬億次優(yōu)化的深度學(xué)習(xí)處理能力。(該計(jì)劃目前正在進(jìn)行封閉性測(cè)試)
這看起來有點(diǎn)像典型的云軟件生態(tài)系統(tǒng)。硬件是谷歌 TPU,控制軟件是谷歌 TensorFlow,容量提供商和計(jì)費(fèi)接口是谷歌云。目前,TPU 駐留在數(shù)據(jù)中心,還沒有進(jìn)入邊緣設(shè)備。
Google 并不是唯一一個(gè)得出芯片可以針對(duì)張量計(jì)算進(jìn)行優(yōu)化結(jié)論的公司。一家英國(guó)初創(chuàng)公司 Graphcore 得出了類似的結(jié)論。其僅在今年就籌集了超過 6000 多萬美元,正在開發(fā)自己的智能處理單元,本質(zhì)上是另一個(gè)名稱的張量處理單元。這些是為處理網(wǎng)絡(luò)圖而優(yōu)化的芯片。(網(wǎng)絡(luò)圖只是表示編碼神經(jīng)網(wǎng)絡(luò)的高維張量的一種不同的方式)
Graphcore 承諾其專用芯片將在單個(gè)芯片上擁有 1000 多個(gè)獨(dú)立處理器,這大大超過了 Nvidia 的頂級(jí) GPU,并有望擊敗谷歌的第二代 TPU。(為了對(duì) Graphcore 的方法有一個(gè)非常清晰和略有技術(shù)性的介紹,我推薦這位來自 Graphcore 的知情 CTO Simon Knowles 的 30 分鐘的演示)
其他主要公司也在紛紛效仿。微軟已宣布推出專用的硅硬件,以加速其 Azure 云中的深度學(xué)習(xí)。今年 7 月,該公司還透露,其增強(qiáng)現(xiàn)實(shí)耳機(jī) Hololens 將會(huì)有一個(gè)定制芯片,用于優(yōu)化機(jī)器學(xué)習(xí)應(yīng)用。
蘋果公司在為專業(yè)需求設(shè)計(jì)自己的硅產(chǎn)品方面有著悠久的歷史。今年早些時(shí)候,蘋果結(jié)束了與 Imagination Technologies 公司的合作關(guān)系,該公司一直在為 iPhone 中的 GPU 提供設(shè)計(jì)支持,并開展自己的 GPU 設(shè)計(jì)。隨著一套軟件工具 CoreML 的發(fā)布,讓在 iPhone 上的機(jī)器學(xué)習(xí)變得更加容易,我們可以期待被優(yōu)化的芯片將會(huì)隨之而來。英特爾在 CPU 方面的主導(dǎo)地位正受到威脅,它已經(jīng)通過收購(gòu)(如 Altera、Nirna Systems 和 Movidius)以及新的非傳統(tǒng)架構(gòu)的研發(fā)來應(yīng)對(duì)。
結(jié)論
正如我們?cè)诘谝徊糠种兄赋龅哪菢樱斯ぶ悄軐橛?jì)算創(chuàng)造大量的需求。僅僅用一個(gè)例子,為自動(dòng)駕駛車輛提供動(dòng)力,就相當(dāng)于幾個(gè) iPhone 行業(yè)的計(jì)算需求。但這也只是一個(gè)用例。這些要求比摩爾定律更需要改進(jìn)。這一額外需求的大部分將通過芯片設(shè)計(jì)和體系結(jié)構(gòu)的創(chuàng)新以及自 20 世紀(jì) 70 年代以來推動(dòng)該行業(yè)大部分進(jìn)步的通用 CPU 的逐漸減少來滿足。
但光靠這一點(diǎn)還是不夠的。如今,驅(qū)動(dòng)計(jì)算體驗(yàn)的大部分處理都發(fā)生在「云」中。隨著人工智能應(yīng)用變得越來越普遍,我們需要將一些預(yù)測(cè)和學(xué)習(xí)的智能轉(zhuǎn)移到需要的地方。這將導(dǎo)致網(wǎng)絡(luò)邊緣的智能數(shù)量相對(duì)增加。
變化來臨了!
第三十四屆CIO班招生
國(guó)際CIO認(rèn)證培訓(xùn)
首席數(shù)據(jù)官(CDO)認(rèn)證培訓(xùn)
責(zé)編:content
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),請(qǐng)及時(shí)通知本站,予以刪除。