并行計算的興起:為什么GPU將在邊緣AI領(lǐng)域超越NPU
人工智能 (AI) 不僅僅是一項技術(shù)突破,它還是軟件編寫、理解和執(zhí)行方式的永久演變。建立在確定性邏輯和大部分順序處理之上的傳統(tǒng)軟件開發(fā)正在讓位于一種新的范式:概率模型、訓練有素的行為和數(shù)據(jù)驅(qū)動的計算。這不是一個轉(zhuǎn)瞬即逝的趨勢。AI 代表了計算機科學的根本性和不可逆轉(zhuǎn)的轉(zhuǎn)變 — 從基于規(guī)則的編程到基于學習的自適應系統(tǒng),這些系統(tǒng)越來越多地集成到更廣泛的計算問題和功能中。
本文引用地址:http://www.ekcard.cn/article/202506/471575.htm這種轉(zhuǎn)變需要對為其提供支持的硬件進行相應的更改。在 AI 架構(gòu)和算法不斷變化的世界中(現(xiàn)在和將來),為狹義定義的任務構(gòu)建高度專業(yè)化芯片的舊模型不再可擴展。為了滿足 AI 不斷變化的需求(尤其是在邊緣領(lǐng)域),我們需要與它們運行的工作負載一樣具有動態(tài)性和適應性的計算平臺。
這就是為什么通用并行處理器 (GPU) 正在成為邊緣 AI 的未來,取代了神經(jīng)處理單元 (NPU) 等專用處理器。這不僅僅是性能問題,還關(guān)乎靈活性、可擴展性以及與軟件本身未來的一致性。
牧本波和靈活性的回歸
要理解這種轉(zhuǎn)變,我們只需要看看 Makimoto 的 Wave,這是 Hitachi 的 Tsugio Makimoto 提出的一個概念。它描述了計算中標準化和定制化之間隨時間推移的波動 - 由市場需求、技術(shù)創(chuàng)新和軟件復雜性的變化驅(qū)動。
(Makimoto 的 Wave 顯示了計算中優(yōu)先級波動的歷史模式——從靈活性到專業(yè)化,然后再回到。AI 目前的發(fā)展軌跡標志著向靈活性和通用平臺的回歸。
此模型直接映射到 AI 硬件的演變。在 AI 的早期,當工作負載定義明確且穩(wěn)定時,NPU 和其他固定功能加速器是有意義的。它們針對特定任務進行了高度優(yōu)化,例如使用 CNN 進行圖像分類或?qū)ο髾z測。
但現(xiàn)在,AI 正在迅速發(fā)展。我們已經(jīng)超越了簡單的靜態(tài)模型,進入了混合網(wǎng)絡、基于 transformer 的架構(gòu)、基礎模型和持續(xù)創(chuàng)新的時代。為去年的 AI 定制的硬件根本無法跟上這種速度。
我們再次處于 Makimoto 的拐點 — 從專業(yè)化重新轉(zhuǎn)向通用計算,作為可擴展、適應性強的解決方案。
AI 是一個并行計算問題,而不是一個專門的問題
AI 從根本上說是一個并行性問題。深度學習在很大程度上依賴于并發(fā)運算(矩陣數(shù)學、張量乘法、向量運算),這正是 GPU 最初構(gòu)建的工作負載類型。為同時渲染數(shù)百萬像素而開發(fā)的架構(gòu)現(xiàn)在非常適合同時處理數(shù)百萬個神經(jīng)元激活,這并非巧合。
如今的通用 GPU 已經(jīng)遠遠超越了其圖形根源。借助可編程管道、計算著色器和越來越以 AI 為中心的設計,GPU 現(xiàn)在可以加速傳統(tǒng)和新興工作負載,為邊緣 AI 提供強大、靈活的引擎。
相比之下,像 NPU 這樣的專業(yè)處理器很難在快速變化中保持相關(guān)性。它們針對特定作進行了優(yōu)化,當 AI 世界不斷向前發(fā)展時,這些芯片很快就會過時。很明顯,隨著這種新型軟件的不斷發(fā)展,它需要一個靈活的通用并行硬件平臺來支持它,即 GPU。
為什么通用型在邊緣
邊緣 AI 需要的不僅僅是性能。它需要適應性、可重用性和使用壽命?,F(xiàn)代 GPU 等通用并行處理器可在各個方面提供:
靈活性:可以編程以運行新的模型類型,而無需更改硬件。
可擴展性:適用于各種邊緣設備,從 IoT 傳感器到智能攝像頭和自動駕駛汽車。
軟件生態(tài)系統(tǒng):由成熟、開放的開發(fā)工具和標準(例如 OpenCL、LiteRT 和 TVM)提供支持。
可持續(xù)性: 延長產(chǎn)品生命周期并減少對不斷重新設計芯片的需求。
簡而言之,通用并行計算 (GPU) 自然而然地是為了與 AI 一起發(fā)展而構(gòu)建的。
展望未來
盡管證據(jù)越來越多,但市場仍然傾向于將 AI 加速與 NPU 和定制芯片聯(lián)系起來。但是,正如圖形行業(yè)認識到固定功能管道無法跟上游戲創(chuàng)新的步伐一樣,AI 行業(yè)也發(fā)現(xiàn)固定硬件無法與流暢的軟件相提并論。
是時候重新教育生態(tài)系統(tǒng)了。邊緣 AI 的未來并不在于狹隘優(yōu)化的芯片。它是關(guān)于可編程、適應性強的并行計算平臺,這些平臺可以根據(jù)智能軟件的需求進行增長和擴展。
牧本幾十年前就看到了。今天,我們正在踐行他的見解 — 乘著一股浪潮回歸到通用靈活性。GPU 不僅在迎頭趕上;它已經(jīng)處于領(lǐng)先地位。
Dennis Laudick 是 Imagination Technologies 的產(chǎn)品管理副總裁。在加入 Imagination Technologies 之前,Dennis 在 Arm 的汽車、AI 和 GPU 部門擔任過超過 13 年的各種產(chǎn)品和營銷領(lǐng)導職務。在此之前,他曾在多家領(lǐng)先的半導體和 OEM 公司擔任高級職位。Imagination 本月推出了面向 AI 的 E 系列 GPU 架構(gòu),詳情請見此處。
評論