Pando Finance潘渡

參與了話題 ·

黃仁勳GTC 2026：AI進入推理時代，NVIDIA萬億美元算力的背後

3月16日，黃仁勳在GTC 2026 的主題演講中給出了一組數字：到2027年，NVIDIA將至少滿足一萬億美元的AI計算需求。一年前，他給出的預測還是五千億美元。從 ChatGPT 開啓生成式 AI，到推理模型和 AI 智能體的落地，AI 的計算需求結構正在發生根本性轉變。這篇演講的完整記錄，或許能幫我們理解這個萬億數字背後的邏輯。

二十年前那個「瘋狂」的決定，今天長成了生態

2006年，NVIDIA做了一個當時不被理解的決定：把CUDA集成到每一塊GeForce顯卡里。這個決策幾乎押上了公司全部利潤，但換來的是華爾街的質疑，一家遊戲顯卡公司，爲什麼要做計算平台？

20年後的今天，數億台GPU都在運行CUDA。這個生態的積累過程是線性的：安裝基數吸引開發者，開發者創造新算法，新算法開闢新市場，新市場反過來擴大安裝基數。用黃仁勳的話說，這是個「生態飛輪」，而它運轉了二十年，才達到現在的規模。

「現在CUDA庫的下載量增長很快，規模比以往任何時候都大。」黃仁勳在演講中提到。這意味着即便是六年前推出的Ampere架構，如今在雲上的價格還在上漲，不是硬件稀缺，而是它依然能跑通當下的應用。

90%的數據過去只能存着，現在終於能用上了

黃仁勳用一張幻燈片解釋了這個萬億數字的來源：結構化數據+生成式AI。

我們日常處理的數據，大多在SQL、Excel裏，是結構化的表格。但這類數據只佔全球數據總量的10%左右。剩下90%是非結構化的PDF文件、演講視頻、語音記錄、圖片。過去二十年，這些數據只是被存儲，因爲缺乏索引和查詢的工具。

NVIDIA的做法是提供兩個基礎庫：cuDF用於加速結構化數據處理，cuVS用於加速向量數據庫和語義搜索。兩者結合，讓企業可以用生成式AI的方式去查詢原本無法調用的非結構化數據。

雀巢的案例被拿來佐證：通過GPU加速數據處理後，速度提升五倍，成本下降83%。這不是特例，黃仁勳認爲這種模式會在醫療、金融、製造、零售等行業反覆出現。

從「能理解」到「會幹活」，AI走了三步

過去兩年，AI經歷了三次技術變化：

第一次，生成式AI。從ChatGPT開始，AI從理解信息轉向生成內容。軟件的交互方式從檢索式變成生成式，這是計算範式的轉變。

第二次，推理模型。像O1和O3這類模型開始具備邏輯推理能力，能規劃、分解問題。這讓AI的回答更接近基於事實的推理，而非概率組合。

第三次，AI智能體。以Claude Code爲代表，AI開始執行多步驟任務：讀取文件、編寫代碼、編譯程序、執行測試、評估結果、迭代改進。黃仁勳透露，目前NVIDIA內部100%的工程師都在使用AI輔助編程。

從理解到生成，從生成到推理，再到執行任務——這三次變化疊加，構成了AI計算需求增長的基本面。

拐點已至：AI開始「幹活」，算力需求翻了一百萬倍

圖片來源：ai.lanrenbao

基於上述變化，黃仁勳的判斷是：推理的拐點已經到來。

過去幾年，AI的主要計算負載來自訓練階段，用海量數據餵養模型。但現在情況變了：AI每生成一段內容、執行一次推理、完成一個任務，都需要計算資源。推理正在取代訓練，成爲計算需求的主要來源。

黃仁勳給出了一組數據：過去兩年，計算需求增加了一萬倍。他個人的感受是，總體需求增加了一百萬倍。這解釋了爲什麼GPU一直供不應求。不是因爲大家都在訓練大模型，而是因爲AI開始真正「幹活」了，寫代碼、讀文檔、做規劃、執行任務。這些推理場景對算力的消耗，正在快速超過訓練階段。

七顆芯片拼成一個系統, 專爲推理場景打造

針對推理場景的算力需求，NVIDIA 發佈了新一代AI計算平台 Vera Rubin。這不是單一芯片，而是一個由七顆芯片組成的系統，涵蓋計算、網絡和存儲。

核心 Rubin GPU 採用台積電3nm工藝，雙芯片封裝，336B晶體管，配備288GB HBM4內存，帶寬22TB/s。配套的 Vera CPU 是88覈定制 Arm 架構，在數據中心首次採用 LPDDR5X 內存，主要針對 Agent 推理場景優化。

值得注意的是 NVIDIA 與 Groq 的合作。Groq 3 LPU芯片採用數據流架構，芯片上全是 SRAM，適合低延遲的 token 生成場景。兩者的組合邏輯是：Rubin 負責需要海量算力的預填充階段，Groq 負責對延遲敏感的解碼階段。通過 Dynamo 軟件整合後，這套系統的推理性能提升了35倍。

光模塊直接焊在芯片上, 銅纜的時代正在過去

黃仁勳在演講中確認，2026年是硅光子技術商用元年。NVIDIA發佈了全球首個CPO（光電共封裝）的Spectrum-X Ethernet Switch，把光模塊直接集成到芯片封裝中。這項技術與台積電共同開發，能耗約爲傳統銅纜的5%，帶寬密度提升10倍，傳輸能耗下降90%。

在超大規模AI集群中，互連的能耗和延遲一直是瓶頸。CPO的落地意味着這個問題有了解決方案。黃仁勳的表述很直接：「銅的要做，光的也要做，CPO也要做，每一種都需要更多的產能。」

算力被送上了太空，衛星不用再把數據傳回地面

本次演講中一個意外的發佈是「Space-1 Vera Rubin Module」軌道數據中心。

邏輯很簡單：衛星在天上拍數據，傳回地面分析，一來一回可能要數小時。如果算力直接上天，衛星可以在天上完成分析計算，只把結果傳回地面。Space-1 Vera Rubin的AI算力是H100的25倍，可以讓大語言模型和基礎模型直接在太空運行。這對實時監測、全球物聯網等場景是結構性的改變。

當然，太空沒有對流和傳導，只有輻射，散熱是工程難題。NVIDIA能做的是提供算力模組，散熱問題需要航天系統工程師來解決。

2028年的芯片長什麼樣，黃仁勳提前劇透了

按照慣例，黃仁勳提前披露了下一代架構，以物理學家理查德·費曼命名的 Feynman

Feynman 採用台積電A16（1.6nm）製程，是全球首款進入1納米時代的量產級AI芯片架構。GPU 將配備定製化 HBM 內存，不再沿用標準 HBM 規格。同時搭載的 Rosa CPU 被設計爲AI智能體的編排中樞。另一個變化是3D堆疊：LPU直接集成在GPU核心上，極致縮短數據傳輸距離。Feynman 的推理性能預計爲 Blackwell 的5倍，能效比達到前代產品的3.2倍。黃仁勳確認，Feynman 平台的七個組件將全部換代，2028年量產。

數據中心不再是倉庫，而是生產token的工廠

演講中值得注意的部分，是黃仁勳對「Token工廠經濟學」的闡述。他把未來的數據中心定義爲「生產Token的工廠」——不再是存儲文件的倉庫，而是把輸入數據加工成輸出結果的產線。

基於這個定義，AI服務可以被分爲五個商業層級：免費層、中級層（約3美元/百萬token）、高級層（約6美元）、高速層（約45美元）、超高速層（約150美元）。隨着模型變大、上下文變長，AI會變得更聰明，但Token的生成速率會降低。

因此，每瓦Token吞吐量直接決定企業的生產成本。黃仁勳給出的計算是：建立一個1GW的數據中心，即便裏面什麼都不放，15年的攤銷成本也高達400億美元。在這個成本結構下，只有運行最強的計算機系統，才能獲得最低的Token生產成本。

OpenClaw 像 Windows 一樣，可能開啓一個新紀元

針對近期熱門的OpenClaw項目，黃仁勳用了較多篇幅。

OpenClaw 是一個個人AI代理，能調用大模型、訪問工具和文件系統、分解任務、衍生子代理。它在 GitHub 上的 Star 數增長很快，已經超過 Linux 三十年的積累。黃仁勳把 OpenClaw 類比爲「智能計算機的操作系統」就像 Windows 開啓了PC時代，OpenClaw可能會開啓個人代理時代。

基於這個判斷，NVIDIA 推出了 NemoClaw 參考設計，集成了企業級安全、隱私保護和策略引擎，安裝只需兩行命令。黃仁勳的預測是：「所有SaaS公司都將消失」。未來大多數SaaS會演變爲AaaS（Agentic as a Service）。

90%的數據過去只能存着，現在終於能用上了

本次大會展出了110臺機器人，覆蓋出行、工業、醫療、科研等場景。黃仁勳對機器人市場的判斷是：未來可能達到五十萬億美元規模。

NVIDIA 在這個領域的佈局已持續十年，構建了訓練、模擬、操控三大基礎計算機平台。目前全球大部分機器人公司都在使用 NVIDIA 的技術。自動駕駛是其中的一個子集。NVIDIA 宣佈與比亞迪、吉利、日產、現代等車企合作，基於 DRIVE Hyperion 平台打造L4級自動駕駛。與Uber的合作也在擴大，計劃到2028年，在28個城市推出由NVIDIA DRIVE AV軟件驅動的自動駕駛車隊。

總結

AI的計算重心正在從訓練轉向推理。過去兩年，生成式AI、推理模型、AI智能體三次技術變化相繼落地，每一次都在重塑算力的需求結構。黃仁勳給出的萬億美元預測，正是建立在這個判斷之上。

這個數字是否準確，不取決於NVIDIA的芯片能堆多高的算力，而取決於一個更本質的問題：未來三年，AI能不能真正進入更多實際生產場景，寫代碼、讀合同、做客服、開汽車、操控機器人。

圖片來源：英偉達

從產品節奏看，NVIDIA的佈局很清晰：Vera Rubin今年落地，Feynman 2028年量產，硅光子和CPO開始商用，太空計算和機器人同步推進。從芯片到系統，從地面到太空，覆蓋了儘可能多的技術節點。但技術供應只是故事的一半。需求的真實爆發，需要AI從實驗室的「玩具」變成生產線上的「工具」。這個轉變能否發生，答案不在黃仁勳的演講裏，而在未來三年各行各業的實際落地中。

關於潘渡

潘渡（Pando）是一家提供虛擬資產管理服務的持牌公司。作爲數字資產管理領域的參與者，潘渡已獲得香港證監會頒發的第1類、第4類和第9類的牌照並可提供虛擬資產相關服務。同時，潘渡已獲得公募基金資質，且發行兩隻主動管理ETF產品及兩隻被動管理虛擬資產ETF產品。通過戰略佈局，潘渡積累了豐富的數字資產管理及合規經驗，致力於提供多元化投資解決方案，吸引了衆多投資者。

<聲明>

本內容僅供參考。此並非購買或出售任何證券或其他金融工具的招攬或要約。任何信息，包括事實、意見或引文，都可能經過濃縮或總結，並以撰寫之日爲準。信息可能會更改，恕不另行通知，潘渡有限公司（「潘渡」）沒有義務確保提請您注意此類更新。投資該內容提及之相關產品可以涉及重大損失風險，並不適合所有投資者。其估值可能會波動，因此可能導致您損失大部分投資。過去結果並不代表未來表現。如果一項投資以您的基礎貨幣以外的貨幣計價，匯率變化可能會對價值、價格或收入產生不利影響。除非您完全了解您正在進行的交易的性質以及您可能遭受損失的程度，否則您不應參與該投資。如果您不完全了解這些風險，您必須向您的財務顧問尋求獨立建議。在任何情況下，本內容均不應被解釋爲由潘渡或從潘渡作出的明示或暗示的承諾、保證或暗示，您將獲利或可以或將以任何方式限制損失。投資者應注意，過去結果並不代表未來表現。

虛擬資產是高度投機和風險性的投資。投資者在參與這些產品時應格外謹慎。虛擬資產的法律地位尚未明確定義,可能影響投資者在該虛擬資產中的權益性質和可執行性。有關虛擬資產的研究報告未經監管機構審查,投資者也無法享受投資者賠償基金的保護。虛擬資產不是法定貨幣,相關交易可能不可逆轉,因此由於欺詐或意外交易造成的損失可能無法挽回。虛擬資產的價值源於市場參與者持續願意用法定貨幣進行交換,這意味着如果某一虛擬資產的市場消失,其價值可能會完全和永久性地丟失。目前無法保證未來仍會有人接受虛擬資產作爲支付手段。虛擬資產價格相對於法定貨幣的波動性和不可預測性可能在短時間內造成巨大損失。立法和監管的變化也可能對虛擬資產的使用、存儲、轉移、交易和價值產生不利影響。某些虛擬資產交易可能只有在獲得證監會持牌平台記錄和確認時才算完成,這可能與客戶發起交易的時間不同。虛擬資產本質上使其面臨更高的欺詐或網絡攻擊風險。技術故障也可能導致持牌平台的客戶無法進行虛擬資產交易。

電話：+852 3891 3288

地址：香港中環康樂廣場8號交易廣場二期1408室

電郵：media@pandofinance.com.hk

$潘渡以太幣 (03085.HK)$ $潘渡比特幣 (02818.HK)$ $A潘渡區塊鏈 (03112.HK)$ $A潘渡創新 (03056.HK)$$英偉達 (NVDA.US)$$台積電 (TSM.US)$$特斯拉 (TSLA.US)$$Galaxy Digital (GLXY.US)$$Circle (CRCL.US)$

瀏覽 2.3萬