港股AI「雙雄」交投活躍!馬年如何佈局AI主線?
本文來源:時代財經 作者:姚婷婷
當人工智能成爲全球科技競爭的核心戰場,AI芯片作爲算力基石的戰略價值愈發凸顯。
過去兩年,行業談論 AI 芯片常從訓練集群、峰值算力、互聯帶寬與「萬卡規模」等指標切入。但進入 2025 年,一個更貼近真實業務的命題逐漸清晰:當大模型走出實驗室、走向規模化應用,決定商業化成敗的關鍵往往不再是「訓練跑得多快」,而是「推理跑得多省、多久穩、能否穩定交付」。
隨之而來的,是競爭重心從單一硬件指標轉向「軟硬協同、工程化與生態交付」,研發與適配投入顯著上升,資本因此成爲產業加速的重要推力。
在產業政策紅利、資本推動疊加國產開源大模型爆發等因素加持下,國產AI芯片企業加速突圍,「國產GPU四小龍」等一批國產芯片企業密集登陸資本市場,借力融資推進技術迭代。此外,已有上市企業亦積極拓展融資渠道,例如,雲天勵飛(688343.SH)在去年中正式啓動港股IPO,未來或將躋身國內AI芯片領域少有的「雙資本平台(A+H)」企業行列;百度(BIDU.O,09888.HK)也於今年1月宣佈分拆旗下崑崙芯赴港上市等。
資本密集湧入、技術路線差異化突破與市場需求的結構性轉變,已勾勒出國產AI芯片產業的全新發展圖景。邁入2026年,一個以自主創新爲核心、面向全球競爭的中國AI算力生態體系正初現雛形。
關鍵一年
回溯國產AI芯片的來時路,第一批探路者們早在10年前就已出現。
那時AI還處在以視覺識別爲代表的智能感知階段,主流模型以CNN等相對小規模網絡爲主,行業更關注把算法在真實場景中跑通,國內幾乎沒有專門的推理芯片。
「我們是最早一批中國人工智能推理芯片創業公司,2014年回國創業時,AI還處在視覺識別的智能感知階段,國內幾乎沒有專門的推理芯片。」雲天勵飛董事長陳寧回憶。
彼時,圍繞神經網絡處理器(NPU)的研究與工程化探索開始在國內萌芽,這個階段的核心命題是「從0到1」:模型相對確定、算子相對集中,推理負載對能效與成本的要求雖已存在,但遠未成爲全行業的共識。
隨着技術演進與市場需求轉變,2020年之後,Transformer架構興起,AIGC成爲行業主流,大模型開始加速崛起,「百模大戰」帶動訓練算力需求率先爆發,行業一度把焦點集中在規模化集群與極限性能的競賽上。
但當大模型走出實驗室進入千行百業,越來越多業務開始把推理階段的持續運營成本與實時響應速度放到更核心的位置。推理也因此從訓練的「附屬環節」,逐步走向決定AI商業化成敗的關鍵環節,產業重心隨之出現從訓練向推理遷移的趨勢。

圖源:圖蟲創意
這些行業發展變化與國產AI芯片企業在2025年前後「集中顯化」的節奏相互疊加。
寒武紀在2025年下半年股價大幅波動,盤中一度趕超貴州茅台;2025年中,雲天勵飛宣佈「赴港趕考」,謀求A+H兩地上市。2025年底,摩爾線程率先在科創板上市成爲「國產GPU第一股」,沐曦股份隨後登陸科創板;延續到2026年,壁仞科技於1月2日在港上市,天數智芯緊隨其後於1月8日登陸港股;此外,燧原科技完成上市輔導,百度旗下崑崙芯也向港交所提交了上市申請。
從產業角度看,2025年之所以成爲一個集中爆發的節點,更像是多股力量的疊加結果。
一方面,大模型走出實驗室進入千行百業,推理階段的持續運營成本與實時響應需求被顯著放大,推動算力需求從「峰值訓練」延伸到「長期推理」。
另一方面,政策紅利、資本推動疊加國產開源大模型生態活躍等因素,使企業融資與產品推進節奏明顯加快。
同時,外部環境變化帶來的供給不確定性,也促使產業鏈更積極評估多元化算力方案。多因素共振之下,企業動作在同一時間段更集中地呈現出來。
格局已變
2025的最大變數發生在年初。以DeepSeek爲代表的國產開源大模型迅速崛起,疊加「開源可用、低門檻調用」等特徵,顯著降低了AI技術的使用門檻,推動行業討論從「模型能不能做出來」轉向「模型能不能規模化用起來」。
而隨着大模型走出實驗室進入千行百業,推理階段的持續運營成本、實時響應速度成爲決定AI商業化成敗的關鍵,與訓練階段對極致算力的追求形成明確分野。
國際巨頭們敏銳地嗅到了這一轉變。去年底,英偉達與 Groq 達成「非獨家技術授權」協議,並引入了 Groq 的核心高管與部分工程團隊加入英偉達。此舉被一些行業人士解讀認爲「等同於收購」。
Groq的LPU是面向大模型推理打造的芯片架構,主打低時延與確定性執行,此舉對於英偉達而言,目的仍是快速補全其AI推理短板。
另一邊,谷歌則持續加大TPU佈局,通過架構優化強化推理場景的能效優勢;同時,圍繞推理工作負載,微軟推出Azure Maia加速器、亞馬遜也持續迭代Inferentia等自研AI推理芯片。雲廠自研路線與 GPU 路線並行推進,進一步強化了「推理成爲新戰場」的產業共識。
在中國AI推理也同樣帶來了巨大的市場。
根據灼識諮詢報告,中國AI推理芯片相關產品及服務行業正處於快速增長階段,市場規模從2020年的113億元增長至2024年的1626億元,複合年增長率達94.9%,預計於2024年至2029年將以53.4%的複合年增長率增長,2029年將達到13830億元。
在國內,面對推理芯片這一關鍵賽道,一批本土企業正在加速突圍。
例如,華爲昇騰系列芯片採用專用集成電路(ASIC)設計,基於自研的達芬奇架構,專爲高效執行AI神經網絡計算任務而優化。
寒武紀推出了思元590芯片,這款基於7納米工藝打造的國產AI芯片,推理算力達512 TOPS,並全面兼容國內幾乎所有主流大模型。天數智芯則圍繞「訓推組合」的通用 GPU 路線推進產品體系,其公開資料顯示已發佈面向推理的通用 GPU 產品,並強調對主流深度學習框架與多精度推理計算的支持。
雲天勵飛則提出了全新的「GPNPU」架構,強調面向人工智能推理的設計,並結合封裝與存儲等系統級手段緩解帶寬瓶頸,試圖走出一條差異化技術路徑。
整體來看,在推理成爲產業主戰場的當下,競爭焦點正在從單點算力指標擴展到「軟硬協同、成本結構、交付與運維」的綜合能力,國產廠商也由此迎來更需要工程化兌現的新一輪競爭窗口。
未來破局
進入2026年,推理需求的上行更明顯地與兩條產業線索交織在一起:一條是應用形態從「對話」走向「行動」,另一條是推理系統從「同構堆卡」走向「工程化拆分」。
在CES 2026上,英偉達CEO黃仁勳多次強調「agentic AI(智能體)」與「Physical AI(物理AI)」的到來,並將其描述爲「physical AI 的ChatGPT時刻」,核心指向是AI從生成內容進一步延伸到理解、規劃與執行,落到機器人、自動駕駛、工業系統等更貼近現實世界的場景中。
與此同時,AMD CEO蘇姿豐在CES 2026也用「yottaflops」來描述未來數年AI算力需求的躍遷幅度,傳遞的信號是:隨着更多複雜應用上線,算力的瓶頸將從「是否可訓練」轉向「是否可持續推理」。
而以李飛飛創立的World Labs爲代表的「世界模型/空間智能」路線,則把推理負載進一步從2D內容生成推向「可交互的三維世界構建」,意味着更長鏈路、更強實時性,同時也更高頻的在線推理調用將成爲常態。
這些趨勢疊加在一起,指向同一個結論:推理的總量會變大,且推理對時延、穩定性與成本結構的要求會同步抬升。
在國內,推理側的機會同樣更具確定性。一方面,中國AI推理芯片賽道目前並未形成「一家獨大」的格局,不同技術路線仍在並行推進,給了後來者以差異化切入與工程化驗證的空間。
另一方面,中國作爲應用大國,政策層面對AI規模化普及給出了明確的擴散目標。國務院發佈的AI+行動方案提到,到2030年「新一代智能終端和AI智能體」的滲透率將超過90%,這意味着推理需求不僅來自頭部大模型,也將來自大量行業應用與終端產品的長尾擴散。
在這樣的背景下,「未來破局」的關鍵不再是單點性能的敘事,而是能否在推理時代把軟硬協同、生態適配、交付運維與成本結構做成可複製的工程體系——當推理需求持續放大且進一步細分,市場也將爲更多務實路線留下窗口。

圖源:圖蟲創意
在推理市場上,不同芯片公司作出了不同的規劃。
陳寧表示,未來1-2年將專注推動GPNPU架構及系列芯片通過市場驗證,並賦能更多AI原生硬件;華爲此前規劃,未來三年將推出多款昇騰芯片,包括 950PR、950DT、昇騰960和昇騰970,其中 950PR主要面向推理 Prefill 階段和推薦業務場景;針對推理場景,天數智芯推出了專爲AI推理優化的通用GPU「智鎧」系列,其在招股書中表示,他們計劃未來將繼續迭代訓練和推理場景的產品線……
從比拼單點算力的軍備賽,到圍繞推理效率、工程交付與生態協同的體系化較量,國產AI芯片的競爭已進入更爲艱深的下半場,而2026年的角逐已然開始。
風險及免責聲明:以上內容僅代表作者個人觀點,不代表富途任何立場,亦不構成任何投資建議,富途對此不作任何保證與承諾。更多信息
評論
發表評論
