過去幾年的發展證明,人工智能是一個既定的事實,各大模型廠商和基礎設施供應商也前赴後繼地投入到「基建競賽」中去,以提高模型的能力和競爭力。但從人工智能誕生起就伴之而來的另一個存在已久的問題——人工智能什麼時候能從雲端走向終端落地,在過去多年備受關注。
帶着這個疑問,全球各地的廠商也做了多樣化的嘗試。如去年年底以來,OpenClaw引爆的「養龍蝦」熱,就是其中一個典型場景。這一波浪潮更是讓大家堅信,2026年真的會是AI大規模落地的元年。
爲了緊抓這個機會,產業鏈從業者一如既往地基於AI不同環節對性能的不同要求有針對性地打造相應的軟硬件產品。其中,最近半年走向風口浪尖的存儲,無疑是當中的重中之重。作爲國內領先的半導體存儲品牌企業,江波龍已然做好了充分準備。
端側AI存儲:三大核心需求
衆所周知,在2026年之前的AI建設潮中,訓練(Training)是產業的主旋律,其存儲系統的核心任務是承載數萬億Token的海量數據吞吐,並應對模型訓練中高頻、高併發的Checkpoint瞬時寫入需求,以確保昂貴的顯卡不因I/O阻塞而停滯,因此當時的行業焦點完全集中在支撐大規模算力集群的讀寫性能與可靠性上。這也正是HBM和大容量的SSD在過去幾年備受追捧的原因之一。
但進入到端側AI應用領域,存儲變了。
江波龍副總裁、嵌入式存儲事業部總經理黃強,在日前舉辦的CFM | MemoryS 2026同期與半導體行業觀察等交流的時候指出,對端側AI應用來說,因爲主要聚焦推理應用,所以其跟應用場景的結合會更緊密,而且會有一些差異化,甚至可能要求便攜,這就需要在功耗、性能和尺寸等方面做更好地創新。
「無論是訓練還是推理,都需要面臨一個重要問題——效率(或算力)的浪費。此外,高成本,尤其是高的token成本,給端側AI帶來了巨大挑戰。於是,大家希望對存儲處理提出分層化的概念,以更細化的方式來解決問題。」江波龍副總裁、企業級存儲事業部總經理閆書印補充說。
誠然,在端側AI(如AI手機、AI PC及智能座艙)中,由於端側SoC的顯存與系統內存共享,運行大模型需要常駐佔用數GB的高速空間,這直接壓縮了系統流暢度,並對LPDDR5/5x的帶寬提出了極苛刻的要求,以支撐實時Token生成;同時,爲了降低高昂的Token計算成本並提升響應速度,系統必須頻繁調度巨大的KV Cache(鍵值緩存),這種「高頻、小碎塊、長駐留」的數據存取模式,迫使底層閃存(UFS/SSD)必須從單純的存儲介質向更智能化的方式演進,以解決頻繁數據搬運帶來的功耗驟增與發熱難題。
而要破解這個難題,除了要在技術方面投入外,系統層面的創新也是亟需的。

基於存儲行業二十多年的深耕和洞察,江波龍董事長、總經理蔡華波先生在CFM | MemoryS 2026峰會演講中直言:「端側AI同樣需要深度集成的定製化存儲方案,而非通用標準存儲產品」,「雲端AI聚焦面向GPU的專業化存儲服務,而端側AI則圍繞高性能容量、SiP系統級集成封裝、定製化服務三大核心需求展開,其對存儲的要求與過往標準存儲生態存在本質區別。」蔡華波先生進一步指出。
有見及此,構建了芯片設計、固件算法、材料工程、封測製造等全鏈條能力,承接起端側AI存儲定製服務Foundry模式,突破傳統存儲單一升級瓶頸,實現全方位綜合提升。

據蔡華波介紹,該模式覆蓋芯片設計、硬件設計、固件軟件、封裝工藝、工業設計、自動化測試、材料工程、生產製造等全產業鏈核心環節,通過各環節深度協同、技術整合與能力開放,實現存儲產品從設計到交付的全鏈路定製化與高效化,精準匹配AI手機、AI輔助駕駛、AI穿戴、AI PC、具身機器人等多元場景,爲端側AI存儲創新錨定清晰的場景導向,與雲端AI存儲形成優勢互補。
新品迭出 + 技術突破:江波龍領跑端側 AI 存儲賽道
深耕半導體存儲領域二十餘年,江波龍憑藉全鏈條研發、設計與製造能力的深厚積澱,持續以創新產品響應端側AI時代的存儲需求。在MemoryS 2026展會上,江波龍領先的產品和技術展示—新一代PCIe Gen5 mSSD高速存儲介質與SPU存儲處理器+iSA存儲智能體,以軟硬件協同的創新思路,破解端側AI存儲的性能、容量與調度難題,彰顯其在該領域的領先佈局。
1.新一代高速存儲介質PCIe Gen5 mSSD:小體積藏大能量,散熱與性能雙突破
作爲面向端側AI設備的新一代高速存儲介質,江波龍PCIe Gen5 mSSD、以「小尺寸、高性能、多形態」爲核心亮點,精準適配AI PC等終端設備的核心需求。該產品延續DRAM-less架構與20×30mm超小尺寸,完美兼容M.2 2230規格,更可靈活衍生爲M.2 2242/2280、AI存儲卡、PSSD等多種形態,實現多場景的靈活落地。
性能層面,這款mSSD搭載聯芸1802主控芯片,順序讀寫性能最高可達11GB/s、10GB/s,隨機讀寫性能峰值達2200K、1800K IOPS,單盤容量最高支持8TB,可滿足AI PC運行過程中海量數據的高速讀寫需求。


正如蔡華波在演講中所說:「端側AI存儲的發展高度依託材料工程能力,其中散熱材料更是核心技術挑戰。」常規的Gen5 SSD需要做到良好的散熱效果,一般都會疊加厚重的散熱馬甲,只能夠用於臺式機等較大體積的電腦。而江波龍針對PCIe Gen5 mSSD小體積、高性能運行下的散熱痛點,率先設計出的專屬高效散熱方案—集成均熱器+TIM1導熱膠、石墨烯散熱片、VC均熱板、鋁合金散熱拓展卡等多重散熱組件,更顯輕薄,且相較於普通散熱方案,江波龍PCIe Gen5 mSSD的高效散熱方案可將11GB/s峰值性能維持時間提升至181秒,連續讀取容量可達1991GB,是常規PCBA SSD散熱方案的近2.5倍。該方案專爲 AI PC KV Cache高負載場景設計,可實現Gen5高性能實時吞吐,同時兼容AI PC超薄機身,兼顧高性能與設備形態要求。

2.SPU+iSA:軟硬件協同,賦能端側AI存儲智能化
如果說高速存儲介質PCIe Gen5 mSSD是端側AI存儲的「高速載體」,那麼江波龍發佈的SPU(Storage Processing Unit,存儲處理單元)與首個iSA(Intelligence Storage Agent,存儲智能體)的組合,構建起了「芯片硬件+智能調度」的端側AI存儲軟硬件協同技術閉環。
與常規SSD主控芯片不同,SPU是江波龍專爲AI應用時代打造的核心智能處理單元。正如江波龍閆書印表示:「SPU它就像一個端側的智能處理器,不只是傳統的簡單的數據存儲,被動執行存儲的指令。」
芯片基於5nm先進製程工藝打造,單盤最大容量達128TB,當前主流cSSD 容量最大僅至8TB,而大容量eSSD方案成本較高,SPU則有效平衡了容量與成本難題,可高效益替代HDD,爲客戶探索eSSD方案提供了新可能,同時有望顯著降低整體擁有成本。SPU核心具備存內無損壓縮、HLC(High Level Cache)高級緩存技術兩大關鍵能力,存內無損壓縮平均壓縮比達2:1,實測覆蓋文本/代碼/數據庫等多類數據,大幅節省SSD容量和成本;還能通過HLC技術實現溫冷數據下沉至SSD,節省近40% DRAM容量需求。

而iSA存儲智能體是面向端側AI推理的專屬智能調度引擎,作爲SPU的「大腦」,其核心價值在於解決端側AI推理過程中的存儲調度痛點。隨着MoE大模型的廣泛應用,參數龐大、KV Cache膨脹快、I/O延遲影響推理流暢度等問題日益突出,而iSA通過MoE專家卸載、KV Cache智能管理與智能預取算法,實現了存儲調度效率的大幅提升。
江波龍與AMD的深度協同,更讓這一技術組合的實力得到充分驗證。雙方基於銳龍AI Max+ 395處理器的智能體主機開展聯合調優,成功實現397B超大模型的本地部署,在256K超長上下文(122B)場景下,將DRAM佔用降低近40%,爲超大模型本地化高效部署與規模化應用提供了可落地的創新方案。作爲AMD的長期合作伙伴,此次聯合調優更是雙方生態協同的進一步深化,未來將持續發揮各自技術優勢,推動端側AI存儲生態的完善。


3.HLC技術全端側落地:破解性能與成本平衡難題
面向存儲芯片漲價帶動手機等終端產品售價攀升問題,今年年初,江波龍發佈了自研HLC(High Level Cache高級緩存技術),江波龍將HLC高級緩存技術與SPU、UFS深度集成,成功實現AI PC端+嵌入式端全端側場景落地,精準解決端側設備「性能與成本平衡」的行業核心難題,爲終端產品迭代提供高性價比存儲解決方案。
在AI PC端,HLC技術依託SPU實現分層架構設計,性能層專門打造AI專用高速緩存區,可高效完成大模型專家/鍵值對卸載,保障端側AI推理過程的流暢性;存儲層則承擔操作系統與通用數據的存儲任務,通過高優先級讀寫、低優先級I/O調度的智能策略,在顯著優化AI使用體驗的同時,有效降低終端DRAM容量需求,進而壓縮終端硬件成本,實現性能與成本的雙向兼顧。
在嵌入式端,江波龍與紫光展銳展開深度聯合開發,基於紫光展銳芯片平台的實測數據充分彰顯了HLC技術的優勢:4GB DDR搭配HLC技術後,20款App啓動響應時間僅851ms,性能表現接近6GB/8GB DDR的正常配置水平。與此同時,江波龍搭載14nm製程工藝WM7200主控的UFS 2.2產品,同步實現性能突破,順序讀寫最高可達1070MB/s、1000MB/s,隨機讀寫IOPS分別最高可達240K、210K,性能超越行業主流水平,在保障終端設備流暢體驗和器件使用壽命的前提下,進一步降低終端DRAM容量需求、優化整機BOM成本,適配嵌入式設備低成本、高性能的核心需求。


4.端側AI SiP技術:自研賦能,發揮供應鏈優勢
此外,江波龍依託中國工程師自研優勢,完成SiP(System in Package,系統級封裝)全流程設計,構建起端側AI存儲的另一核心競爭力。該技術可將SoC、eMMC/UFS、LPDDR、WiFi、Bluetooth、NFC等多類芯片集成於一顆封裝內,實現硬件的高度集成化。
針對AI眼鏡、智能手錶、POS機等對空間體積、機身輕薄度、散熱控制有着嚴苛要求的終端產品,SiP集成方案能夠顯著縮小硬件尺寸、優化設備結構佈局及散熱表現,成爲此類終端的極具競爭力的優選解決方案。同時,江波龍結合本土供應鏈核心能力,將SiP技術優勢充分釋放,不僅有效節省端側AI產品的內部空間,更將技術優勢轉化爲海外製造端的實際價值,大幅降低海外製造難度,可靈活適配全球不同市場的產品需求,進一步提升中國存儲企業的全球競爭力。

當人工智能的浪潮從大模型中心的喧囂轉向千家萬戶的終端設備,存儲的角色已不再是冷冰冰的數據容器,而是賦能物理世界智能化的核心引擎。
江波龍在CFMS 2026上的重拳出擊,預示着一個屬於端側AI的高性能存儲時代正式開啓。在這場關乎效率、功耗與成本的終極較量中,唯有像江波龍這樣具備全鏈條創新能力的先行者,才能在變局中錨定座標,不僅助力AI從雲端真正走向萬物終端,更在重塑全球存儲產業格局的過程中,貢獻屬於中國存儲企業的創先範式。
江波龍也強調,公司未來將秉持「Everything for Memory」的理念,持續深耕存儲領域,以技術創新爲核心驅動力,與全球產業鏈夥伴攜手,共同推動端側AI產業創新發展。
風險及免責聲明:以上內容僅代表作者個人觀點,不代表富途任何立場,亦不構成任何投資建議,富途對此不作任何保證與承諾。更多信息
評論
發表評論
