
作者|川 川
編輯|大 風
有沒有發現,這半年AI圈的畫風變得有點快?
去年這個時候,大家還在爲算力降價狂歡。阿里雲帶頭喊出「最高降幅60%」,騰訊雲、華爲雲、百度雲齊刷刷跟上,那陣仗,簡直像雙十一大促。創業群裏天天有人曬賬單:「看,我這一百萬Token才花了幾毛錢!」那會兒人人都覺得,AI創業的春天來了,算力跟白菜一樣便宜,誰還做不起大模型應用啊?
結果呢?打臉來得太快。
就上個月,風向一百八十度大轉彎。谷歌、亞馬遜、騰訊、阿里、百度,10天之內全發了漲價公告。漲多少?普遍30%到50%。最狠的是騰訊雲,有個核心產品直接漲了400%。
從「跳樓大甩賣」到「坐火箭式漲價」,前後不到一年。到底發生了什麼?誰在背後推着價格往上走?更重要的是,這波漲價潮裏,誰最慘,誰在偷笑?
去年還在「打骨折」,今年爲什麼集體漲價?
先簡單回顧一下這出「反轉大戲」。
2025年4月,阿里雲率先扔出一顆重磅炸彈:核心產品最高降價60%。這可不是小打小鬧,是實打實的「腰斬再打折」。緊接着,京東雲說「隨便降,我跟」,騰訊雲、華爲雲、百度雲全部跟進。一時間,算力市場硝煙瀰漫,價格戰打得那叫一個熱鬧。

那會兒的口號是什麼?「讓AI用得起」「算力普惠」。很多創業公司真的信了,開始大張旗鼓地燒Token、跑模型。
然而,免費的午餐從來吃不長久。
2026年1月,亞馬遜AWS悄悄幹了件事——沒有任何發佈會,沒有任何預告,直接把EC2服務器價格上調了15%左右。別看幅度不大,意義可大了:這是雲服務行業近二十年來第一次漲價。要知道,過去二十年,AWS降價的次數超過一百次,從來只有往下走,沒有往上調的道理。
這一下,像是推倒了多米諾骨牌。
3月11日,騰訊雲跟進,旗下Tencent HY2.0 Instruct模型輸入價格從0.0008元/千tokens漲到0.004505元/千tokens——漲幅463%,四倍多。3月18日,阿里雲宣佈算力卡產品上漲5%到34%,百度智能雲也跟着漲了5%到30%。那些之前免費公測的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部結束「白嫖期」,轉入正式計費。
從「搶着降價」到「搶着漲價」,爲什麼變化這麼快?
表面看是雲廠商扛不住了。GPU芯片越買越貴,數據中心的電費佔運營成本的40%到60%,再加上2025年下半年存儲芯片也開始漲價,成本端的壓力實實在在地壓過來了。但真正讓漲價變成「不得不做」的,是另一個更根本的原因——算力,真的不夠用了。
誰在瘋狂「吃」Token?140萬億的真相
之前不是說算力過剩嗎?怎麼突然就不夠用了?
答案是:Token被「吃」得太快了。
根據國家數據局局長劉烈宏在今年3月披露的數據:到2026年3月,中國每天的Token調用量已經突破了140萬億。
這個數字有多誇張?給你兩個參照:
· 2024年初,這個數字只有1000億。兩年時間,漲了一千多倍。
· 2025年底,這個數字是100萬億。也就是說,僅僅過去三個月,又漲了40%——光這三個月新增的量(40萬億),就是2024年初全天的400倍。
這不是線性增長,這是海嘯。
那麼問題來了:誰在瘋狂消耗Token?
答案就一個詞:智能體(Agent)。
去年開始,以開源智能體OpenClaw(江湖人稱「龍蝦」)爲代表的產品火得一塌糊塗。AI從一個只會「聊天」的機器人,變成了一個能「幹活」的助手——幫你訂機票、寫代碼、做PPT、分析數據……聽起來很酷對吧?但代價是,智能體幹一件簡單的事,消耗的Token量是普通對話的10倍到100倍。

舉個例子:讓AI幫你寫一個爬蟲腳本。如果是普通對話,它給你一段代碼,你複製走人,消耗幾百個Token。但如果是智能體,它要自己跑代碼、報錯、調試、再跑、再調……來來回回十幾輪,Token消耗直接奔着幾萬去了。
更別提視頻生成這種「吞金獸」。有分析指出,生成1分鐘的視頻大約要消耗10萬億Token。而現在的視頻模型,生成5秒的視頻才收你幾毛錢到幾塊錢——這哪是賺錢,這分明是賠本賺吆喝。但架不住用的人多啊,視頻、音樂、代碼、數據分析……每個方向都在瘋狂「吃」Token。
供給跟不上需求,算力自然就漲價了。這不是陰謀,是赤裸裸的供需失衡。
算力排位賽:大廠吃肉,小玩家連湯都喝不上
漲價這件事,對不同的人,意味完全不同。
對雲廠商來說,漲價其實是好事。有券商算過一筆賬:阿里雲每提價1%,它的利潤率就能提升1個百分點。所以你看到的數據是,阿里雲的份額不降反升,已經佔到了中國AI雲市場的36%。而在AI調用量這個更細的賽道里,火山引擎(字節旗下)更是佔了將近50%——也就是說,全中國一半的Token調用,走的是火山引擎的管道。
與此同時,華爲雲、騰訊雲的份額在微幅下滑。頭部效應越來越明顯:大廠越做越強,資源越聚越集中。
那誰最慘?
中小AI創業公司,以及那些剛入局的小玩家。
原因很簡單:漲價直接推高了他們的運營成本。以前Token便宜的時候,你可以隨便跑實驗、隨便調模型,反正花不了幾個錢。現在價格翻了幾倍甚至十幾倍,每一輪訓練、每一次推理都要掂量掂量。

更麻煩的是,小玩家沒有議價能力。大客戶可以跟雲廠商籤長期協議,鎖定一個相對優惠的價格。你一個初創公司,一年才花幾萬塊錢的算力費,誰跟你談折扣?只能老老實實按漲價後的價格付錢。
很多原本打算做AI應用的項目,算了一筆賬之後,默默擱置了。還有一些已經在做的,要麼縮減規模,要麼自己扛着虧損硬撐。偏偏終端市場競爭又激烈,你不敢輕易給用戶漲價——隔壁家還免費呢,你一收費用戶全跑了。最後所有的成本壓力,只能自己嚥下去。
一位從業者跟我吐槽:「以前覺得算力便宜,創業門檻低了。現在才發現,門檻不是低了,是先讓你進來,再把門關上。」
這其實是一場殘酷的排位賽。過去二十年,雲廠商靠「低價走量、先圈地再盈利」的打法活得很滋潤。但那個時代結束了。算力正式告別補貼期,進入商業化定價階段。未來比拼的不再是誰更便宜,而是誰的服務更穩定、誰的生態更完善、誰能幫企業真正用好每一分算力。
而在這場排位賽裏,小玩家大概率要被甩下車。
回頭看看這一年多的過山車,你會發現一個挺扎心的真相:
算力從「白菜價」到「火箭價」,本質上是AI行業從野蠻生長走向成熟的一個縮影。免費時代結束了,價值競爭開始了。那些靠補貼活着的商業模式會死掉,而那些真正有技術、有場景、有用戶的產品,會在算力成本上升的環境中活下來,甚至活得更好。
AI創業的核心競爭力,從來不是算力有多便宜,而是你拿算力來幹什麼。
算力時代,Token確實貴。但比Token更貴的,是一個知道怎麼用好Token的腦子。
風險及免責聲明:以上內容僅代表作者個人觀點,不代表富途任何立場,亦不構成任何投資建議,富途對此不作任何保證與承諾。更多信息
評論
發表評論
