繁體中文
返回
立即開戶
ME News
發表了文章 · 04/14 22:31

AI視頻三國殺:阿里逼宮,字節開放

文章作者、來源:財經故事薈
「快樂馬」後發趕超,阿里截胡快手字節。
4月14日,字節跳動旗下火山引擎正式上線Seedance2.0 系列API服務,企業和個人用戶都可調用其視頻生成能力。
早期,上述服務需要高額預付、動輒千萬級「最低消耗」。
算力足夠的情況下,API大面積開放幾乎算是大模型商業化的主引擎。但有意思的是,近期被不少用戶詬病排隊時間長、變相漲價背刺用戶的Seedance2.0,怎麼突然就全面開放API了呢?
這背後,或許有上週爆火的HappyHorse的推動。 
阿里旗下HappyHorse視頻生成模型於4月7日匿名登頂Video Arena盲測榜單,性能超越字節Seedance 2.0與快手可靈AI 3.0;4月10日阿里官方認領,並加速推進API開放及商業化落地。該模型採用單流Transformer架構,支持多語種脣形同步,在物理一致性(4.52/5)與視覺質量(4.80/5)上表現優異。其技術路徑聚焦世界模型演進與商業可用性平衡,區別於OpenAI因經濟性不足關停Sora的路徑。HappyHorse深度綁定阿里電商生態,有望構建「內容-交易-履約」閉環,推動AI視頻在B端降本增效,並加劇與字節、快手的三國競爭格局。 文章作者、來源:財經故事薈 「快樂馬」後發趕超,阿里截胡快手字節。 4月14日,字節跳動旗下火山引擎正式上線Seedance2.0 系列API服務,企業和個人用戶都可調用其視頻生成能力。 早期,上述服務需要高額預付、動輒千萬級「最低消耗」。 算力足夠的情況下,API大面積開放幾乎算是大模型商業化的主引擎。但有意思的是,近期被不少用戶詬病排隊時間長、變相漲價背刺用戶的Seedance2.0,怎麼...
4月7日,HappyHorse以匿名身份空降權威AI平台Video Arena盲測榜單上。在圖生視頻(無音頻)榜單上,它拿到1411分登頂,把Seedance 2.0甩出約55分;在文生視頻(無音頻)一欄,1379分同樣排在字節跳動Seedance 2.0、快手可靈AI 3.0、崑崙萬維SkyReels V4等公開產品前。
三天之後,阿里官方出面認領了這匹「千里馬」。
今年3月34日, OpenAI 宣佈關停 Sora,所有人都以爲,Seedance 2.0 要在AI視頻生成模型領域一統天下,阿里卻出其不意,截胡字節Seedance與快手可靈。
AI視頻生成模型這一賽道,三國殺格局雛形初顯,而且中國公司在全球拿下了主導權。 
2024年以來,AI視頻生成模型之所以能實現從「玩具」到「工具」的質變,其核心驅動力在於底層技術範式的根本性轉變——從基於海量數據統計的模式匹配,升級爲對物理世界規律進行模擬與理解的「世界模型」。這一轉變解決了此前技術無法逾越的兩大鴻溝,即物理合理性與長期一致性。其中,長期一致性更是實現影視級應用的前提。
,HappyHorse用一個統一的Transformer同時處理視頻和音頻,一次推理直接輸出帶聲音的成片,不需要後期拼接。這種有點特別的技術架構(單流Transformer架構),對提升長期一致性很有優勢。
統一的 Transformer直接處理長序列的混合Token,其自注意力機制能夠捕捉視頻幀與音頻幀之間長距離的依賴關係。
阿里旗下HappyHorse視頻生成模型於4月7日匿名登頂Video Arena盲測榜單,性能超越字節Seedance 2.0與快手可靈AI 3.0;4月10日阿里官方認領,並加速推進API開放及商業化落地。該模型採用單流Transformer架構,支持多語種脣形同步,在物理一致性(4.52/5)與視覺質量(4.80/5)上表現優異。其技術路徑聚焦世界模型演進與商業可用性平衡,區別於OpenAI因經濟性不足關停Sora的路徑。HappyHorse深度綁定阿里電商生態,有望構建「內容-交易-履約」閉環,推動AI視頻在B端降本增效,並加劇與字節、快手的三國競爭格局。 文章作者、來源:財經故事薈 「快樂馬」後發趕超,阿里截胡快手字節。 4月14日,字節跳動旗下火山引擎正式上線Seedance2.0 系列API服務,企業和個人用戶都可調用其視頻生成能力。 早期,上述服務需要高額預付、動輒千萬級「最低消耗」。 算力足夠的情況下,API大面積開放幾乎算是大模型商業化的主引擎。但有意思的是,近期被不少用戶詬病排隊時間長、變相漲價背刺用戶的Seedance2.0,怎麼...
這比用多個獨立模型分別處理再協調要簡單直接,減少了信息在模塊間傳遞的損耗,理論上更有利於維持長時序的連貫敘事。 
根據Artificial Analysis的評測指標(滿分5分),HappyHorse在物理一致性方面得分爲4.52,視覺質量得分爲4.80,文本對齊得分爲4.18。這表明其在基礎一致性方面表現良好,但在複雜場景下的長期一致性仍有提升空間。
不過參考Sora的經驗可知,長期一致性表現好≠商業可用性表現好。
根,Sora在實際應用中,其長期一致性高度依賴大模型的「記憶」能力, 商業可用率極低,僅5%-10%的生成視頻能用於初步篩選,更像一個不可控的「抽卡遊戲」。 
Sora的關停,也並非源於技術升級的困難,而是一筆算不過來的經濟賬。據Appfigures估算,Sora上線以來的應用程序內總收入僅約210萬美元,投入產出比接近2500:1,堪稱AI史上最昂貴的「技術煙花」。 
硅谷風投機構a16z合夥人Olivia Moore曾在社交媒體曬出SensorTower的監測截圖,顯示Sora APP的30天用戶留存率爲1%,60天留存率0%。如此低的留存率,顯然不符合商業應用的要求。
AI發展到了今天,資本對無法變現、耗資巨大的技術突破態度已經足夠理智,甚至是冷酷了。所以,正在籌備上市的OpenAI只能關停Sora,並退回和迪士尼的10億美元合作款項。 
而且OpenAI也需要集中精力繼續推進世界模型的研發。畢竟從某種意義上來說,並不存在單獨的視頻大模型,視頻大模型更像是是世界模型和多模態技術融合進程中的階段性里程碑。
目前頂級的視頻模型幾乎都基於DiT架構,這個架構的前身是圖像生成 Diffusion,下一步很可能就是Omni-Model。視頻只是這些模型在時間維度上插了幀,並在數據清洗時喂入了大量物理世界因果片段。
做視頻,是驗證時空預測能力的最低門檻。能做出視頻大模型的公司,理論上也可以把這種技術用來研發其他垂直領域的大模型 ——如果有足夠多優質的真實數據用來訓練。
阿里的目標,顯然也不只是做出一個受歡迎的視頻生成工具。
視頻是AI大模型很好的垂直應用方向,因爲從流量邏輯看,視頻是AI目前唯一能無縫嵌入娛樂、社交、電商三大現金牛領域的模態。 
ChatGPT(文本)的月活是億級,TikTok(視頻)的日活是十億級。人類天生就懶於閱讀文字,樂於消費視頻。字節能深入所有互聯網巨頭的業務腹地,也是因爲它抓住了視頻這個關鍵點。
抖音上的視頻流數據,涵蓋人物行爲、物體運動、場景交互等多維度的動態信息,每一幀都是真實世界規律的記錄。用這種優質數據訓練出的垂直應用AI,很容易就贏在起跑線上。 
根據極客公園測算,Seedance2.0生成15秒視頻的可用率或達到90%,相較此前行業內大概20%的平均值,提升幅度較大。技術實力與商業可用性的雙重提升,讓Seedance2.0的爆火很容易理解。
而且Seedance 2.0的商業化推進,節奏感極強。先用「寵物貓狗暴揍哥斯拉」等病毒式模板引爆社交媒體的全民二創熱潮,完成零成本的流量引爆和用戶教育,在口碑和需求雙雙達到頂峰後,立即啓動商業化變現。
3月4日,火山引擎公佈商用定價:包含視頻輸入的場景28元/百萬tokens,不含視頻輸入46元/百萬tokens,摺合純視頻生成成本約0.95元/秒。 
緊接着,字節採取差異化定價面向市場、降低門檻開放公測的策略,於4月2日正式面向企業用戶開放API申請。至此,Seedance2.0完成了從網紅AI玩具到企業生產工具的身份躍遷。
這也驗證了AI產業投資邏輯的變化,無論是公司內部的資金還是外部的資金,都會流向更能垂直應用、快速變現、貢獻ROI的地方。B端和C端的用戶在付費時,也同樣遵從這個底層邏輯。
一個值得注意的細節是,HappyHorse原生支持英語、普通話、粵語、日語、韓語、德語、法語的脣形同步,這很可能是爲了讓HappyHorse生成的視頻能進入到電商(包括跨境電商)等實際應用場景中。
畢竟張迪作爲快手可靈和阿里HappyHorse之父,不僅懂技術,也很懂業務(這一點從他的職業履歷就能看出),天然就擅長把業務思維帶入到HappyHorse的技術研發中。
一個佐證是,快手可靈的商業化效果已經有了業績數據支撐。2025年第四季度,可靈AI營業收入達到3.4億元;2025年12月單月收入突破2000萬美元,年化收入運行率(ARR)達到2.4億美元。
而且,HappyHorse所屬的阿里ATH創新事業部,早已喊出「創造Token、輸送Token、應用Token」的口號。這種以「Token消耗量」爲核心KPI的組織設計,決定了其下所有技術嘗試,其實都會落腳在商業化應用上。
和Seedance 2.0一樣,HappyHorse從匿名衝榜到官宣認領,再到計劃開放API、接入阿里百鍊MaaS平台,商業化推進的節奏也非常快。 
考慮到HappyHorse團隊負責人鄭波同時兼任阿里媽媽CTO,未來HappyHorse的應用很可能要與電商業務深度綁定。
讓AI與原本的核心業務深度協同,帶來更大的生態繁榮,是現在每個互聯網巨頭都看重的事。除此之外,阿里還有一個多年的心願,即打造流量入口,反哺電商等核心業務。
理想情況下,HappyHorse可以同時踩中這兩個關鍵點。
作爲視頻生成工具,HappyHorse可以應用於商品廣告、虛擬主播等電商業務場景中。如果還能在AI內容生成的源頭佔據一席之地,就能爲電商交易等業務提供內生流量,從而構建「內容-交易-履約」的完整閉環。
這並非毫無根據的想象,畢竟Seedance2.0已經殺入電商領域了。
4月2日,AI Agent 公司 NoDesk AI 發佈旗下產品 DeskClaw 新版本,正式接入Seedance2.0。這是 Claw 賽道先一步明確聚焦垂直電商、也是電商領域首批接入 Seedance2.0 的 AI 產品。  
對於大部分的投資者和從業人員來說,阿里作爲電商一哥,似乎沒有理由做不到類似的事情。 
HappyHorse這種阿里系視頻生成工具的出現,某種意義上來說是符合公衆預期的,畢竟,讓商家可以在電商平台上直接用上穩定、可靠的視頻生成工具,才是邏輯最順暢的做法。
而內容生態領域,只要HappyHorse足夠穩定、可靠並且便宜,同樣可以殺出一片天地來。
對大部分的內容創作者來說,成本可控是非常重要,並不只是簡單的價格高了或者低了的問題。
無論是個人UP主、小型工作室還是MCN機構,其內容生產都有預算和週期。一個價格頻繁波動、排隊時間無法預估的工具,會直接打亂整個生產計劃,讓項目無法報價、無法按期交付。
Seedance2.0現在恰恰就有這樣的問題和風險。一方面,高峰期普通用戶排隊可達8萬人,等待時間超過7小時,即便是付費高級會員也難以倖免。
另一方面,即夢平台在短期內連續調價,據說製作一部2分鐘AI漫劇的純素材生成成本,已經從最初的約7元飆升至80元,擊穿了許多中小團隊的商業模式底線。
「字節在年費之上推出vvip等升級服務,算是變相提價了,就是因爲Seedance一家獨大」, 有用戶向《財經故事薈》吐槽,「現在HappyHorse上線,估計字節要掂量掂量了。」
只要HappyHorse質量穩定,又能做到體驗好、定價低,就可以從競爭對手那裏挖到到一批有真實內容生成需求的客戶了。或許聰明的阿里雲銷售,已經開始接觸火山引擎的客戶了。
字節今天放開Seedance2.0的API接入,就是在主動降低用戶的使用門檻,有了HappyHorse這個對手,接下來雙方大打價格戰,也是大概率事件。
字節、快手、阿里三國殺,模型能力你追我趕,算力成本穩中有降,讓越來越多的中小創業者可以享受到技術普惠的紅利,也能快速引爆市場——這才是我們想看到的AI時代。
風險及免責聲明:以上內容僅代表作者個人觀點,不代表富途任何立場,亦不構成任何投資建議,富途對此不作任何保證與承諾。更多信息
瀏覽 2.4萬
舉報
評論
搶沙發