PhanthyCloud雲原生智能服務自適應治理引擎:大幅降低企業使用成本
爲解決語音對話智能體在規模化落地中常見的「三難」——高峰穩定、體驗一致、成本可控, $範式智能 (06682.HK)$PhanthyCloud近日正式推出雲原生智能服務自適應治理引擎(Adaptive QoS Engine,簡稱 AQE)。該引擎面向語音對話、多模態交互等計算密集型場景,基於 Kubernetes 雲原生架構,將「負載感知—質量自適應—資源編排」打通成一套自動運行的治理閉環,讓系統在流量波動下依然穩定交付,同時顯著提升硬件資源利用率。內部實測顯示,在同樣 1000 併發條件下,AQE 可將成本下降15倍以上,讓「算得起、用得穩」不再矛盾。
在真實業務中,高保真語音合成往往消耗大量 GPU 顯存與算力,而輕量化引擎則能以更低資源支撐更高併發。傳統「靜態配置、一刀切」的資源策略要麼成本過高,要麼在峰值流量下容易出現排隊、超時與體驗波動。AQE的核心不是簡單擴容,而是把「服務質量(QoS)」納入調度決策:系統會基於實時指標(併發請求、隊列積壓、GPU 利用率等),在多種預定義的 QoS 檔位間自動切換,並聯動調整服務實例資源配額與模型/引擎配置。
更關鍵的是,AQE 內置質量優化(壓縮/量化/降級)機制:忙時在可控體驗邊界內提升吞吐、抬升資源利用率;閒時恢復更高質量配置,把成本壓下來,形成「忙時保穩定、閒時降成本」的自動駕駛式治理能力。在同樣 1000 併發條件下,基於質量優化與自適應切換策略,內部實測可實現成本約下降15倍以上的優化空間。
爲驗證該能力的工程可靠性,範式智能在連續語音對話場景完成系統級壓力驗證。我們將一次完整的「升壓—穩態—降壓」定義爲一個輪迴:併發從 0 線性提升至 1000,再逐步回落至 0,單個輪迴耗時約 2.5 小時。實際測試並非只跑一輪,而是連續執行了20多個輪迴,覆蓋不同負載波動與切換邊界,全程累計壓測時長約 48 小時,用於驗證系統在長時間運行與反覆升降級過程中的穩定性與一致性表現。
作爲 PhanthyCloud的底層能力之一,雲原生智能服務自適應治理引擎(AQE)將持續擴展到更多智能體與多模態鏈路中,幫助企業把智能語音服務真正做到:高峰不崩、體驗不掉、成本更可控。
範式智能技術集團股份有限公司(港交所代碼: 6682)是全球領先的通用人工智能科技公司,以「AI for everyone」爲使命,致力於用「AI agent+世界模型」的技術路線賦能千行萬業。公司成立於2014年,於2025年實現集團化,下設企業服務、消費電子、智慧能源、智慧體育等業務板塊。截至目前,公司已在金融、零售、醫療等領域成功落地超 10000+個AI應用,始終致力於推動AI普惠,助力企業實現可持續增長。
風險及免責聲明:以上內容僅代表作者個人觀點,不代表富途任何立場,亦不構成任何投資建議,富途對此不作任何保證與承諾。
更多信息
評論
登錄查看/發表評論