7月29日晚間消息,今日閉幕的2025世界人工智能大會(展覽)上,GMI Cloud 發布自研“ AI 應用構建成本計算器”,宣布通過實時量化不同場景下的算力成本、時間損耗與供應商性價比,可為開發者提供成本規劃支持。
典型場景評估顯示,使用 GMI Cloud 方案可使海外 IT 成本降低 40% 以上,回本周期縮短至行業平均水平的 1/3。
Token作為AI文本處理的基本單位,其消耗成本直接決定商業可行性。據行業數據顯示,GPT-4 Turbo處理單次多步驟Agent任務消耗可達200萬Token(成本約2美元),而工程化部署周期普遍被低估60%。
據介紹,GMI Cloud “ AI 應用構建成本計算器”可基于Token數量與單價(區分輸入 / 輸出), 核算AI應用/AI Agent 構建總花費;結合Token吞吐量(輸入 / 輸出速度),計算處理總請求的耗時。同時,該工具還能實時對比OpenAI、Anthropic等15家供應商的Token單價,自動標記Inference Engine等低成本替代方案。
此外,GMI Cloud Inference Engine 的底層調用GMI Cloud 全棧能力,可直接調用英偉達 H200、B200芯片,從硬件到軟件進行了端到端的優化,極致優化單位時間內的Token吞吐量,確保其具備最佳的推理性能以及最低的成本,最大限度地幫助客戶提升大規模工作時的負載速度以及帶寬。同時,其讓企業以及用戶進行快速部署,選擇好模型后即刻擴展,幾分鐘之后就可以啟動模型,并用這個模型進行 Serving。