📢OpenAI、Google齊砍價 AI推理成本三年跌99%
GPT-5 Mini vs Gemini 3.1 Flash-Lite
人工智能軍備競賽再度升溫。OpenAI與Google於本周幾乎同步推出各自旗下速度最快、價格最低的輕量AI模型,業界分析普遍認為,這標誌著生成式AI市場的定價戰進入新階段。
📍Google率先出擊,推出史上最廉旗艦輕量版
Google日前正式發布Gemini 3.1 Flash-Lite,定位為其Gemini 3系列中成本效益最高的選項。該模型採用「混合專家架構」(Mixture of Experts,MoE),透過每次只啟動部分參數來大幅壓低推理成本。在速度方面,Gemini 3.1 Flash-Lite的「首字元回應時間」(Time to First Token)比上一代Gemini 2.5 Flash快2.5倍,輸出速度亦提升45%,達到每秒363個字元。
定價方面,API使用費僅為每百萬輸入字元0.25美元、每百萬輸出字元1.50美元,遠低於Gemini 3.1 Pro的收費。Google表示,模型支援高達100萬輸入字元的上下文視窗,並可處理文字、圖像、音訊及影片等多模態輸入。在基準測試方面,其GPQA得分達86.9%,甚至超越部分上一代的大型模型。
‼️OpenAI回應,GPT-5 Mini主打「旗艦性能、輕量價格」
與此同時,OpenAI亦推出GPT-5 Mini,定價為每百萬輸入字元0.25美元,僅為旗艦GPT-5定價的五分之一,更比GPT-5.2便宜七倍。在速度方面,GPT-5 Mini的輸出速度達每秒80至90個字元,比GPT-5快約25至30倍,首字元回應時間僅需1至10秒。
在性能測試上,GPT-5 Mini在AIME 2025數學競賽中取得91.1%,GPQA Diamond得分為82.3%,並支援高達40萬字元的上下文視窗。GPT-5 Mini同樣具備視覺處理能力,適合需要大量並行處理的企業自動化場景。
📢定價戰背景:AI成本暴跌99%
兩款模型的同步發布,折射出整個生成式AI行業近年來的結構性轉變。OpenAI曾指出,自2022年推出的早期模型text-davinci-003至今,每字元成本已下跌99%。各大廠商的旗艦模型定價亦從2023年的每百萬字元25至60美元,暴跌至目前的1至2美元水平。
分析師指出,這場定價競爭並非單純的「比底價」,而是各家公司試圖以「分層定價策略」搶佔不同市場層次:輕量廉價模型吸引初創及大流量客戶,旗艦模型則鎖定對準確率要求嚴格的企業用戶。
💬競爭格局
目前,生成式AI市場已形成多強角力的態勢。除OpenAI及Google外,Anthropic的Claude Haiku以及Elon Musk旗下xAI的Grok 4.1 Fast(每百萬輸入字元0.20美元)均以低廉定價爭奪市場份額。有分析認為,Google在定價上最具侵略性,透過低成本配合其雲端服務生態圈,正積極蠶食競爭對手的市場。
💡對開發者及企業的啟示
對於開發者及企業用戶而言,當前正是採用AI技術的黃金視窗期。以GPT-5 Mini與Gemini 3.1 Flash-Lite為例,兩者在輸入定價上完全相同(每百萬字元0.25美元),開發者選擇時可著重考慮上下文視窗大小及推理能力的細微差異。值得注意的是,Gemini 3.1 Flash-Lite的上下文視窗(100萬字元)遠超GPT-5 Mini(40萬字元),適合需要處理大型文件或長對話的應用場景。
部分業界觀察人士提醒,此輪「成長優先、低價搶市」的策略,未必能長期維持,一旦市場採用率穩定,定價反彈的風險不容忽視。
🚀 Follow 埋我哋,一齊把 AI 變成你嘅 marketing advantage。
內容由 Ai Marketer HK 提供
#AIMarketerHK #DigitalMarketing #AI
