📢OpenAI、Google齊砍價　AI推理成本三年跌99% GPT-5 Mini vs Gemini 3.1 Flash-Lite

📢OpenAI、Google齊砍價　AI推理成本三年跌99%
GPT-5 Mini vs Gemini 3.1 Flash-Lite

人工智能軍備競賽再度升溫。OpenAI與Google於本周幾乎同步推出各自旗下速度最快、價格最低的輕量AI模型，業界分析普遍認為，這標誌著生成式AI市場的定價戰進入新階段。

📍Google率先出擊，推出史上最廉旗艦輕量版

Google日前正式發布Gemini 3.1 Flash-Lite，定位為其Gemini 3系列中成本效益最高的選項。該模型採用「混合專家架構」（Mixture of Experts，MoE），透過每次只啟動部分參數來大幅壓低推理成本。在速度方面，Gemini 3.1 Flash-Lite的「首字元回應時間」（Time to First Token）比上一代Gemini 2.5 Flash快2.5倍，輸出速度亦提升45%，達到每秒363個字元。

定價方面，API使用費僅為每百萬輸入字元0.25美元、每百萬輸出字元1.50美元，遠低於Gemini 3.1 Pro的收費。Google表示，模型支援高達100萬輸入字元的上下文視窗，並可處理文字、圖像、音訊及影片等多模態輸入。在基準測試方面，其GPQA得分達86.9%，甚至超越部分上一代的大型模型。

‼️OpenAI回應，GPT-5 Mini主打「旗艦性能、輕量價格」

與此同時，OpenAI亦推出GPT-5 Mini，定價為每百萬輸入字元0.25美元，僅為旗艦GPT-5定價的五分之一，更比GPT-5.2便宜七倍。在速度方面，GPT-5 Mini的輸出速度達每秒80至90個字元，比GPT-5快約25至30倍，首字元回應時間僅需1至10秒。

在性能測試上，GPT-5 Mini在AIME 2025數學競賽中取得91.1%，GPQA Diamond得分為82.3%，並支援高達40萬字元的上下文視窗。GPT-5 Mini同樣具備視覺處理能力，適合需要大量並行處理的企業自動化場景。

📢定價戰背景：AI成本暴跌99%

兩款模型的同步發布，折射出整個生成式AI行業近年來的結構性轉變。OpenAI曾指出，自2022年推出的早期模型text-davinci-003至今，每字元成本已下跌99%。各大廠商的旗艦模型定價亦從2023年的每百萬字元25至60美元，暴跌至目前的1至2美元水平。

分析師指出，這場定價競爭並非單純的「比底價」，而是各家公司試圖以「分層定價策略」搶佔不同市場層次：輕量廉價模型吸引初創及大流量客戶，旗艦模型則鎖定對準確率要求嚴格的企業用戶。

💬競爭格局

目前，生成式AI市場已形成多強角力的態勢。除OpenAI及Google外，Anthropic的Claude Haiku以及Elon Musk旗下xAI的Grok 4.1 Fast（每百萬輸入字元0.20美元）均以低廉定價爭奪市場份額。有分析認為，Google在定價上最具侵略性，透過低成本配合其雲端服務生態圈，正積極蠶食競爭對手的市場。

💡對開發者及企業的啟示

對於開發者及企業用戶而言，當前正是採用AI技術的黃金視窗期。以GPT-5 Mini與Gemini 3.1 Flash-Lite為例，兩者在輸入定價上完全相同（每百萬字元0.25美元），開發者選擇時可著重考慮上下文視窗大小及推理能力的細微差異。值得注意的是，Gemini 3.1 Flash-Lite的上下文視窗（100萬字元）遠超GPT-5 Mini（40萬字元），適合需要處理大型文件或長對話的應用場景。

部分業界觀察人士提醒，此輪「成長優先、低價搶市」的策略，未必能長期維持，一旦市場採用率穩定，定價反彈的風險不容忽視。

🚀 Follow 埋我哋，一齊把 AI 變成你嘅 marketing advantage。

內容由 Ai Marketer HK 提供
#AIMarketerHK #DigitalMarketing #AI

View original Facebook post