与前沿实验室相比,外包加上 LocalAI 很快就会变得更加经济
我们不断听说推理成本应该呈下降趋势,但事实显然并非如此,无论如何对于美国前沿实验室而言并非如此。 GPT-5.4 发布不到 2 个月后,GPT 5.5(5 美元/30 美元)将 API 价格全面翻倍。 GPT 5.5 的成本是 8 个月前 GPT-5 成本的 3 倍以上(1.25 美元/10 美元)。 Gemini 3.5 Flash(1.50 美元/9.00 美元)的 API 价格比其前身 Gemini-3-flash-preview(0.50 美元/3.00 美元)全面提高了三倍,后者的价格已经比其前身 2.5 Flash(0.30/2.50 美元)上涨
"When discussing LLM pricing, people are missing the plot. The subscription token price is 10x-40x cheaper than API pricing. Your 90$ Claude subscriptions give you close to $1000 to $4000 in equivalent API token pricing. The second issue is that the quality of the model “operator”"
作者: Chyzwar