Google 将免费 Gemini API 请求减少至每天 20 个

Gwenda

谷歌已将免费的 Gemini API 访问权限从每天 250 个请求减少到 20 个,迫使开发人员寻找替代方案或付费使用。该公司同时推出了 Gemini 3 Flash 作为其新的默认免费型号,标志着其人工智能基础设施货币化的战略转变。

Gemini 2.5 Flash 现在将免费层用户每天的请求限制为 20 个,低于每天 250 个请求极客指南Google AI 开发者论坛帖子。使用 API 进行智能家居集成等自动化的开发人员报告称,在达到新上限时,他们的系统出现了故障。谷歌在没有提前通知的情况下做出了这一改变,让许多用户措手不及。

恰逢 Google 推出 Gemini 3 Flash 作为其生态系统的新默认型号。根据电脑世界,Gemini 3 Flash 的运行速度比 Gemini 2.5 Flash 快三倍,同时保持具有竞争力的性能。该型号现在是 Google 的主要免费产品,定位在付费级别 Gemini 3 Pro 和 Gemini 3 Deep Think 之间。

根据开发人员的说法,开发人员有几种直接的选择极客测试方法。 Gemini Robotics-ER 1.5 预览版提供 250 个每日请求,尽管此预览版模型未来可能面临限制。 GroqCloud 通过 Meta 的 Llama 4 Maverick 17B 等模型每天提供多达 1,000 个请求。自托管本地法学硕士消除了 API 依赖性,但需要大量的硬件投资。

根据行业分析,为 API 使用付费仍然是最可持续的选择。 Gemini 2.5 Flash 的成本为每百万个输入代币 0.30 美元,每百万个输出代币 2.50 美元。即使是日常智能家居自动化等大量使用场景,每月的成本通常也仅为几美分。 OpenRouter 等聚合平台整合了多个 AI 提供商的计费。

谷歌更广泛的人工智能战略包括在移动设备上用 Gemini 取代 Google Assistant,不过这一转变现在延续到 2026 年。该公司最初计划在 2025 年底前完成,但为了确保无缝迁移而推迟了。在分阶段更换结束之前,Google Assistant 将在 Android 和 iOS 上保持可用。

API 限制的降低反映了人工智能公司在将昂贵的基础设施投资货币化方面面临的越来越大的压力。据报道,谷歌每天通过其 Gemini API 处理超过一万亿个代币。在这种新兴的经济模型中,免费套餐主要服务于测试目的,而不是生产工作负载。

根据 PCWorld 的数据,Gemini 3 Flash 取得了具有竞争力的基准分数,包括多模式 MMMU-Pro 测试中的 81.2%。该模型在某些性能类别中与 OpenAI 的 GPT-5.2 相匹配,同时保持更快的响应时间。企业采用包括 JetBrains、Bridgewater Associates 和 Figma 等公司通过 Vertex AI 使用该模型。

随着 Google 将 Gemini 定位为跨消费者和企业细分市场的统一人工智能平台,API 的变化也随之而来。免费套餐的减少促使开发人员转向付费使用或替代提供商,同时通过更新的模型保持可访问性。这种平衡的方法支持持续的人工智能投资,同时扩大商业机会。