xAI 发布其全新一代人工智能模型 Grok 4 Fast,在保持前沿推理能力的同时,极大提升 性价比与速度。Grok 4 Fast 在 AIME、HMMT 等关键基准上接近甚至持平 GPT-5,高于 Grok 4 与 Grok 3 Mini,同时保持了极高的效率。

•相比 Grok 4:更便宜、更省算力,但性能接近。

•相比 Grok 3 Mini:更强大,能胜任复杂推理和实时搜索。

•相比 GPT-5/Gemini/Claude:通过 极高 Token 效率 + 工具使用能力,在性价比和部分搜索任务中领先。

核心特性

xAI 发布 Grok 4 Fast 相比 Grok 4 同等性能下价格下降 98% 达到SOTA 搜索工具使用能力

1.高性价比推理模型比 Grok 4 平均减少 40% 思考 token 使用量。同等性能下价格下降 98%。在 Artificial Analysis Intelligence Index 上被验证为 业界最优的“价格-智能”比率。

2.大规模上下文窗口提供 200万 token 上下文窗口。支持 reasoning(深度推理)与 non-reasoning(快速响应)统一架构。

3.推理与搜索能力具备 SOTA 搜索工具使用能力,包括代码执行、Web 浏览、X 平台内容解析(含图像与视频)。在多项检索基准测试中表现领先,例如:BrowseComp (zh):51.2%(对比 Grok 4 的 45.0%)X Bench Deepsearch (zh):74.0%(对比 Grok 4 的 66.0%)

4.性能对比(主要基准测试)GPQA Diamond:85.7%(接近 Grok 4 的 87.5%,超越 GPT-5 Mini)AIME 2025:92.0%(接近 GPT-5 的 94.6%)HMMT 2025:93.3%(与 GPT-5 持平)LiveCodeBench:80.0%(高于 Grok 4 的 79.0%)

5.统一架构同一模型支持推理与非推理模式,无需单独模型切换。简单问题可即时响应。复杂任务可自动切换至深度推理。降低延迟与成本,适合实时应用(如搜索、问答、研究辅助)。

xAI 发布 Grok 4 Fast 相比 Grok 4 同等性能下价格下降 98% 达到SOTA 搜索工具使用能力

可用性与定价

•用户端:已集成至 grok.com、iOS、Android 应用。免费用户也可使用。

•开发者端:在 OpenRouter、Vercel AI Gateway 免费提供试用。提供 grok-4-fast-reasoning 与 grok-4-fast-non-reasoning 两种模式。API 定价:输入 <128k tokens:$0.20/百万输出 <128k tokens:$0.50/百万缓存输入 tokens:$0.05/百万