最快的大模型 API(实测速度排行)

截至 2026-06-21,最快的大模型 API中排名第一的是 step-3.7-flash(162 tok/s)。下表为完整排行,点击模型名查看详情,或在竞速场自行实测。

⚡ 最快💰 最便宜⭐ 性价比
  1. 🥇
    step-3.7-flashapi.stepfun.com
    首响 1.47s · 峰值 528 · 44 次实测
    162 tok/s
  2. 🥈
    deepseek-v4-flashapi.deepseek.com
    首响 0.71s · 峰值 346 · 60 次实测
    142 tok/s
  3. 🥉
    kimi-for-codingapi.kimi.com
    首响 1.41s · 峰值 900 · 83 次实测
    115 tok/s
  4. 4
    mimo-v2.5api.xiaomimimo.com
    首响 6.09s · 峰值 514 · 26 次实测
    85 tok/s
  5. 5
    deepseek-v4-proapi.deepseek.com
    首响 1.37s · 峰值 293 · 35 次实测
    81 tok/s
  6. 6
    glm-5.1open.bigmodel.cn
    首响 4.70s · 峰值 594 · 41 次实测
    53 tok/s
  7. 7
    glm-5.2open.bigmodel.cn
    首响 3.97s · 峰值 475 · 55 次实测
    49 tok/s
  8. 8
    mimo-v2.5-proapi.xiaomimimo.com
    首响 2.02s · 峰值 131 · 22 次实测
    37 tok/s
完整价格表速度排行榜自己实测一轮
📋 把这个榜单嵌到你的网站

复制下面代码(实时数据,自动更新):

<iframe src="https://www.tokrace.com/embed/best/fastest" width="400" height="360" style="border:0;border-radius:12px" loading="lazy" title="最快的大模型 API(实测速度排行)"></iframe>

· 速度来自匿名实测中位数,价格以官方页面为准,跨币种按固定汇率折算 USD,仅供参考。