当前位置

最快国产模型 Step 3.7 Flash 夯爆了!

架构师专栏 2026-06-04

图片

鹏磊新业务: https://shop.apiya.ai

质保 30 天不掉订阅,掉订阅,按天退差价


大家好,我是鹏磊

阶跃星辰上周五悄悄开源了个东西,我看了一下参数,属实有点东西

叫「Step 3.7 Flash」,专门给 Agent 场景设计的,不是那种拿来聊天用的模型,国产这种比较强的还是比较少

先说速度快,400 TPS 什么概念

总参数 198B,但激活参数只有 11B,稀疏 MoE 架构,你可以理解成「大脑很大,但每次只用一小块」这真的有点厉害了

最高生成速度 400 Tokens/s,这个数字在国产开源模型里。。目前我没见过更快的

上下文窗口 256K,原生支持图片和视频输入,多模态这块不是缝进去的,是从底层就设计进去了,设计的非常到位

Step 3.7 Flash 在三个核心维度,推理、编码和代理能力,强劲的表现脱颖而出

但速度不是最关键的

我觉得它真正值得关注的点是「Agent 完整链路」已经把你能想到的都规划了

规划、推理、联网搜索、工具调用、代码生成、多模态理解、反复修正,这一整套它全做了,不是拼凑的那种,属实是用心做的那种

你用一次模型调用能干啥。。没啥。真正跑生产任务是靠 Agent Loop 一轮一轮转起来,这模型就是专门给这种场景磨出来的,量身定做,完美结合。

上一个版本 Step 3.5 Flash 开源一个月就登顶了 OpenRouter 上 OpenClaw 调用量月榜全球第一,这次 3.7 Flash 整的更猛,国产终于站起来了

Toolathlon 多工具协同测试三档难度通过率全部 98%+,这个数据挺实在的

哪里能用

HuggingFace、ModelScope 都已经上了,也可以本地部署,支持 SGLang、vLLM 这些主流框架,NVIDIA GPU 直接跑没问题

你要在搭 Agent 的话,可以去试试,速度快、成本低、链路完整,国产开源里目前这套组合挺难被超的,真的超级实惠

图片

鹏磊新业务: https://shop.apiya.ai

质保 30 天不掉订阅,掉订阅,按天退差价

马上咨询,获取您的定制方案和报价
小红书
抖音视频号微博快手哔哩哔哩公众号 ...
二维码