最快国产模型 Step 3.7 Flash 夯爆了!
架构师专栏 2026-06-04
鹏磊新业务: https://shop.apiya.ai
质保 30 天不掉订阅,掉订阅,按天退差价
大家好,我是鹏磊
阶跃星辰上周五悄悄开源了个东西,我看了一下参数,属实有点东西
叫「Step 3.7 Flash」,专门给 Agent 场景设计的,不是那种拿来聊天用的模型,国产这种比较强的还是比较少
先说速度快,400 TPS 什么概念
总参数 198B,但激活参数只有 11B,稀疏 MoE 架构,你可以理解成「大脑很大,但每次只用一小块」这真的有点厉害了
最高生成速度 400 Tokens/s,这个数字在国产开源模型里。。目前我没见过更快的
上下文窗口 256K,原生支持图片和视频输入,多模态这块不是缝进去的,是从底层就设计进去了,设计的非常到位
Step 3.7 Flash 在三个核心维度,推理、编码和代理能力,强劲的表现脱颖而出
但速度不是最关键的
我觉得它真正值得关注的点是「Agent 完整链路」已经把你能想到的都规划了
规划、推理、联网搜索、工具调用、代码生成、多模态理解、反复修正,这一整套它全做了,不是拼凑的那种,属实是用心做的那种
你用一次模型调用能干啥。。没啥。真正跑生产任务是靠 Agent Loop 一轮一轮转起来,这模型就是专门给这种场景磨出来的,量身定做,完美结合。
上一个版本 Step 3.5 Flash 开源一个月就登顶了 OpenRouter 上 OpenClaw 调用量月榜全球第一,这次 3.7 Flash 整的更猛,国产终于站起来了
Toolathlon 多工具协同测试三档难度通过率全部 98%+,这个数据挺实在的
哪里能用
HuggingFace、ModelScope 都已经上了,也可以本地部署,支持 SGLang、vLLM 这些主流框架,NVIDIA GPU 直接跑没问题
你要在搭 Agent 的话,可以去试试,速度快、成本低、链路完整,国产开源里目前这套组合挺难被超的,真的超级实惠
鹏磊新业务: https://shop.apiya.ai
质保 30 天不掉订阅,掉订阅,按天退差价
