中证报中证网讯(记者 王辉)3月4日,大模型创业公司阶跃星辰继开源Step 3.5 Flash模型后,又开源了该款Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。

图片来源于网络,如有侵权,请联系删除
据了解,Step 3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下的推理速度最高可达350TPS。该模型专为智能体(Agent)场景设计,在复杂推理和长链任务中表现出色。

图片来源于网络,如有侵权,请联系删除
在开发者社区和实际应用中,Step 3.5 Flash已经迅速获得了市场验证。截至目前,这款模型在Hugging Face上的下载量已超30万次,获得了较高的社区认可度。
转载请注明:财智纵横 » 企业新讯 » 阶跃星辰进一步开源Step 3.5 Flash模型的训练权重及训练框架
版权声明
本文仅代表作者观点,不代表B5编程立场。
本文系作者授权发表,未经许可,不得转载。










