阶跃星辰开源 Step-DeepResearch,经济高效的端到端深度研究模型
栏目:广告资讯 发布时间:2025-12-29
阶跃星辰正式开源了参数量达320亿(32B)的深度研究专用大模型:Step-DeepResearch。该模型在深度研究任务上的表现已比肩OpenAIo3-mini与Gemini2.0Flash等顶尖商业模型,而单次调用成本却降至其十分之一以内。https://github.com/stepfun-ai/StepDeepResearch模型简介Step-DeepResearch是一款兼顾高性能与高性价比的端到端深度研究智能体模型,专为开放式科研场景下的自主信息挖掘与专业级报告生成而打造。原子化能力

阶跃星辰正式开源了参数量达320亿(32b)的深度研究专用大模型:step-deepresearch。该模型在深度研究任务上的表现已比肩openai o3-mini与gemini 2.0 flash等顶尖商业模型,而单次调用成本却降至其十分之一以内。

https://www./link/ae5ef52da81b8f483ac166475587ad87

模型简介

Step-DeepResearch是一款兼顾高性能与高性价比的端到端深度研究智能体模型,专为开放式科研场景下的自主信息挖掘与专业级报告生成而打造。

  • 原子化能力融合:将复杂研究流程拆解为可学习、可评估的原子能力模块(涵盖任务规划、多源信息检索、多轮反思与交叉验证、结构化报告生成),并在模型内部实现深度融合,确保单次前向推理中即可完成闭环式思考与实时纠错。
  • 渐进式智能体训练范式:构建从智能体中期训练、监督微调(SFT)到强化学习(RL)的全链路优化路径,将建模目标由传统语言建模的“预测下一个词元”转向“决策下一个原子动作”,显著提升模型在动态、不确定研究环境中的适应性与泛化力。
  • 小模型大能力:尽管参数规模仅为32B,Step-DeepResearch在Scale AI Research Rubrics基准测试中斩获61.4分,与OpenAI Deep Research及Gemini Deep Research等闭源旗舰模型持平;在ADR-Bench专家人工评测中,其Elo得分超越DeepSeek-v3.2、GLM-4.6等更大参数模型,整体表现直追顶级商业方案。
  • 极致成本优势:在维持专家级研究质量的前提下,大幅压缩部署与推理开销,成为当前业界单位性能成本最低的深度研究智能体解决方案。
  • 便捷接入方式:支持通过StepFun开放平台API调用,新用户首月免费体验。

(左)研究效能-成本权衡图谱:Step-DeepResearch以61.42的高分逼近性能天花板,同时推理成本(RMB)显著低于同类方案,稳居高效能前沿。(右)ADR-Bench专家评分对比:在所有评估维度中,Step-DeepResearch均取得领先Elo分数,实力媲美一线闭源模型。

架构设计

Step-DeepResearch采用基于ReAct范式的单智能体架构,依托“推理→行动→反思”的迭代循环机制,驱动自主、可控、可追溯的深度研究过程。

依托自研轻量化工具集,模型原生支持本地化部署与执行,内置四大核心工具:batch_web_surfer(批量网页搜索与内容提取)、file(文件读写与编辑)、todo(研究任务状态追踪与管理)、shell(系统级命令交互),全面覆盖科研全流程需求。

Step-DeepResearch系统架构示意:智能体在ReAct循环中协同调用专用工具(如batch_web_surfer、todo、shell),完成研究规划、步骤执行与结果反思,最终输出高质量研究报告。

开源地址:https://www./link/ae5ef52da81b8f483ac166475587ad87

源码地址:点击下载


# https  # 研究报告  # 不确定  # 高质量  # 点击下载  # 仅为  # 并在  # 更大  # 闭环  # 首月  # 开源  # 开放平台  # 系统架构  # react  # 循环  # 架构  # deepseek  # gemini  # api调用  # 本地化  # 大模型  # openai  # ai  # 工具  # github  # git 


相关文章: 三折叠手机推荐哪个品牌?技术沉淀下的实用之选——三星GalaxyZ TriFold  全球第一:中国高铁营业里程突破 5 万公里,超过其他国家总和  想要宠物却不能养?夏普推出超萌AI水獭 懂你所有喜怒哀乐  黄牛卖1万!小米17 Ultra徕卡版火了  桥野桂在《女神异闻录5》之后便不再深度参与系列创作  四款小米手机开启相机动态水印内测 有没有你的爱机?  征服 170 华雄副本的终极阵容指南  小米卢伟冰:大师变焦环不是配件 而是手机的一部分  《连线》杂志:2026 年将是阿里千问之年  茅台冰淇淋新品“小巧支”包装设计,好清新!  蓝宝石背插显卡来了!RX 9070 XT Phontom Link正式上市:5799元起  三星有望为 xAI 代工 Grok 的人工智能芯片  爷青回了!腾讯《QQ经典农场》手游过审  两张新地图!《逃离塔科夫》2026年更新路线图曝光  Warframe瓦尔基里三大流派全解析:从钢铁防线到无敌利爪  折叠屏iPhone缩水:竟比预期小 造型酷似护照本  动物园火了,品牌坐不住了  日本重新杀回内存市场 富士通联手Intel开发HBM替代品  三星新款手机推荐:三折叠形态如何重塑旗舰体验?  孙悟空一棒制敌:暴击流出装与战场节奏全解析  Fish Shell 4.3 正式发布 — 更强脚本支持与交互体验提升  内存价格起飞怎么办:转换器让SO-DIMM笔记本内存装进主机!  马斯克预测:AI 和机器人将彻底消除贫困与饥饿,工作是“可选项”  GLM-4.7 登顶 Artificial Analysis 全球开源榜首  国产影像传感器新动向曝光:SCC90XS或成旗舰机主摄  首发溢价超千元!小米17 Ultra徕卡版被炒至10000元  影之刃3女王套装冷却缩减终极指南:打造无缝技能循环  强势升级 全新操控感 赛事级体验 生态矩阵再加码  ChatGPT变身超级APP!订房、点餐、叫车通通一句话搞定  HONOR Power 2 确认1月5日发布:搭载 10080mAh 业内最大电池与天玑 8500 Elite!  信通院:11月国内手机出货微增 国产品牌表现承压  “花式”解暑!深圳湾区之心屏变身超级鱼缸  早报:三星独家供应iPhone Fold面板 卢伟冰透露新机  《|美女|请别影响我成仙》即将登陆主机平台  2499元!网友自制跑分最高LCD手机,这配置你敢买吗?  痛感依旧!《逃离塔科夫》主机版将和PC版一样难  OPPO Reno15全新配色星星粉开启预定 12月31日上市  西风显卡展出AMD RX6000 GPU成堆的“尸体”!号称从不拒保  《超英派遣中心》耕升GeForce RTX 5060 踏雪 OC英雄的职场寓言  2024年巴黎奥运会火炬设计出炉!  Hyprland 0.53 发布  DDR4价格持续暴涨!三星暂缓停产计划 与客户锁定长单  首款骁龙8E5折叠屏手机!OPPO Find N6核心配置揭晓  从观影到游戏!100寸电视全场景选购指南,适配所有家庭需求  Spring Shell 4.0.0 GA  OPPO Find X9 Pro获CNMO年度评选“人像摄影新标杆”  圆周率计算世界纪录再被刷新:单台服务器持续运行 110 天,突破 314 万亿位数字  被指向用户长期超额收费:苹果不服142亿元天价罚单!  小米17 Ultra徕卡版卖断货!黄牛加价炒到2万元  LV蟑螂包?设计太炸裂了! 


相关栏目: 【 广告资讯37196 】 【 广告推广143353 】 【 广告优化89630