腾讯云Agent Runtime沙箱助力MiniMax打造生产级Agent RL底座
近日,腾讯国际领先的沙生产AI大模型厂商MiniMax与腾讯云正式达成深度合作,双方围绕Agent RL强化学习训练的箱助核心场景,基于腾讯云Agent Runtime沙箱产品展开全链路技术与业务协同。打造底座 MiniMax深耕通用人工智能领域,近期发布的沙生产Agent RL框架Forge,旨在突破大模型在复杂任务中的箱助逻辑推理、代码执行与自主决策能力,打造底座而其大规模训练对底层基础设施的腾讯弹性、并发、沙生产安全提出极高要求。箱助 此次与腾讯云的深度合作,让Forge框架实现了强化学习场景中大规模交互环境的腾讯毫秒级拉起、百万级吞吐、沙生产十万级并发、箱助瞬时销毁,大幅提升了训练吞吐量和稳定性。 图:Agent RL(智能体强化学习)端到端闭环技术架构 腾讯云Agent Runtime沙箱自发布以来,已深度适配多个国际领先大模型,在智能编程、数据处理、自动化评测、浏览器交互等多元化业务场景实现规模化落地。此次与MiniMax的合作,针对Agent RL大规模数据合成、训练、评估的核心需求,实现了毫秒级沙箱启动、百万级实例并发、全场景环境模拟与安全隔离的技术突破,既是腾讯云Agent沙箱产品能力在头部客户核心场景的重磅验证,更标志着其完成了从技术打磨到规模化商业落地的关键跨越。 随着AI智能体从会话式向执行式加速演进,大模型厂商在Agent RL等核心场景落地中,普遍面临四大行业痛点:一是Prompt注入、越权执行带来的安全合规风险,缺少可控的安全执行边界;二是传统K8s架构为微服务设计,与Agent会话亲和、即用即销毁的资源模型错配,引发资源浪费、调度效率低等问题;三是容器/VM冷启动延迟高,无法支撑RL训练万级并发、交互式Agent百毫秒级启动的性能需求;四是行业协议标准不统一,存量业务迁移改造成本高,海量镜像分发易引发TB级带宽瓶颈。 针对上述行业痛点,腾讯云Agent Runtime沙箱打造了全场景适配的定制化解决方案,实现了性能、安全、成本的三重突破。 在性能层面,通过多级轻量架构与设备池化设计,规避传统K8s调度瓶颈,实现58秒内启动3万个4C+8G规格沙箱实例,单镜像场景下每分钟可创建60万沙箱、QPS超1万,SWE RL场景下压测吞吐达16w QPM,P99延迟稳定在1秒内且成功率达4个9;通过镜像按需加载、就近缓存、块级去重三大优化,解决海量镜像分发带宽难题,将镜像实际读取占比从全量降至约10%,大幅降低存储与传输成本;更通过资源池化与快照恢复技术,实现80ms级沙箱交付,较原有方案冷启动耗时降低96%。 在安全层面,基于腾讯云自研Cube沙箱技术构建虚拟化级隔离,通过独立内核、会话/网络/存储三层隔离机制,彻底消除容器逃逸、敏感凭证泄露的高危风险,为Agent自主试错构建坚实安全边界。 图:腾讯云自研三层安全隔离机制 在适配层面,原生兼容E2B协议,支持SDK/MCP/CLI/云API多方式接入,MiniMax仅需修改环境变量即可完成存量Agent业务迁移,实现零改造成本规模化落地。 此次合作中,双方共同验证了3A infra已经成为Agent时代基础设施发展的核心方向。该标准已在元宝、混元、微信读书等多个头部客户场景完成落地验证,为行业选型提供全方位参考。 Agent First以智能体为生产主体,重构基础设施设计范式,扭转传统架构以人为服务目标的设计原则,原生适配Agent会话亲和、短时高频调用的特性,同时通过开箱即用的工具链让开发者聚焦业务逻辑,大幅降低开发门槛; Agent native打通技术与业务落地壁垒,不重构企业现有生产体系,原生适配Agent Serving无状态执行、Agent RL长时任务等全场景业务特性,更支持数十万自定义镜像免重构接入,实现与企业IT体系、业务流程的深度融合; Agent ready筑牢规模化落地核心底座,凭借ms级交付、数十万级实例秒级并发的极致性能,突破Agent规模化训练与服务的性能天花板,更构建从环境隔离到行为审计的全链路安全防线,结合智能资源调度实现成本优化,在元宝AI编程场景中,迁移后资源核时消耗降低95.8%,实现“高性能、高安全、低成本”的规模化落地。 作为腾讯云为AI智能体量身打造的新一代任务执行环境,腾讯云Agent Runtime沙箱具备四大核心优势:一是全链路安全防护,构建环境隔离、权限管控、行为审计的完整安全防线;二是Agent原生资源架构,支持沙箱暂停/恢复/快照能力,实现资源高效调度;三是极致弹性性能,支撑数十万实例秒级并发、毫秒级启动,应对脉冲式业务需求;四是全生态兼容,多方式接入且原生兼容主流行业协议,可与腾讯云HAI、混元大模型、高性能存储、全球算力资源池等全栈产品深度联动,提供从算力、模型到执行环境的端到端解决方案。同时,该沙箱还支持代码、浏览器、移动端、电脑端等全场景交互环境模拟,提供精准轨迹记录、断点快照回放、全链路可观测的实验支持能力,完美匹配Agent RL训练的核心需求。 双方共同表示,未来将持续深化技术协同与场景拓展,不断打磨Agent原生基础设施能力,助力大模型厂商降低技术门槛与使用成本,推动AI智能体在千行百业的规模化落地,加速通用人工智能(AGI)时代的到来。






- 最近发表
-
- 《从投入到产出:金融科技驱动银行业务增长的价值与路径研究》课题发布:为科技赋能锚定投入价值产出的度量
- 国家体育总局、中国奥林匹克委员会向中国乒乓球协会致贺信
- 王曼昱:决赛紧张惨烈 感谢孙颖莎创造救赎机会
- 热闻|对手压哨绝平球被吹!阿森纳1-0险胜西汉姆联,夺冠前景继续看好
- 阳光电源成立宸智科技公司,含光伏设备相关业务
- 大连国际徒步大会5月16日-17日举办
- 航行警告:南海部分海域进行火箭发射,禁止驶入
- 内塔尼亚胡:美以对伊朗的军事行动尚未结束
- 热依扎回应暂别演艺圈:没生病,同时照顾75岁父母和6岁女儿,难以兼顾三重身份,“人生就是取舍,但又发现取舍不代表遗憾”
- 中央气象台:11日至14日西北地区将有沙尘天气过程
- 随机阅读
-
- CBA季后赛:深圳男篮淘汰浙江稠州男篮,时隔三年再进四强
- 内塔尼亚胡与特朗普通电话
- 以军称其兵力逼近临界点,警告多线作战难以为继
- 冷藏货物完成塔架上临射安装,天舟十号“小时级”速递已揽收
- 安徽时评|“可以双输,但不能单赢”:解决网络交易纠纷不能仅靠个体“硬核维权”
- 岱勒新材核心股东质押比例61.84% 触发鹰眼“风险”评级
- 热闻|对手压哨绝平球被吹!阿森纳1-0险胜西汉姆联,夺冠前景继续看好
- 笑傲国家德比+提前夺冠 巴萨这个夜晚真欢乐
- 一土耳其客机在尼泊尔降落时轮胎起火,乘客紧急疏散
- 特朗普指责伊朗“拖延、戏弄”美国
- 冷藏货物完成塔架上临射安装,天舟十号“小时级”速递已揽收
- 26名“洪迪厄斯”号邮轮人员抵荷接受安置
- OPPO就母亲节营销文案存在的问题再发致歉声明
- 辽宁多所高校新增本科专业
- 广东湛江水产养殖基地培育新虾种——全链条服务,好苗出好虾
- 文化和旅游部公布2026年第二批旅游市场强制消费问题典型案例
- PCB概念涨势扩大 大族激光、广合科技双双涨停创历史新高
- 济阳街道柳行社区开展“包藏爱意留住时光”母亲节DIY活动
- 伊朗方面称已拒绝美国提出的方案
- 北京日报社区小板报 | 城中享野趣!北京规划宝藏公园
- 搜索
-
- 友情链接
-