用你AI 用你AI
首页 AI资讯
用你AI 用你AI
全部
AI编程工具
AI聊天助手
AI浏览器
AI图像工具
AI Agent 智能体
AI音乐音频
AI漫剧短剧
首页 AI资讯

稀宇科技MiniMax M2.7正式发布:首个实现“自我进化”的AI模型

okynai 2026-03-18 18:42 106 阅读 AI资讯

okynai.jpg

2026年3月18日,国内AI公司稀宇科技MiniMax正式推出其M2系列模型的最新版本M2.7。此次更新并非简单的性能提升,而是标志着AI模型发展进入一个全新阶段:M2.7成为首个深度参与自身迭代过程的模型,开启了模型的“自我进化”之路。该模型在复杂的软件工程任务、专业办公场景及互动娱乐方面均展现出显著进步,其多项关键评测成绩已接近或达到全球顶级模型水平。

okynai.jpg

核心突破:模型驱动自身进化的“智能体”

M2.7最引人注目的特性是其“自我进化”能力。MiniMax团队透露,在研发M2.7的过程中,他们构建了一个由模型自身驱动的“研究型智能体”框架。该框架能够与数据流水线、训练环境、评测基础设施等进行交互,协助研究员完成从文献调研、实验设计、代码修复到结果分析的完整研发流程。

在一个具体的强化学习(RL)场景案例中,研究员提出一个实验想法后,该智能体可以自动执行监控实验状态、分析日志、排查问题、修复代码、合并请求等一系列过去需要多个团队协作的复杂工作流,使研究员只需在关键决策点介入。据官方数据,在此类场景下,M2.7能够自主完成30%至50%的工作流。

更进一步的实践是,M2.7被用于优化其自身的软件工程开发脚手架。模型能够完全自主运行超过100轮“分析失败轨迹→规划改动→修改代码→运行评测→对比结果→决定保留或回退”的迭代循环,并最终将内部评测集上的效果提升了30%。这证明了模型具备自主发现优化策略(如系统搜索最优采样参数、设计更高效的工作流)的能力。

okynai.jpg

实战表现:软件工程能力跻身第一梯队

在编程与软件工程领域,M2.7展现了解决真实世界复杂问题的强大能力。官方分享了一个线上生产环境故障调试的案例:面对实际的生产告警,M2.7能够关联监控指标与部署时间线进行因果推理,主动连接数据库验证根因,最终定位到缺失的索引迁移文件,并提出“用非阻塞建索引先止血”的SRE级决策。基于此能力,团队已多次将线上故障恢复时间缩短至三分钟以内。

在权威基准测试中,M2.7的成绩证实了其顶尖水准。在涵盖多种编程语言的SWE-Pro测试中,M2.7取得了56.22%的正确率,与GPT-5.3-Codex持平。在更贴近真实工程场景的端到端项目交付基准VIBE-Pro上,其55.6%的得分几乎与Opus 4.6相当。在对系统理解要求极高的Terminal Bench 2测试中,M2.7也获得了57.0%的分数。

专业办公:从数据处理到金融建模的全栈助手

在办公生产力场景,M2.7的核心提升在于专业知识与复杂环境交互能力。在衡量各领域专业知识与任务交付能力的GDPval-AA评测中,M2.7的ELO得分达到1495,在45个模型中位列开源最高,仅次于Opus 4.6、Sonnet 4.6和GPT-5.4。

模型对Word、Excel、PPT的复杂编辑能力显著增强,能够基于模板生成文件,也能根据用户指令对已有文件进行多轮高保真修改。在需要调用大量复杂技能(Skill)的真实工作场景中,M2.7在40个超过2000个Token的复杂技能用例上,仍能保持97%的遵循率。

一个突出的案例是金融分析领域。M2.7可以自主阅读公司年报、业绩沟通会纪要和多篇研报,交叉比对信息,独立设计假设并构建营收预测模型,最终基于模板产出包含PPT、Word研究报告和Excel图表的完整投资分析材料。其产出的关于台积电(TSMC)的深度研究报告,结构完整、数据详实,已被从业者评价为“可作为初稿直接进入后续工作流程”。

互动娱乐:高情商与强人设保持

除了生产力工具属性,M2.7在“情商”和复杂人设保持能力上也有极大加强。随着用户开始与智能体“自然相处”而不仅是“下达指令”,模型在互动娱乐场景的潜力得以释放。

为此,MiniMax同步开源了一个名为“OpenRoom”的AI交互系统原型。该系统将AI互动置于一个万物皆可互动的Web GUI空间中,实现“对话即驱动”,角色可以主动与环境交互并产生实时视觉反馈。该项目的大部分代码也由AI生成,旨在探索人与智能体之间全新的交互方式。

模型获取与体验

目前,MiniMax M2.7模型已在MiniMax Agent平台(agent.minimaxi.com)及开放平台API服务(platform.minimaxi.com)上全量上线。对于有深度编程需求的开发者,平台还提供了“Coding Plan”订阅服务。同时,开源项目OpenRoom的代码仓库(github.com/MiniMax-AI/OpenRoom)和体验地址(openroom.ai)也已对外开放,供社区探索与共建。

M2.7的发布,不仅是一次模型能力的迭代,更展示了AI从被动执行工具向主动协作、甚至自我优化伙伴演进的可能性。其在真实软件工程和复杂专业任务中的表现,预示着AI智能体(Agent)正加速从技术演示走向规模化应用。

okynai.jpg


标签: MiniMax Agent AI智能体 AI Agent 稀宇科技 MiniMax AI大模型

相关文章

飞书Aily怎么使用:飞书Aily能帮你干什么
AI Agentai智能体
飞书Aily怎么使用:飞书Aily能帮你干什么
AI资讯 2026-03-20
2026年飞书新品发布会:8款AI产品打造原生智能工作伙伴
AI Agentai智能体
2026年飞书新品发布会:8款AI产品打造原生智能工作伙伴
AI资讯 2026-03-20
腾讯AI设计工具Ardot发布:如何提取解锁体验测试设计小助手
ArdotAI设计工具
腾讯AI设计工具Ardot发布:如何提取解锁体验测试设计小助手
AI资讯 2026-03-20
疑似谷歌“桌面龙虾”Janus内测:原生Gemini应用杀入Mac
AI Agentai智能体
疑似谷歌“桌面龙虾”Janus内测:原生Gemini应用杀入Mac
AI资讯 2026-03-20
Copyright © 2026 用你AI · 滇ICP备17007916号-1