
2026年3月19日,知名AI代码编辑器Cursor正式发布了其第二代自研编程大模型Composer 2。这款专为代码生成与理解而设计的模型,在多项基准测试中展现出逼近甚至超越行业顶尖模型的性能,而其极具竞争力的定价策略,则直接向OpenAI与Anthropic等通用大模型供应商发起了挑战。

性能数据:编码能力跻身第一梯队
根据Cursor官方发布的基准测试结果,Composer 2在多项关键评测中表现突出。在衡量智能体终端编码能力的Terminal-Bench 2.0测试中,Composer 2取得了61.7%的得分。这一成绩超越了Anthropic旗舰模型Claude Opus 4.6在同一测试环境下58.0%的分数,尽管OpenAI的GPT-5.4仍以75.1%保持领先。
在Cursor内部用于评估真实编码场景的CursorBench测试中,Composer 2的得分达到61.3%,较其前代Composer 1.5的44.2%实现了大幅跃升,同样高于Claude Opus 4.6的58.2%。此外,在多语言软件工程问题解决基准SWE-bench Multilingual上,Composer 2也取得了73.7%的成绩。

定价策略:成本优势成为核心武器
除了性能提升,Composer 2最引人注目的是其激进的定价。该模型标准版的定价为每百万输入Token 0.50美元,每百万输出Token 2.50美元。这一价格仅为Claude Opus 4.6(输入5美元/百万Token,输出25美元/百万Token)的十分之一,也显著低于GPT-5.4(输入2.5美元/百万Token,输出15美元/百万Token)。
Cursor还提供了一个智能水平相同但推理速度更快的变体版本Composer 2 Fast,其定价为每百万输入Token 1.50美元,输出7.50美元。官方表示,即使这一快速版本,其成本也低于市场上其他快速模型。对于个人方案用户,Composer的使用量将被计入独立的用量池,并包含充足的免费额度。

技术特点:专为长周期编程任务优化
Composer 2是Cursor的第三代自研模型。其技术升级的重点在于处理“长周期任务”的能力。Cursor团队通过强化学习专门训练模型解决需要数百个操作步骤的复杂编程问题。这种“极度克制”的训练策略使其完全专注于代码数据,虽然牺牲了通用对话能力,但在专业编码任务上实现了更高的效率与准确性。
行业影响:垂直工具厂商的突围之战
Composer 2的发布被视为AI编程工具领域竞争格局变化的一个重要信号。此前,Cursor等应用层厂商严重依赖底层模型供应商的API,不仅需要支付高昂费用,其业务也面临被上游竞争对手(如Anthropic推出的Claude Code)直接冲击的风险。
通过推出在特定任务上性能足够优秀且成本极具优势的自研模型,Cursor正在尝试构建从编辑器到模型底层的完整技术栈,以掌握更大的自主权与定价能力。目前,Cursor已拥有超过100万日活跃用户和5万家企业客户。Composer 2的推出,标志着垂直领域的AI工具厂商开始从“应用层”向“模型层”延伸,以寻求更稳固的市场地位。
Composer 2现已面向Cursor订阅用户开放试用,用户可在IDE中直接体验,或通过其新界面的早期Alpha版本进行尝试。