用你AI 用你AI
首页 AI资讯
用你AI 用你AI
全部
AI编程工具
AI聊天助手
AI浏览器
AI图像工具
AI Agent 智能体
AI音乐音频
AI漫剧短剧
首页 AI资讯

马斯克鄙视Anthropic指控中国大模型“蒸馏”Claude

okynai 2026-02-25 10:29 23 阅读 AI资讯

2026年2月24日,美国AI巨头Anthropic在官网发布声明,矛头直指三家中国人工智能企业——深度求索(DeepSeek)、月之暗面(Moonshot)和MiniMax。声明指控这些公司通过约24000个账户与Claude进行了超过1600万次交互,试图通过“蒸馏”技术窃取Claude的功能以改进自身模型,并强调上述行为违反其服务条款和区域访问限制。

image.png

事件脉络:从技术限制到公开指控

Anthropic对中国市场的限制政策早有端倪。2024年5月,该公司旗下Claude相关模型停止对中国大陆地区提供支持;2025年9月,限制措施进一步升级,明确禁止向“中资关联方”提供服务。更引人注目的是,Anthropic CEO Dario Amodei曾公开呼吁禁止美国芯片出口中国,以限制中国AI产业发展。

北京大学新闻与传播学院教授胡泳将这种策略概括为“人工智能民族主义”——在技术民族主义的基础上,叠加了AI时代的地缘政治博弈。一位长期关注科技政策的研究员指出:“OpenAI一开始就不开放中国大陆接口,但最赤裸裸敌视的还是Anthropic。”

技术争议:什么是“蒸馏”?为何成为焦点?

“蒸馏”技术由“AI教父”杰弗里·辛顿于2015年提出,其核心原理是用大模型对话的输出作为小模型训练的教材。Anthropic在声明中承认,蒸馏是一种广泛使用且合法的训练方法,但强调“可能会被用于非法目的”——竞争对手可以借此以极低的成本和极短的时间,从其他实验室获取强大功能,而独立开发这些功能则需要更多时间和资源。

行业内的普遍看法却有所不同。一位学术界研究员表示:“蒸馏本身没啥,大家相互借鉴。你既然敢开放使用,就不要怕用你的回答当数据。”另一位知名研究机构的研究员补充道:“没有什么(有效的)方法确定蒸馏的情况,现在大家都互相这么做。”

被指控方的回应与行业现实

深度求索(DeepSeek)此前曾回应过OpenAI类似的指控。该公司强调,V3模型的训练数据都来自于网页和电子书,但也承认相关网页上可能包含了大量OpenAI模型生成的答案,这可能导致基础模型间接受益于其他强大模型的知识。DeepSeek的立场很明确:他们不否认使用了带有其他模型推理痕迹的知识进行训练,但这些数据都来自于公开网页,并非主动的“蒸馏”行为。

“现在这个时代,某个网页不是OpenAI官方的但里面有截取的部分对话,这很难避免。”前述学术界研究员补充说。这种现实反映了AI训练数据的复杂性——互联网上的内容早已是各种AI模型输出的混合体。

马斯克与社交网络的“反讽”

Anthropic的指控在社交网络上引发了意想不到的反应。特斯拉CEO埃隆·马斯克在X平台上转发用户评论时调侃道:“他们竟敢‘偷窃’Anthropic从人类程序员那里偷走的东西?”这一评论直指大模型训练数据来源的伦理困境。

另一位用户贴出的梗图更是将“问女性年龄”、“问男性薪资”、“问AI公司的训练数据从哪里来”列为三大不礼貌行为,暗示大模型训练数据来源已成为行业不愿深谈的敏感话题。前OpenAI联合创始人Ilya Sutskever在NeurIPS 2024大会上曾表达过类似观点:预训练时代即将结束,数据作为AI的化石燃料是有限的。

商业动机:国家安全外衣下的市场竞争

Anthropic在声明中特别强调了国家安全维度:“非法提炼的模型缺乏必要的安全保障,会造成重大的国家安全风险。Anthropic一直支持出口管制,以帮助美国保持其在人工智能领域的领先地位。”

这种表述与最近两届美国政府的对华科技政策保持高度一致。美国凯腾律所合伙人韩利杰认为此举既有商业目的,也是营销手段:“我觉得有两个原因:一个是价值观比较凸显,一个是为了利益。”前述长期关注科技政策的研究员补充道:“站队美国政府,拿订单和政策。”

事实确实如此。2025年,Anthropic与美国政府达成了多项重点合作:

  • 2025年6月,推出专为国防、情报、执法等敏感场景设计的模型Claude Gov,获得政府合规优先认定。

  • 2025年7月,与美国国防部CDAO签约,为国防场景开发定制模型、部署涉密网络,订单最高2亿美元。

  • 2025年9月,签署白宫《AI安全承诺》《AI教育承诺》,被认定为“符合政府AI安全与伦理标准”的头部企业,获得美国政府采购白名单资格。

融资背景与市场格局

就在指控发布前不久的2月中旬,Anthropic宣布完成总额300亿美元的G轮融资,投后估值达3800亿美元。作为对比,OpenAI正在推动新一轮投后估值8500亿美元的融资。这一融资背景让Anthropic的指控时机显得尤为微妙。

值得注意的是,Anthropic与美国政府的关系并非牢不可破。当地时间2月23日,美国《国会山》报披露其与美国国防部近期在敏感领域的应用已出现分歧,有可能波及近2亿美元的订单。不过,对于年化收入已达140亿美元的Anthropic来说,2亿美元的订单影响有限,更重要的是维持其高优先级的美国政府承包商身份。

关联事实:中美AI竞争的三个维度

技术追赶与反超:中国大模型在多项基准测试中已接近甚至超越国际顶尖水平。智谱的GLM-5在编程能力评测SWE-bench中获77.8分,与Claude Opus 4.5的80.9分差距仅3.1个百分点;在智能体能力测试BrowseComp中,GLM-5以62.0分远超Claude Opus 4.5的37.0分。

供应链自主化:华为昇腾已实现W4A8混合精度量化,使744B超大参数模型可在Atlas 800 A3单机部署,实测性能对标英伟达H100双机。摩尔线程、寒武纪、昆仑芯等国产算力平台也已完成与大模型的深度推理适配。

数据生态重构:中国互联网公司开始构建“数据护城河”。字节跳动的豆包大模型2.0依托抖音、今日头条的生态数据;阿里巴巴的通义系列模型整合电商、物流、金融多场景数据;百度的文心一言则深耕搜索与知识图谱。

观察:技术民族主义下的创新困境

Anthropic此次指控的本质,是技术优势方试图通过政治化和法律化手段维持市场垄断地位。这种策略在短期内可能有效,但长期来看可能适得其反。

创新悖论:当技术竞争演变为政治博弈,真正的创新反而可能受到抑制。中国大模型公司被迫加速自主创新,而美国公司则可能因缺乏竞争而放缓技术进步。

数据伦理的双重标准:马斯克的调侃点出了一个关键问题——所有大模型都在“燃烧”互联网数据,区别只在于是否获得明确授权。当Anthropic指责他人“偷窃”时,其自身训练数据的合法性同样值得审视。

全球协作的倒退:AI技术的发展本应受益于全球知识共享,但地缘政治紧张正在摧毁这一基础。斯坦福大学《2025年AI指数报告》显示,中美AI合作论文数量已从2019年的峰值下降62%。

对中国企业的启示:此次事件再次证明,核心技术必须自主可控。从芯片到框架,从数据到应用,全产业链的自主化不是选项,而是生存必需。同时,中国企业需要加强国际规则研究,在法律和伦理层面建立防御体系。

最终,这场争议的胜负不会由一纸声明决定,而将由技术创新和市场需求裁决。当中国大模型在更多场景证明其价值时,所有的指控都将显得苍白无力。


标签: Anthropic Claude DeepSeek

相关文章

DeepSeek V4 发布上线:专门为国产芯片而生
AI大模型DeepSeek
DeepSeek V4 发布上线:专门为国产芯片而生
AI资讯 2026-03-02
Anthropic发布Claude Opus 4.6:开启企业级AI新纪元
ClaudeClaude Opus 4.6
Anthropic发布Claude Opus 4.6:开启企业级AI新纪元
AI资讯 2026-02-06
腾讯AI元宝派开启内测:AI社交化战略重大尝试
腾讯AI腾讯
腾讯AI元宝派开启内测:AI社交化战略重大尝试
AI资讯 2026-01-26
腾讯QClaw内测即将结束!疑似明日版本更新或开启公测
AI大模型AI Agent
腾讯QClaw内测即将结束!疑似明日版本更新或开启公测
AI资讯 2026-03-17
Copyright © 2026 用你AI · 滇ICP备17007916号-1