马斯克鄙视Anthropic指控中国大模型“蒸馏”Claude

okynai 2026-02-25 10:29 23 阅读 AI资讯

2026年2月24日，美国AI巨头Anthropic在官网发布声明，矛头直指三家中国人工智能企业——深度求索（DeepSeek）、月之暗面（Moonshot）和MiniMax。声明指控这些公司通过约24000个账户与Claude进行了超过1600万次交互，试图通过“蒸馏”技术窃取Claude的功能以改进自身模型，并强调上述行为违反其服务条款和区域访问限制。

事件脉络：从技术限制到公开指控

Anthropic对中国市场的限制政策早有端倪。2024年5月，该公司旗下Claude相关模型停止对中国大陆地区提供支持；2025年9月，限制措施进一步升级，明确禁止向“中资关联方”提供服务。更引人注目的是，Anthropic CEO Dario Amodei曾公开呼吁禁止美国芯片出口中国，以限制中国AI产业发展。

北京大学新闻与传播学院教授胡泳将这种策略概括为“人工智能民族主义”——在技术民族主义的基础上，叠加了AI时代的地缘政治博弈。一位长期关注科技政策的研究员指出：“OpenAI一开始就不开放中国大陆接口，但最赤裸裸敌视的还是Anthropic。”

技术争议：什么是“蒸馏”？为何成为焦点？

“蒸馏”技术由“AI教父”杰弗里·辛顿于2015年提出，其核心原理是用大模型对话的输出作为小模型训练的教材。Anthropic在声明中承认，蒸馏是一种广泛使用且合法的训练方法，但强调“可能会被用于非法目的”——竞争对手可以借此以极低的成本和极短的时间，从其他实验室获取强大功能，而独立开发这些功能则需要更多时间和资源。

行业内的普遍看法却有所不同。一位学术界研究员表示：“蒸馏本身没啥，大家相互借鉴。你既然敢开放使用，就不要怕用你的回答当数据。”另一位知名研究机构的研究员补充道：“没有什么（有效的）方法确定蒸馏的情况，现在大家都互相这么做。”

被指控方的回应与行业现实

深度求索（DeepSeek）此前曾回应过OpenAI类似的指控。该公司强调，V3模型的训练数据都来自于网页和电子书，但也承认相关网页上可能包含了大量OpenAI模型生成的答案，这可能导致基础模型间接受益于其他强大模型的知识。DeepSeek的立场很明确：他们不否认使用了带有其他模型推理痕迹的知识进行训练，但这些数据都来自于公开网页，并非主动的“蒸馏”行为。

“现在这个时代，某个网页不是OpenAI官方的但里面有截取的部分对话，这很难避免。”前述学术界研究员补充说。这种现实反映了AI训练数据的复杂性——互联网上的内容早已是各种AI模型输出的混合体。

马斯克与社交网络的“反讽”

Anthropic的指控在社交网络上引发了意想不到的反应。特斯拉CEO埃隆·马斯克在X平台上转发用户评论时调侃道：“他们竟敢‘偷窃’Anthropic从人类程序员那里偷走的东西？”这一评论直指大模型训练数据来源的伦理困境。

另一位用户贴出的梗图更是将“问女性年龄”、“问男性薪资”、“问AI公司的训练数据从哪里来”列为三大不礼貌行为，暗示大模型训练数据来源已成为行业不愿深谈的敏感话题。前OpenAI联合创始人Ilya Sutskever在NeurIPS 2024大会上曾表达过类似观点：预训练时代即将结束，数据作为AI的化石燃料是有限的。

商业动机：国家安全外衣下的市场竞争

Anthropic在声明中特别强调了国家安全维度：“非法提炼的模型缺乏必要的安全保障，会造成重大的国家安全风险。Anthropic一直支持出口管制，以帮助美国保持其在人工智能领域的领先地位。”

这种表述与最近两届美国政府的对华科技政策保持高度一致。美国凯腾律所合伙人韩利杰认为此举既有商业目的，也是营销手段：“我觉得有两个原因：一个是价值观比较凸显，一个是为了利益。”前述长期关注科技政策的研究员补充道：“站队美国政府，拿订单和政策。”

事实确实如此。2025年，Anthropic与美国政府达成了多项重点合作：

2025年6月，推出专为国防、情报、执法等敏感场景设计的模型Claude Gov，获得政府合规优先认定。
2025年7月，与美国国防部CDAO签约，为国防场景开发定制模型、部署涉密网络，订单最高2亿美元。
2025年9月，签署白宫《AI安全承诺》《AI教育承诺》，被认定为“符合政府AI安全与伦理标准”的头部企业，获得美国政府采购白名单资格。

融资背景与市场格局

就在指控发布前不久的2月中旬，Anthropic宣布完成总额300亿美元的G轮融资，投后估值达3800亿美元。作为对比，OpenAI正在推动新一轮投后估值8500亿美元的融资。这一融资背景让Anthropic的指控时机显得尤为微妙。

值得注意的是，Anthropic与美国政府的关系并非牢不可破。当地时间2月23日，美国《国会山》报披露其与美国国防部近期在敏感领域的应用已出现分歧，有可能波及近2亿美元的订单。不过，对于年化收入已达140亿美元的Anthropic来说，2亿美元的订单影响有限，更重要的是维持其高优先级的美国政府承包商身份。

关联事实：中美AI竞争的三个维度

技术追赶与反超：中国大模型在多项基准测试中已接近甚至超越国际顶尖水平。智谱的GLM-5在编程能力评测SWE-bench中获77.8分，与Claude Opus 4.5的80.9分差距仅3.1个百分点；在智能体能力测试BrowseComp中，GLM-5以62.0分远超Claude Opus 4.5的37.0分。

供应链自主化：华为昇腾已实现W4A8混合精度量化，使744B超大参数模型可在Atlas 800 A3单机部署，实测性能对标英伟达H100双机。摩尔线程、寒武纪、昆仑芯等国产算力平台也已完成与大模型的深度推理适配。

数据生态重构：中国互联网公司开始构建“数据护城河”。字节跳动的豆包大模型2.0依托抖音、今日头条的生态数据；阿里巴巴的通义系列模型整合电商、物流、金融多场景数据；百度的文心一言则深耕搜索与知识图谱。

观察：技术民族主义下的创新困境

Anthropic此次指控的本质，是技术优势方试图通过政治化和法律化手段维持市场垄断地位。这种策略在短期内可能有效，但长期来看可能适得其反。

创新悖论：当技术竞争演变为政治博弈，真正的创新反而可能受到抑制。中国大模型公司被迫加速自主创新，而美国公司则可能因缺乏竞争而放缓技术进步。

数据伦理的双重标准：马斯克的调侃点出了一个关键问题——所有大模型都在“燃烧”互联网数据，区别只在于是否获得明确授权。当Anthropic指责他人“偷窃”时，其自身训练数据的合法性同样值得审视。

全球协作的倒退：AI技术的发展本应受益于全球知识共享，但地缘政治紧张正在摧毁这一基础。斯坦福大学《2025年AI指数报告》显示，中美AI合作论文数量已从2019年的峰值下降62%。

对中国企业的启示：此次事件再次证明，核心技术必须自主可控。从芯片到框架，从数据到应用，全产业链的自主化不是选项，而是生存必需。同时，中国企业需要加强国际规则研究，在法律和伦理层面建立防御体系。

最终，这场争议的胜负不会由一纸声明决定，而将由技术创新和市场需求裁决。当中国大模型在更多场景证明其价值时，所有的指控都将显得苍白无力。