AI 顶端模型：中国追赶美国的错觉？

追上别人定的指标，你依然是跟随者。蒸馏是一条安全的路，但安全的路从来没有人引领过世界。

每次看到”中国 AI 什么时候能追上美国”这种标题，我心里都会卡一下。不是因为答案难，是因为问题本身就不对。追上别人定的指标，你依然是跟随者。

表面在追，实际在蒸馏

复盘一下这几年的路径：GPT-4 出来，国内一堆模型在跑分上逼近；Claude 3.5 出来，大家又追到 3.5 附近；现在 GPT-5、Claude 4.7 是新标杆，国内最强的也在往这个方向靠。

追的速度越来越快，这看起来是好事。但有个在业内不算秘密的事实是——很长一段时间里，很多中国模型的能力是从这些美国顶端模型蒸馏出来的。用 GPT 的输出做 SFT 数据、用 Claude 的回答训练偏好、用 o1 的推理链做 distillation。跑分逼近是真的，但那个”逼近”是学生抄老师作业的成绩，不是学生自己会解题。

蒸馏是很有效的工程手段。它让你省了几亿美元、省了两三年。但它的逻辑就是跟随者的逻辑——你永远以别人的天花板为自己的上限。抄得再像，你也定义不了下一道题。

刷 Benchmark 是谁的游戏

所有跑分都是西方先定的。MMLU、HumanEval、GSM8K、SWE-Bench——你刷到第一，只证明了一件事：你最会做别人出的题。

真正改变行业的从来不是跑分，是交互范式的跳跃：ChatGPT 重新定义了”和 AI 聊天”是什么；Cursor 重新定义了”写代码”是什么；Claude Code 让 AI 从对话框走进终端，变成同事。

每一次改变行业的都是新问题，不是新答案。而我们一直在刷答案。

我们为什么停不下来

因为追赶反馈快：美国发新模型，三个月内就能蒸馏一个差不多的，跑分发布会、融资、估值——所有人看得见。

真正的原创反馈慢：ChatGPT 之前 OpenAI 沉默了好几年。这种事在月度考核的公司里根本做不出来。

刷指标、做蒸馏，路径清晰、风险低、能交差。它是一条安全的路——但安全的路从来没有人引领过世界。

收束

真正的引领不是速度，是方向。追赶逻辑让你永远慢半步，因为你走的是别人走过的路。

不要再问”什么时候能追上美国”。这个问题本身就把我们困在了跟随的位置上。

换答案之前，先换问题。