← back to index
2026-04-19 · #06

AI 顶端模型:中国追赶美国的错觉?

追上别人定的指标,你依然是跟随者。蒸馏是一条安全的路,但安全的路从来没有人引领过世界。


每次看到”中国 AI 什么时候能追上美国”这种标题,我心里都会卡一下。不是因为答案难,是因为问题本身就不对。追上别人定的指标,你依然是跟随者。

表面在追,实际在蒸馏

复盘一下这几年的路径:GPT-4 出来,国内一堆模型在跑分上逼近;Claude 3.5 出来,大家又追到 3.5 附近;现在 GPT-5、Claude 4.7 是新标杆,国内最强的也在往这个方向靠。

追的速度越来越快,这看起来是好事。但有个在业内不算秘密的事实是——很长一段时间里,很多中国模型的能力是从这些美国顶端模型蒸馏出来的。用 GPT 的输出做 SFT 数据、用 Claude 的回答训练偏好、用 o1 的推理链做 distillation。跑分逼近是真的,但那个”逼近”是学生抄老师作业的成绩,不是学生自己会解题

蒸馏是很有效的工程手段。它让你省了几亿美元、省了两三年。但它的逻辑就是跟随者的逻辑——你永远以别人的天花板为自己的上限。抄得再像,你也定义不了下一道题。

刷 Benchmark 是谁的游戏

所有跑分都是西方先定的。MMLU、HumanEval、GSM8K、SWE-Bench——你刷到第一,只证明了一件事:你最会做别人出的题

真正改变行业的从来不是跑分,是交互范式的跳跃:ChatGPT 重新定义了”和 AI 聊天”是什么;Cursor 重新定义了”写代码”是什么;Claude Code 让 AI 从对话框走进终端,变成同事。

每一次改变行业的都是新问题,不是新答案。而我们一直在刷答案。

我们为什么停不下来

因为追赶反馈快:美国发新模型,三个月内就能蒸馏一个差不多的,跑分发布会、融资、估值——所有人看得见。

真正的原创反馈慢:ChatGPT 之前 OpenAI 沉默了好几年。这种事在月度考核的公司里根本做不出来。

刷指标、做蒸馏,路径清晰、风险低、能交差。它是一条安全的路——但安全的路从来没有人引领过世界。

收束

真正的引领不是速度,是方向。追赶逻辑让你永远慢半步,因为你走的是别人走过的路。

不要再问”什么时候能追上美国”。这个问题本身就把我们困在了跟随的位置上。

换答案之前,先换问题。