阿里巴巴的千问3.7闯入全球编程前二

Code Arena 最新战绩揭晓：Qwen3.7-Max 狂揽 1541 分，以“非 Claude"身份登顶全球第四

近日，Code Arena 发布了最新榜单，Qwen3.7-Max 以高达 1541 分的卓越成绩一举闯入全球前四。
这一表现不仅让它成为了全球编程模型榜单中唯一的非 Anthropic 模型，更让阿里成为仅次于 Anthropic 的“第二中国厂商”，在全球编程竞技场中杀出重围。

**超越众矢之的，打破壁垒**
在榜单公布前，Qwen3.7-Max 早已在海外开发者圈中崭露头角。
此前在 Atomic Chat 组织的“俄罗斯方块自训练 AI"硬碰硬对决中，Qwen3.7-Max 仅用$1.32的 token 成本便超越了 Opus 4.7 与 GPT-5.5，性能还提升了 56%。
此外，在构建"3D 像素风微缩宝塔模型”的任务中，其输出速度和质量全面胜出。
海外开发者 Paul Couvert 甚至盛赞，在接入 Hermes Agent 和 OpenCode 后，Qwen3.7-Max 已能基本替代 GPT-5.5 与 Opus 4.7。

**真枪实弹：从游戏 BUG 到完美体验**
然而，跑分再高不如真刀真枪。
在最新的一场硬核赛车游戏挑战中，Qwen3.7-Max 的表现令人惊叹。
虽然第一版代码出现 A/D 键左右搞反的小 bug，但经过第二轮对话微调后，一个包含四车、3 圈环形赛道及散落金币的完整游戏跑了起来。

赛后的成绩面板、排名统计无一遗漏，且真正让 Qwen3.7-Max 脱颖而出的是两个细节：
1. **界面体验**：与其他三家模型（GPT-5.5/Opus 4.7/Gemini 3.5 Flash）直接打开即跑的简陋开场不同，Qwen3.7-Max 精心设计了正经的开始页面，点击“Start"后才进入比赛，细节之处尽显匠心。

2. **沉浸音效**：响应 prompt 中对“发动机轰鸣”和“金币叮咚”的指令，Qwen3.7-Max 成功纳入了完整的音效，而其他选手要么画面单薄、缺乏立体感（如 Gemini 3.5 Flash），要么 UI 布局分散、视觉焦点杂乱。

**结语**
CLOD 在 Code Arena 平台上的表现确实令人印象深刻，其 UI 布局的严谨度与音效细节的丰富程度，展现了 Qwen3.7-Max 在处理复杂任务时的强大潜力。