阿里巴巴的千问3.7闯入全球编程前二

发布时间:2026-05-27 20:57:00

中国AI闯入全球编程前二!前面只剩Claude

Code Arena 最新战绩揭晓:Qwen3.7-Max 狂揽 1541 分,以“非 Claude"身份登顶全球第四


近日,Code Arena 发布了最新榜单,Qwen3.7-Max 以高达 1541 分的卓越成绩一举闯入全球前四。
这一表现不仅让它成为了全球编程模型榜单中唯一的非 Anthropic 模型,更让阿里成为仅次于 Anthropic 的“第二中国厂商”,在全球编程竞技场中杀出重围。


**超越众矢之的,打破壁垒**
在榜单公布前,Qwen3.7-Max 早已在海外开发者圈中崭露头角。
此前在 Atomic Chat 组织的“俄罗斯方块自训练 AI"硬碰硬对决中,Qwen3.7-Max 仅用$1.32的 token 成本便超越了 Opus 4.7 与 GPT-5.5,性能还提升了 56%。
此外,在构建"3D 像素风微缩宝塔模型”的任务中,其输出速度和质量全面胜出。
海外开发者 Paul Couvert 甚至盛赞,在接入 Hermes Agent 和 OpenCode 后,Qwen3.7-Max 已能基本替代 GPT-5.5 与 Opus 4.7。


**真枪实弹:从游戏 BUG 到完美体验**
然而,跑分再高不如真刀真枪。
在最新的一场硬核赛车游戏挑战中,Qwen3.7-Max 的表现令人惊叹。
虽然第一版代码出现 A/D 键左右搞反的小 bug,但经过第二轮对话微调后,一个包含四车、3 圈环形赛道及散落金币的完整游戏跑了起来。


赛后的成绩面板、排名统计无一遗漏,且真正让 Qwen3.7-Max 脱颖而出的是两个细节:
1. **界面体验**:与其他三家模型(GPT-5.5/Opus 4.7/Gemini 3.5 Flash)直接打开即跑的简陋开场不同,Qwen3.7-Max 精心设计了正经的开始页面,点击“Start"后才进入比赛,细节之处尽显匠心。

2. **沉浸音效**:响应 prompt 中对“发动机轰鸣”和“金币叮咚”的指令,Qwen3.7-Max 成功纳入了完整的音效,而其他选手要么画面单薄、缺乏立体感(如 Gemini 3.5 Flash),要么 UI 布局分散、视觉焦点杂乱。


**结语**
CLOD 在 Code Arena 平台上的表现确实令人印象深刻,其 UI 布局的严谨度与音效细节的丰富程度,展现了 Qwen3.7-Max 在处理复杂任务时的强大潜力。
← 上一篇:高通与字节跳动达成AI芯片协议 下一篇:双汇猪肉药残超标 →