阿里推出万亿参数大模型Qwen3-Max-Preview，强势对标国际顶级AI

阿里通义千问团队交出了一份引人注目的新答卷——万亿参数大模型Qwen3-Max-Preview正式发布，其在多项基准测试中超越Claude Opus 4等国际顶尖模型。

近日，阿里巴巴正式推出其迄今为止规模最大的语言模型——Qwen3-Max-Preview，参数量突破万亿级别。该模型已在阿里百炼平台上线，并同步向通义千问应用及Qwen Chat用户开放免费体验。

这款大模型采用混合专家架构（MoE），在保持万亿参数规模的同时，能够快速适配实际业务场景。其核心优化方向聚焦于指令遵循能力与工具调用的可靠性，特别针对企业应用中常见的知识准确性问题进行了专项改进。

多项性能超越顶级模型

根据百炼平台披露的测试数据，Qwen3-Max-Preview在**多维度能力上实现显著跃升**。

在权威评测中，该模型在通用知识、数学推理、编程能力等五大领域超越Claude-Opus 4等国际顶尖模型，同时刷新了阿里自研模型的性能纪录。

具体测试结果显示，该模型在知识推理评测（SuperGPQA）中拿下64.6分，在数学推理评测（AIME25）中获得80.6分的断崖式领先。

强化复杂任务处理能力。

实际体验显示，模型在复杂场景模拟中展现出惊人实力。当要求生成包含碰撞反弹机制的小球运动程序时，系统仅用数秒便输出完整代码，精准模拟物理交互过程。

更令人瞩目的是，在种群进化模拟实验中，面对“力量型”与“速度型”生物的对抗设定，模型能准确理解“躲避危险”“团队协作”等抽象概念，自动调整参数实现生物行为的动态演化。

该模型还支持超百种语言的实时处理，在数学建模、逻辑推理等专项任务中准确率大幅提升。

阶梯式定价降低使用门槛

Qwen3-Max-Preview采用阶梯式收费模式，256k上下文窗口下按输入token量分级计费。

在0-32k区间输入费用为0.006元/千token，32k-128k区间升至0.01元/千token，128k以上则为0.015元/千token，输出价格相应递增。

相较于前代产品，新模型在保持性能优势的同时，通过分层定价策略降低了使用门槛。

相关文章