阿里通义千问团队交出了一份引人注目的新答卷——万亿参数大模型Qwen3-Max-Preview正式发布,其在多项基准测试中超越Claude Opus 4等国际顶尖模型。

近日,阿里巴巴正式推出其迄今为止规模最大的语言模型——Qwen3-Max-Preview,参数量突破万亿级别。该模型已在阿里百炼平台上线,并同步向通义千问应用及Qwen Chat用户开放免费体验。

这款大模型采用混合专家架构(MoE),在保持万亿参数规模的同时,能够快速适配实际业务场景。其核心优化方向聚焦于指令遵循能力与工具调用的可靠性,特别针对企业应用中常见的知识准确性问题进行了专项改进。

多项性能超越顶级模型

根据百炼平台披露的测试数据,Qwen3-Max-Preview**多维度能力上实现显著跃升**

在权威评测中,该模型在通用知识、数学推理、编程能力等五大领域超越Claude-Opus 4等国际顶尖模型,同时刷新了阿里自研模型的性能纪录。

具体测试结果显示,该模型在知识推理评测(SuperGPQA)中拿下64.6分,在数学推理评测(AIME25)中获得80.6分的断崖式领先。

强化复杂任务处理能力。

实际体验显示,模型在复杂场景模拟中展现出惊人实力。当要求生成包含碰撞反弹机制的小球运动程序时,系统仅用数秒便输出完整代码,精准模拟物理交互过程。

更令人瞩目的是,在种群进化模拟实验中,面对“力量型”与“速度型”生物的对抗设定,模型能准确理解“躲避危险”“团队协作”等抽象概念,自动调整参数实现生物行为的动态演化。

该模型还支持超百种语言的实时处理,在数学建模、逻辑推理等专项任务中准确率大幅提升。

阶梯式定价降低使用门槛

Qwen3-Max-Preview采用阶梯式收费模式,256k上下文窗口下按输入token量分级计费。

0-32k区间输入费用为0.006/token32k-128k区间升至0.01/token128k以上则为0.015/token,输出价格相应递增。

相较于前代产品,新模型在保持性能优势的同时,通过分层定价策略降低了使用门槛。


0 条评论

发表回复

Avatar placeholder

您的邮箱地址不会被公开。 必填项已用 * 标注

Document