阿里云突袭上线新一代通义千问模型Qwen3，部署成本极大降低

2025-04-29ASPCMS社区 - fjmyhfvclm

从4月中旬就在传闻将上线的阿里新一代通义千问模型Qwen3，终于在4月29日凌晨发布了。

Qwen3可以说是阿里大模型的集大成者，在全球开发者社区GitHub发布四个小时后，便获得了1.7万个星标，刷新了开源大模型的热度纪录。

此次Qwen3一共开源了8款“混合推理模型”。其中包括两款MoE（混合专家）模型：Qwen3-235B-A22B（2350多亿总参数、 220多亿激活参），以及Qwen3-30B-A3B（300亿总参数、30亿激活参数）。以及六个Dense（稠密）模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中，Qwen3-235B-A22B是Qwen3系列模型中性能最强的。阿里Qwen3技术文档披露，它在基准测试中的得分，和DeepSeek-R1、OpenAI旗下的o1、o3-mini，ASPCMS社区的 Gemini-2.5-Pro等全球一流大模型不相上下。

作为一款“混合推理模型”，Qwen3将“快思考”与“慢思考”集成进同一个模型，对简单需求可低算力“秒回”答案。特别是对复杂问题可多步骤“深度思考”，节省算力消耗。

Qwen3总参数量235B，激活仅需22B。阿里称，仅需4张H20即可部署Qwen3满血版，显存占用仅为性能相近模型的三分之一。

同时，Qwen3模型也支持119种语言和方言，意味着Qwen 3瞄准了国际应用。

Qwen3也为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中，Qwen3创下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型，这将大幅降低Agent调用工具的门槛。

同时，Qwen3也原生支持MCP协议，并具备强大的工具调用能力，结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架。这将大大降低编码复杂性，实现高效的手机及电脑Agent操作等任务。