阿里开源新一代通义千问模型Qwen3

2025-04-29ASPCMS社区 - fjmyhfvclm

️【大河财立方消息】4月29日早间,阿里巴巴开源新一代通义千问模型Qwen3。

此次开源包括️两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及️六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

️旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。

️小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B10%,表现更胜一筹,Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。

全部评论