中意知识网 中意知识网

当前位置: 首页 » 常用知识 »

阿里开源新一代通义千问模型Qwen3

【大河财立方消息】4月29日早间,阿里巴巴开源新一代通义千问模型Qwen3。

此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。

小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B10%,表现更胜一筹,Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。

未经允许不得转载: 中意知识网 » 阿里开源新一代通义千问模型Qwen3