正文:6月30日,华为正式宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专家模型和基于昇腾的模型推理技术。
据悉,盘古 Pro MoE 72B 模型权重、基础推理代码,已正式上线开源平台。基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台。盘古 7B 相关模型权重与推理代码将于近期上线开源平台。
据介绍,盘古 Embedded 7B 模型参数规模为 70 亿,采用双系统框架,具备「快思考」和「慢思考」能力。盘古 Pro MoE 72B 模型总参数量 720 亿,激活参数量 160 亿,推理速度最高可达单卡 1528 tokens/s。