阿里开源全新架构Qwen3-Next,80B参数新模型只需激活3B即可实现旗舰性能。
9月12日,阿里通义发布下一代基础模型架构Qwen3-Next和基于新架构的模型Qwen3-Next-80B-A3B ,包含两个版本:更擅长理解和执行指令的指令(Insctruct)模型,以及更擅长多步推理和深度思考的推理(Thinking)模型 。
据介绍,相比Qwen3的MoE(混合专家)模型结构 ,Qwen3-Next进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制(简称MTP,Multiple-Token Prediction)。
在核心技术方面 ,新模型采用全球首创混合架构,75%用Gated DeltaNet(线性注意力),25%用原创Gated Attention(门控注意力) ,总参数80B只需激活3B,就可以在性能上媲美Qwen3旗舰版235B模型,算力利用率约为3.7% ,帮助用户“极致省钱”。
在训练成本方面,Qwen3-Next模型较今年4月发布的密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上 。新模型在Qwen3预训练数据的子集15T tokens上进行预训练,仅需Qwen3-32B所用GPU计算资源的9.3% ,便能训练出性能更好的Qwen3-Next-Base基座模型,大幅提升了训练效率。
阿里通义团队指出,高稀疏MoE架构是Qwen3-Next面向下一代模型的最新探索。当前 ,MoE是主流大模型都采用的架构,通过激活大参数中的小部分专家完成推理任务 。此前,Qwen3系列的MoE专家激活比约为1比16 ,而Qwen3-Next通过更精密的高稀疏MoE架构设计,实现了1比50的极致激活比,创下业界新高。
在性能表现方面 ,Qwen3-Next指令模型的性能表现与参数规模更大的Qwen3-235B-A22B-Instruct-2507持平,思维模型表现优于谷歌闭源模型Gemini-2.5-Flash-Thinking。
Qwen3-Next-80B-A3B-Instruct指令模型性能评测图 。来源:阿里通义
目前,新模型已在魔搭社区和HuggingFace开源 ,开发者也可通过Qwen Chat免费体验,或直接调用阿里云百炼平台提供的API服务。
关于Qwen3-Next模型值得注意的创新点,Pine AI联合创始人 、首席科学家李博杰对澎湃新闻记者表示,Qwen3-Next采用了混合注意力机制和高稀疏MoE架构 ,从而大幅提升效率;除了这两大创新点以外,Qwen3-Next还在预训练时采用了多Token预测技术MTP(Mutiple-Token Prediction),模型推理速度大幅提升。
李博杰表示 ,虽然以上三种技术创新在学界已有研究,但阿里证明了其在工业界的实用性,同时还保持了开源:“Qwen3-Next第一次证明了这些技术能够放在一起共同运作 ,并且能够在实际的业务场景中展现出很好的能力表现 。从评测结果和模型架构来看,Qwen3-Next已经达到了谷歌Geimini 2.5 flash的水平。”
近期,阿里通义动作频频 ,包括推出超万亿参数的Qwen3-Max-Preview、文生图及编辑模型Qwen-Image-edit、语音识别模型Qwen3-ASR-Flash等。全球AI开源社区HuggingFace的最新数据显示,通义千问Qwen衍生模型数已超17万,稳坐全球第一开源模型。
9月1日 ,国际权威市场调研机构沙利文(Frost&Sullivan)发布了最新的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》,报告显示,中国企业级大模型调用呈爆发式增长 ,2025年上半年日均调用量较2024年底实现363%的增长,目前超10万亿Tokens 。其中,阿里通义占比17.7%位列第一 ,是中国企业选择最多的大模型。
(文章来源:澎湃新闻)
最好用的股票app软件:最靠谱的炒股杠杆平台-香港稳定币条例今起实施:何以成为首批试验田 与欧美有何异同
股票交易软件app哪个好:股票突破平台是什么意思-多家头部券商半年度业绩亮相!净利最高增58%
配资炒股交易网站:股票杠杆平台有哪些-特朗普称准备对俄实施第二阶段制裁 他曾称将以“经济战”威胁俄罗斯!
正规的股票交易app:配资炒股平台找加杠网-6月26日东方财富财经晚报(附新闻联播)
买股票都有哪些平台:股票杠杆炒股平台推荐-买入!新加坡政府投资公司、挪威央行、外资巨头集体出手!
杠杆炒股哪个平台好:杠杆股票什么意思-玉渊谭天:揭示美元50年来最大年中跌幅
睿迎网配资-安全的股票配资平台,有保障的股票配资公司提示:文章来自网络,不代表本站观点。
福建省商务厅官网消息,为推动福建省外贸企业拓展国内市场,《福建省深化内外贸一体化发展实施方案(征求意见稿)》公开征求意见...
4月10日,界面新闻了解到,近期多家A股上市公司披露,收到银行的股票回购贷款承诺函。此外,还有多家公司实控人或控股股东获...
界面新闻记者|安震消费贷利率...
消息面上,当地时间4月11日深夜,美国海关与边境保护局发布公告称,根据美国总统当天签署的备忘录,智能手机、路由器以及部分...
【隔夜行情】•周四(2025年4月18日),A股三大股指涨跌互现,截至收盘,上证综指涨0.13%,报3280.3...
泉果思源三年持有期混合A(基金代码:018329)是泉果基金旗下的一只混合型基金,成立于2023年6月2日。现任基金经理...
有投资者提问:公司取得了人形机器人的5个亿的订单,是否达到披露条件?对此,汉威科技4月13日在互动平台回应称,很遗憾,该...
近期全球金融市场波动加剧,A股市场主线不明朗,投资者风险偏好持续收敛。在此背景下,现金流ETF800(认购代码:5164...
4月9日,A股市场低开高走,市场风险偏好全面提升,全A市场成交额1.74万亿元显著放量,A500和A50指数通过行业均衡...
截至2025年4月11日 15:00,上证科创板50成份指数(000688)强势上涨2.07%,成分股澜起科技(6880...
2025年3月24日,A股消费电子概念股普遍上涨,其中,瀛通通讯、奋达科技盘初封涨停,英力股份涨超6%,国光电器、龙旗科...
记者辛圆随着我国老龄化程度持续加深,对养老照护人才的需求也在增加。教育部网站3月19日发布消息...
在乡村振兴的时代浪潮中,棕榈生态城镇发展股份有限公司(简称 “棕榈股份”)积极响应国家号召,不断探索创新发展路径。4月1...
文丨财联社目前共有18家上市券商发布了半年报。其中,浙商证券上半年实现营收84.56亿元,光大证券、东方...
2025年4月10日,倍轻松(688793.SH)公告称,公司计划以集中竞价交易方式回购公司股份,回购金额不低于4000...