阿里巴巴发布通义千问3.5大模型
阿里巴巴集团于周一(2月16日)(中国农历除夕)发布其最新人工智能大模型系列“通义千问3.5”(Qwen 3.5),该模型强调“智能体”(agentic)能力,旨在独立执行复杂任务。该发布正值中国AI领域竞争激烈之际,多家本土企业近期密集推出升级模型。
据阿里巴巴官方介绍,Qwen 3.5系列包括开源权重版本Qwen3.5-397B-A17B(总参数3970亿,推理时仅激活170亿)和托管版本Qwen3.5-Plus(通过阿里云Model Studio提供)。公司声称,与前代相比,使用成本降低60%,处理大规模工作负载能力提升8倍,推理效率最高可提高19倍。该模型采用混合线性注意力与稀疏混合专家(MoE)架构,支持原生多模态(视觉-语言)能力,可理解屏幕内容并跨移动端和桌面应用自主操作,支持201种语言和方言(较此前版本的119种大幅增加)。
阿里巴巴表示,Qwen 3.5在多项自报基准测试中达到或超过美国OpenAI、Anthropic和Google DeepMind等领先模型的表现,但这些数据尚未经第三方独立验证。公司强调,该模型针对“智能体AI时代”设计,有助于开发者与企业以相同算力实现更高生产力。
此举发生在国内AI聊天机器人市场竞争白热化背景下。多家中国科技公司正竞相开发具备自主任务执行能力的模型。阿里巴巴通义千问聊天机器人此前通过促销活动(如餐饮折扣)实现活跃用户7倍增长,此次新模型发布被视为对本土竞争对手如DeepSeek等压力的回应。行业观察人士指出,DeepSeek下一代模型即将推出,市场格局仍处于快速演变中。
Qwen 3.5系列已于发布当日上线,用户可通过阿里云平台或开源渠道获取。阿里巴巴预计将在春节期间进一步扩展其AI产品线。