Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平

Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平

TL;DR

  • Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型,采用稀疏 MoE 架构,35B 总参数但每 token 仅激活 3B
  • Apache 2.0 许可证,完全开源可商用
  • 在 Terminal-Bench 2.0 得分 51.5(vs Gemma4-31B 的 42.9),SWE-bench Verified 得分 73.4,击败 Claude Sonnet 4.5
  • 支持 262,144 token 上下文,专为代理编程(Agentic Coding)优化
  • 24GB Mac 可通过 GGUF 量化运行

Qwen3.6-35B-A3B 是什么?

Qwen3.6-35B-A3B 是阿里巴巴 Qwen 团队发布的最新开源模型,2026年4月16日正式上线。该模型专为代理编程(agentic coding)和仓库级代码推理设计。

模型名称解读: – 35B — 总参数数量(MoE 稀疏架构) – A3B — 每 token 仅激活 3B 参数,极大降低推理成本

这是典型的稀疏 MoE(Mixture-of-Experts) 架构——每个 token 只会激活少数「专家」模块的神经元,大部分参数处于休眠状态。结果:用 1/10 的推理算力,达到接近顶级dense模型的能力。

Apache 2.0 — 真开源

不同于很多「伪开源」模型,Qwen3.6-35B-A3B 采用 Apache 2.0 许可证: – 商用免费 – 无版税 – 可修改和再分发 – 包含专利授权


基准测试表现

Qwen3.6-35B-A3B 在多项基准测试中表现出色:

基准测试 Qwen3.6-35B-A3B Gemma4-31B Claude Sonnet 4.5
Terminal-Bench 2.0 51.5 42.9
SWE-bench Pro 49.5 35.7
SWE-bench Verified 73.4
RealWorldQA 85.3 70.3

Terminal-Bench 2.0(代理式终端编程)得分 51.5,比 Gemma4-31B(42.9)高出 20%

SWE-bench Pro(真实 GitHub 仓库的软件工程能力)得分 49.5,比 Gemma4-31B(35.7)高出 38%

RealWorldQA(真实世界多模态理解)得分 85.3,击败 Claude Sonnet 4.5(70.3)21%


代理编程能力

Qwen3.6-35B-A3B 的核心设计目标就是代理编程

  1. 大型仓库导航 — 理解项目结构、依赖、架构
  2. 多文件多语言代码编写与修改
  3. 命令执行 — 运行测试、构建系统、操作终端
  4. 工具调用 — 与 IDE(Continue.dev、Cursor)、API、CICD 系统集成

思维模式保留

Qwen3.6 的核心创新是思维模式保留——在多步骤代理工作流中保持完整推理上下文。这意味着: – 决策一致性更强 – 减少重复推理,节省 token – 在思考/非思考模式间优化 KV 缓存利用率

262,144 token 上下文

262,144 token 的超长上下文让 Qwen3.6 可以: – 单次输入完整处理中大型代码仓库 – 跨数千行代码保持首尾一致的理解 – 对文件间依赖和架构模式进行推理


如何本地运行

Ollama(最简单)

brew install ollama
ollama run qwen3.6:35b-a3b

Unsloth GGUF(Mac 推荐)

通过 4-bit 量化,24GB 内存的 Mac M3 Max 也能流畅运行。完整 F16 模型需要约 72GB,但 4-bit 量化后仅需 ~18-20GB VRAM。

SGLang(生产级)

python -m sglang.launch_server \
    --model-path Qwen/Qwen3.6-35B-A3B \
    --port 8000 --tp-size 8 \
    --context-length 262144

获取渠道

平台 链接
Hugging Face Qwen/Qwen3.6-35B-A3B
Ollama ollama run qwen3.6:35b-a3b
Unsloth GGUF unsloth/Qwen3.6-35B-A3B-GGUF
Qwen Studio https://qwen.ai

总结

Qwen3.6-35B-A3B 代表着开源 AI 的分水岭时刻——首次,开发者可以在本地运行一个: – 3B 激活参数 + 35B 总参数的稀疏 MoE 模型 – Gemma4-31B 代理编程能力 +20% – SOTA 级别编程基准测试表现 – 24GB Mac 可运行的本地部署 – Apache 2.0 完全开源可商用

原文链接: Qwen3.6-35B-A3B Complete Review

文章摘自:https://www.cnblogs.com/sing1ee/p/19885253