Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平
TL;DR
- Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型,采用稀疏 MoE 架构,35B 总参数但每 token 仅激活 3B
- Apache 2.0 许可证,完全开源可商用
- 在 Terminal-Bench 2.0 得分 51.5(vs Gemma4-31B 的 42.9),SWE-bench Verified 得分 73.4,击败 Claude Sonnet 4.5
- 支持 262,144 token 上下文,专为代理编程(Agentic Coding)优化
- 24GB Mac 可通过 GGUF 量化运行
Qwen3.6-35B-A3B 是什么?
Qwen3.6-35B-A3B 是阿里巴巴 Qwen 团队发布的最新开源模型,2026年4月16日正式上线。该模型专为代理编程(agentic coding)和仓库级代码推理设计。
模型名称解读: – 35B — 总参数数量(MoE 稀疏架构) – A3B — 每 token 仅激活 3B 参数,极大降低推理成本
这是典型的稀疏 MoE(Mixture-of-Experts) 架构——每个 token 只会激活少数「专家」模块的神经元,大部分参数处于休眠状态。结果:用 1/10 的推理算力,达到接近顶级dense模型的能力。
Apache 2.0 — 真开源
不同于很多「伪开源」模型,Qwen3.6-35B-A3B 采用 Apache 2.0 许可证: – 商用免费 – 无版税 – 可修改和再分发 – 包含专利授权
基准测试表现
Qwen3.6-35B-A3B 在多项基准测试中表现出色:
| 基准测试 | Qwen3.6-35B-A3B | Gemma4-31B | Claude Sonnet 4.5 |
|---|---|---|---|
| Terminal-Bench 2.0 | 51.5 | 42.9 | — |
| SWE-bench Pro | 49.5 | 35.7 | — |
| SWE-bench Verified | 73.4 | — | — |
| RealWorldQA | 85.3 | — | 70.3 |
Terminal-Bench 2.0(代理式终端编程)得分 51.5,比 Gemma4-31B(42.9)高出 20%。
SWE-bench Pro(真实 GitHub 仓库的软件工程能力)得分 49.5,比 Gemma4-31B(35.7)高出 38%。
RealWorldQA(真实世界多模态理解)得分 85.3,击败 Claude Sonnet 4.5(70.3)21%。
代理编程能力
Qwen3.6-35B-A3B 的核心设计目标就是代理编程:
- 大型仓库导航 — 理解项目结构、依赖、架构
- 多文件多语言代码编写与修改
- 命令执行 — 运行测试、构建系统、操作终端
- 工具调用 — 与 IDE(Continue.dev、Cursor)、API、CICD 系统集成
思维模式保留
Qwen3.6 的核心创新是思维模式保留——在多步骤代理工作流中保持完整推理上下文。这意味着: – 决策一致性更强 – 减少重复推理,节省 token – 在思考/非思考模式间优化 KV 缓存利用率
262,144 token 上下文
262,144 token 的超长上下文让 Qwen3.6 可以: – 单次输入完整处理中大型代码仓库 – 跨数千行代码保持首尾一致的理解 – 对文件间依赖和架构模式进行推理
如何本地运行
Ollama(最简单)
brew install ollama
ollama run qwen3.6:35b-a3b
Unsloth GGUF(Mac 推荐)
通过 4-bit 量化,24GB 内存的 Mac M3 Max 也能流畅运行。完整 F16 模型需要约 72GB,但 4-bit 量化后仅需 ~18-20GB VRAM。
SGLang(生产级)
python -m sglang.launch_server \
--model-path Qwen/Qwen3.6-35B-A3B \
--port 8000 --tp-size 8 \
--context-length 262144
获取渠道
| 平台 | 链接 |
|---|---|
| Hugging Face | Qwen/Qwen3.6-35B-A3B |
| Ollama | ollama run qwen3.6:35b-a3b |
| Unsloth GGUF | unsloth/Qwen3.6-35B-A3B-GGUF |
| Qwen Studio | https://qwen.ai |
总结
Qwen3.6-35B-A3B 代表着开源 AI 的分水岭时刻——首次,开发者可以在本地运行一个: – 3B 激活参数 + 35B 总参数的稀疏 MoE 模型 – Gemma4-31B 代理编程能力 +20% – SOTA 级别编程基准测试表现 – 24GB Mac 可运行的本地部署 – Apache 2.0 完全开源可商用
原文链接: Qwen3.6-35B-A3B Complete Review
文章摘自:https://www.cnblogs.com/sing1ee/p/19885253
