2026年4月18日

Qwen3.6-35B-A3B 全面评测：阿里开源模型如何超越前沿级水平

TL;DR

Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型，采用稀疏 MoE 架构，35B 总参数但每 token 仅激活 3B
Apache 2.0 许可证，完全开源可商用
在 Terminal-Bench 2.0 得分 51.5（vs Gemma4-31B 的 42.9），SWE-bench Verified 得分 73.4，击败 Claude Sonnet 4.5
支持 262,144 token 上下文，专为代理编程（Agentic Coding）优化
24GB Mac 可通过 GGUF 量化运行

Qwen3.6-35B-A3B 是什么？

Qwen3.6-35B-A3B 是阿里巴巴 Qwen 团队发布的最新开源模型，2026年4月16日正式上线。该模型专为代理编程（agentic coding）和仓库级代码推理设计。

模型名称解读： – 35B — 总参数数量（MoE 稀疏架构） – A3B — 每 token 仅激活 3B 参数，极大降低推理成本

这是典型的稀疏 MoE（Mixture-of-Experts） 架构——每个 token 只会激活少数「专家」模块的神经元，大部分参数处于休眠状态。结果：用 1/10 的推理算力，达到接近顶级dense模型的能力。

Apache 2.0 — 真开源

不同于很多「伪开源」模型，Qwen3.6-35B-A3B 采用 Apache 2.0 许可证： – 商用免费 – 无版税 – 可修改和再分发 – 包含专利授权

基准测试表现

Qwen3.6-35B-A3B 在多项基准测试中表现出色：

基准测试	Qwen3.6-35B-A3B	Gemma4-31B	Claude Sonnet 4.5
Terminal-Bench 2.0	51.5	42.9	—
SWE-bench Pro	49.5	35.7	—
SWE-bench Verified	73.4	—	—
RealWorldQA	85.3	—	70.3

Terminal-Bench 2.0（代理式终端编程）得分 51.5，比 Gemma4-31B（42.9）高出 20%。

SWE-bench Pro（真实 GitHub 仓库的软件工程能力）得分 49.5，比 Gemma4-31B（35.7）高出 38%。

RealWorldQA（真实世界多模态理解）得分 85.3，击败 Claude Sonnet 4.5（70.3）21%。

代理编程能力

Qwen3.6-35B-A3B 的核心设计目标就是代理编程：

大型仓库导航 — 理解项目结构、依赖、架构
多文件多语言代码编写与修改
命令执行 — 运行测试、构建系统、操作终端
工具调用 — 与 IDE（Continue.dev、Cursor）、API、CICD 系统集成

思维模式保留

Qwen3.6 的核心创新是思维模式保留——在多步骤代理工作流中保持完整推理上下文。这意味着： – 决策一致性更强 – 减少重复推理，节省 token – 在思考/非思考模式间优化 KV 缓存利用率

262,144 token 上下文

262,144 token 的超长上下文让 Qwen3.6 可以： – 单次输入完整处理中大型代码仓库 – 跨数千行代码保持首尾一致的理解 – 对文件间依赖和架构模式进行推理

如何本地运行

Ollama（最简单）

brew install ollama
ollama run qwen3.6:35b-a3b

Unsloth GGUF（Mac 推荐）

通过 4-bit 量化，24GB 内存的 Mac M3 Max 也能流畅运行。完整 F16 模型需要约 72GB，但 4-bit 量化后仅需 ~18-20GB VRAM。

SGLang（生产级）

python -m sglang.launch_server \
    --model-path Qwen/Qwen3.6-35B-A3B \
    --port 8000 --tp-size 8 \
    --context-length 262144

获取渠道

平台	链接
Hugging Face	Qwen/Qwen3.6-35B-A3B
Ollama	`ollama run qwen3.6:35b-a3b`
Unsloth GGUF	unsloth/Qwen3.6-35B-A3B-GGUF
Qwen Studio	https://qwen.ai

总结

Qwen3.6-35B-A3B 代表着开源 AI 的分水岭时刻——首次，开发者可以在本地运行一个： – 3B 激活参数 + 35B 总参数的稀疏 MoE 模型 – Gemma4-31B 代理编程能力 +20% – SOTA 级别编程基准测试表现 – 24GB Mac 可运行的本地部署 – Apache 2.0 完全开源可商用

原文链接: Qwen3.6-35B-A3B Complete Review

文章摘自：https://www.cnblogs.com/sing1ee/p/19885253

一	二	三	四	五	六	日
« 6月
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

六狼博客