通义千问最新一代大模型:采用混合专家架构,具备思考与快速回答双模式,支持119种语言
HuggingFace, ModelScope, Kaggle
SGLang, vLLM (OpenAI兼容API)
Ollama, LMStudio, MLX, llama.cpp
chat.qwen.ai (Web & 移动应用)
使用示例: 通过enable_thinking参数切换思考模式,使用/think和/no_think在对话中动态控制。
型号 | 层数 | Heads | 上下文 |
---|---|---|---|
Qwen3-0.6B | 28 | 16/8 | 32K |
Qwen3-1.7B | 28 | 16/8 | 32K |
Qwen3-4B | 36 | 32/8 | 32K |
Qwen3-8B | 36 | 32/8 | 128K |
Qwen3-14B | 40 | 40/8 | 128K |
Qwen3-32B | 64 | 64/8 | 128K |
型号 | 层数 | 专家数 | 上下文 |
---|---|---|---|
Qwen3-30B-A3B | 48 | 128/8 | 128K |
Qwen3-235B-A22B | 94 | 128/8 | 128K |