不是所有任务都需要最贵的模型。聪明地分配,效果好还省钱。

开篇:你在用“时薪 $15 的员工”倒垃圾吗?
想象你有一个万能员工,但他时薪 $15。你会让他:
-
倒垃圾?❌(太贵了)
-
写核心算法?✅(值得)
-
整理文档?❌(大材小用)
-
设计系统架构?✅(专业对口)
但现实中你不会只有一个员工。你会:
-
请一个便宜实习生倒垃圾、整理文档($0.5/小时)
-
请一个资深工程师写核心算法($5/小时)
-
请一个架构师设计系统($15/小时,只在关键时刻用)
多模型调度就是同样的道理。
大多数 OpenClaw 用户的问题不是“模型不够强”,而是“把贵模型用在了不该用的地方”。一个 Cron 任务用 Opus 跑,一个月就能多花 $15——而换成 Gemini Flash,效果一样,成本降低 99%。
主流模型能力矩阵
⚠️ 价格仅供参考,以各平台官方定价为准。模型版本和价格更新频繁,请在使用前查阅最新文档。
| 模型 | 提供商 | 成本(/百万 token,参考) | 擅长 | 弱点 |
|---|---|---|---|---|
| Claude Opus 4.6 | Anthropic | 高($15+) | 复杂推理、架构设计、深度分析 | 贵、慢 |
| Claude Sonnet 4 | Anthropic | 中($3) | 编码、日常对话、性价比之王 | 超长文本稍弱 |
| Claude Haiku 3.5 | Anthropic | 低($0.25) | 快速响应、简单任务 | 能力有限 |
| GPT-5 / GPT-4o | OpenAI | 中高 | 多模态、通用能力强 | 代码稍弱于 Claude |
| Gemini 2.0 Pro | 中($3.5) | 超长上下文(100 万 token) | 中文稍弱 | |
| Gemini 2.0 Flash | 极低($0.075) | 最便宜、速度快 | 推理能力一般 | |
| Kimi K2.5 | Moonshot | 低($0.5) | 中文长文本、写作、推理 | 代码一般 |
| DeepSeek V3 | DeepSeek | 极低($0.1) | 便宜、中文好 | 复杂推理一般 |
模型选型决策树
任务开始
│
▼
是编码任务?
│
├── 是 → 复杂架构/系统设计?
│ │
│ ├── 是 → Claude Opus 4.6(最强推理)
│ │
│ └── 否 → Claude Sonnet 4(性价比之王)
│
└── 否 → 需要超长上下文(>100k token)?
│
├── 是 → Gemini 2.0 Pro(100万token上下文)
│
└── 否 → 是自动化/Cron/Heartbeat?
│
├── 是 → Gemini 2.0 Flash(最便宜)
│
└── 否 → 是中文写作?
│
├── 是 → Kimi K2.5(中文最强)
│
└── 否 → Claude Sonnet 4
场景推荐速查
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 主会话(日常对话) | Claude Sonnet 4 | 综合能力强、性价比高 |
| 复杂架构设计 | Claude Opus 4.6 | 最强推理能力 |
| 代码审查/重构 | Claude Sonnet 4 | 代码理解力强 |
| 中文写作/博客 | Kimi K2.5 | 中文写作最好 |
| Cron/Heartbeat | Gemini 2.0 Flash | 最便宜,自动化够用 |
| 超长文档处理 | Gemini 2.0 Pro | 100 万 token 上下文 |
| 多语言翻译 | GPT-4o / GPT-5 | 多语言能力强 |
| 快速问答 | Gemini 2.0 Flash | 响应快、便宜 |
配置多模型策略
全局默认模型
在 ~/.openclaw/openclaw.json 中设置:
{
"agents": {
"defaults": {
"model": "anthropic/claude-sonnet-4",
"models": {
"opus": {
"id": "anthropic/claude-opus-4-6",
"alias": "opus"
},
"sonnet": {
"id": "anthropic/claude-sonnet-4",
"alias": "sonnet"
},
"flash": {
"id": "google/gemini-2.0-flash",
"alias": "flash"
},
"kimi": {
"id": "moonshot/kimi-k2.5",
"alias": "kimi"
}
}
}
}
}
💡
agents.defaults.models是模型白名单 + 别名目录。只有在这里列出的模型,才能通过/model命令切换。
会话级切换(随时切换)
在对话中随时切换模型:
你:/model flash
AI:已切换到 Gemini 2.0 Flash(别名"flash")
成本降低约 40 倍,适合简单任务。
你:查一下今天天气
AI:(用超便宜的 Flash 模型回答)
你:/model opus
AI:已切换到 Claude Opus 4.6(别名"opus")
适合复杂推理和架构设计。
用 CLI 管理模型别名
# 查看所有可用模型
openclaw models list
# 查看模型状态(是否可用、延迟)
openclaw models status
# 设置默认模型
openclaw models set anthropic/claude-sonnet-4
# 查看当前别名
openclaw models aliases list
# 添加别名
openclaw models aliases add cheap google/gemini-2.0-flash
openclaw models aliases add code anthropic/claude-sonnet-4
openclaw models aliases add hard anthropic/claude-opus-4-6
# 删除别名
openclaw models aliases remove cheap
Cron 任务指定模型
openclaw cron add \
--name "daily-news" \
--cron "0 6 * * *" \
--tz "Asia/Shanghai" \
--session isolated \
--model "google/gemini-2.0-flash" \
--message "采集新闻..."
Sub-agent 指定模型
{
"name": "sessions_spawn",
"arguments": {
"description": "写后端API",
"model": "anthropic/claude-sonnet-4",
"prompt": "..."
}
}
成本对比:省钱的艺术
真实案例:日报系统成本优化