不是所有任务都需要最贵的模型。聪明地分配,效果好还省钱。

An image to describe post


开篇:你在用“时薪 $15 的员工”倒垃圾吗?

想象你有一个万能员工,但他时薪 $15。你会让他:

  • 倒垃圾?❌(太贵了)

  • 写核心算法?✅(值得)

  • 整理文档?❌(大材小用)

  • 设计系统架构?✅(专业对口)

但现实中你不会只有一个员工。你会:

  • 请一个便宜实习生倒垃圾、整理文档($0.5/小时)

  • 请一个资深工程师写核心算法($5/小时)

  • 请一个架构师设计系统($15/小时,只在关键时刻用)

多模型调度就是同样的道理。

大多数 OpenClaw 用户的问题不是“模型不够强”,而是“把贵模型用在了不该用的地方”。一个 Cron 任务用 Opus 跑,一个月就能多花 $15——而换成 Gemini Flash,效果一样,成本降低 99%。


主流模型能力矩阵

⚠️ 价格仅供参考,以各平台官方定价为准。模型版本和价格更新频繁,请在使用前查阅最新文档。

模型 提供商 成本(/百万 token,参考) 擅长 弱点
Claude Opus 4.6 Anthropic 高($15+) 复杂推理、架构设计、深度分析 贵、慢
Claude Sonnet 4 Anthropic 中($3) 编码、日常对话、性价比之王 超长文本稍弱
Claude Haiku 3.5 Anthropic 低($0.25) 快速响应、简单任务 能力有限
GPT-5 / GPT-4o OpenAI 中高 多模态、通用能力强 代码稍弱于 Claude
Gemini 2.0 Pro Google 中($3.5) 超长上下文(100 万 token) 中文稍弱
Gemini 2.0 Flash Google 极低($0.075) 最便宜、速度快 推理能力一般
Kimi K2.5 Moonshot 低($0.5) 中文长文本、写作、推理 代码一般
DeepSeek V3 DeepSeek 极低($0.1) 便宜、中文好 复杂推理一般

模型选型决策树

任务开始
是编码任务?
   ├── 是 → 复杂架构/系统设计?
   │           │
   │           ├── 是 → Claude Opus 4.6(最强推理)
   │           │
   │           └── 否 → Claude Sonnet 4(性价比之王)
   └── 否 → 需要超长上下文(>100k token)?
               ├── 是 → Gemini 2.0 Pro(100万token上下文)
               └── 否 → 是自动化/Cron/Heartbeat?
                           ├── 是 → Gemini 2.0 Flash(最便宜)
                           └── 否 → 是中文写作?
                                       ├── 是 → Kimi K2.5(中文最强)
                                       └── 否 → Claude Sonnet 4

场景推荐速查

场景 推荐模型 理由
主会话(日常对话) Claude Sonnet 4 综合能力强、性价比高
复杂架构设计 Claude Opus 4.6 最强推理能力
代码审查/重构 Claude Sonnet 4 代码理解力强
中文写作/博客 Kimi K2.5 中文写作最好
Cron/Heartbeat Gemini 2.0 Flash 最便宜,自动化够用
超长文档处理 Gemini 2.0 Pro 100 万 token 上下文
多语言翻译 GPT-4o / GPT-5 多语言能力强
快速问答 Gemini 2.0 Flash 响应快、便宜

配置多模型策略

全局默认模型

~/.openclaw/openclaw.json 中设置:

{
  "agents": {
    "defaults": {
      "model": "anthropic/claude-sonnet-4",
      "models": {
        "opus": {
          "id": "anthropic/claude-opus-4-6",
          "alias": "opus"
        },
        "sonnet": {
          "id": "anthropic/claude-sonnet-4",
          "alias": "sonnet"
        },
        "flash": {
          "id": "google/gemini-2.0-flash",
          "alias": "flash"
        },
        "kimi": {
          "id": "moonshot/kimi-k2.5",
          "alias": "kimi"
        }
      }
    }
  }
}

💡 agents.defaults.models 是模型白名单 + 别名目录。只有在这里列出的模型,才能通过 /model 命令切换。

会话级切换(随时切换)

在对话中随时切换模型:

你:/model flash

AI:已切换到 Gemini 2.0 Flash(别名"flash")
成本降低约 40 倍,适合简单任务。

你:查一下今天天气

AI:(用超便宜的 Flash 模型回答)

你:/model opus

AI:已切换到 Claude Opus 4.6(别名"opus")
适合复杂推理和架构设计。

用 CLI 管理模型别名

# 查看所有可用模型
openclaw models list

# 查看模型状态(是否可用、延迟)
openclaw models status

# 设置默认模型
openclaw models set anthropic/claude-sonnet-4

# 查看当前别名
openclaw models aliases list

# 添加别名
openclaw models aliases add cheap google/gemini-2.0-flash
openclaw models aliases add code anthropic/claude-sonnet-4
openclaw models aliases add hard anthropic/claude-opus-4-6

# 删除别名
openclaw models aliases remove cheap

Cron 任务指定模型

openclaw cron add \
  --name "daily-news" \
  --cron "0 6 * * *" \
  --tz "Asia/Shanghai" \
  --session isolated \
  --model "google/gemini-2.0-flash" \
  --message "采集新闻..."

Sub-agent 指定模型

{
  "name": "sessions_spawn",
  "arguments": {
    "description": "写后端API",
    "model": "anthropic/claude-sonnet-4",
    "prompt": "..."
  }
}

成本对比:省钱的艺术

真实案例:日报系统成本优化