デプロイガイド 2026-05-07

2026年 OpenClaw × Ollama ローカル推論:ZoneMac リモート Apple Silicon 物理 Mac ゲートウェイの並列ルーティング Runbook(openclaw.json 断片+FAQ)

ヘッドレス物理 Mac 上で OpenClaw と Ollama を同居させる運用者向けに、ローカル優先の並列ルート、GGUF 取得の直列化、11434 と 18789 の意味の取り違えによる障害を整理します。意思決定表、七ステップ、コピペ可能な openclaw.json 断片、引用用しきい値、FAQ、および関連する launchd/長時間運用への内リンクをまとめました。

2026年 OpenClaw と Ollama のローカル推論を Apple Silicon リモート Mac ゲートウェイで運用するイメージ

要約

ZoneMac で借りた Apple Silicon 物理ノードに OllamaOpenClaw ゲートウェイを同居させると、並列 ollama pull 中のディスク圧、SSH ポートフォワード絡みのループバック誤認、推論 11434 と管理面 18789 のバインド順レースという三種の「静かな障害」に当たりがちです。

本文では ローカル優先+上限付きクラウド溢れ を表す openclaw.json のコピペ断片、ポート早見表、launchd 再起動後も崩れない検収手順までを一気通貫で示します。

OLLAMA_HOST や Secret を plist に載せる際の落とし穴は、環境変数と LaunchAgent の実戦記事に委ねます。 詳しくは:OpenClaw の環境変数・SecretRef・LaunchAgent Runbook

無人ゲートウェイで起きやすい三つのつまずき

  1. ディスクとユニファイドメモリの結合。 大きな GGUF の展開スパイクが JSONL ローテーションと重なると、APFS の空き不足やメモリ圧で両方が同時に失速し、UI には明確な OOM バナーが出ないことがあります。
  2. コンプライアンス錯覚。 ローカル推論でクラウドのトークン課金は下がりますが、プラグインは外向き API を叩き得ます。統制面は別軸として維持してください。
  3. ポート番号の意味の取り違え。 ノード上の curl 成功が、必ずしも開発者ノートブックから同じプロセスに届くことを意味しません。ヘルスチェックは 18789 系とモデル流量を分けて設計します。長時間運用の観点では次の安定化ガイドも参照してください。 詳しくは:OpenClaw 長時間実行における Mac mini の安定性最適化

ルーティング意思決定表(ローカル/ハイブリッド/クラウド主)

バインド先を後から変えると、ファイアウォール申請と SSH ジャンプ表が一斉に無効化されます。設定を触る前にレーンを決めてください。

プロファイル 選ぶ場面 Ollama の待受 OpenClaw のフォールバック
厳密ローカル データが RAM/ディスクから出てはならない/エアギャップ方針 127.0.0.1:11434 無効(ミス時は fail-closed)
ハイブリッド(推奨) コストと遅延のトレードオフ、キュー深度でクラウドへ溢れ 127.0.0.1:11434 タイムアウト 8s 超でクラウド経路へ
クラウド主 ノード RAM がコンテキストに不足 開発専用に限定可 既定のクラウドモデル

ポート衝突の切り分け表(11434 と 18789)

症状ごとに「どのリスナーを疑うか」を固定すると、オンコール時の grep が速くなります。

症状 まず疑うポート 最初のコマンド
モデル生成だけ失敗 11434(Ollama) curl -sS http://127.0.0.1:11434/api/tags
doctor/reload が落ちる 18789(ゲートウェイ管理面の慣例) lsof -nP -iTCP:18789 -sTCP:LISTEN
再起動直後だけ両方ダメ launchd 順序競合 両ポートの LISTEN~/Library/Logs の stderr を突き合わせる

七ステップ再現 Runbook

  1. ネットワーク受入を固定。 ゲートウェイ所在リージョンへの中央値 RTT、p95 ジッター、60 秒損失を記録。インタラクティブなツールループでは中央値 RTT が 120 ms を超える帯を警告として扱うとよいです。
  2. Ollama(ARM64)を導入しループバックに固定。 OLLAMA_HOST=127.0.0.1:11434launchd の plist と同じ環境ブロックへ書き、再起動でワイルドカード待ち受けに戻らないようにします。
  3. pull を直列化。 ollama pull は常に一つ。展開後も df -h で空きが 15% 未満にならないか確認し、タグ一覧は Git で固定します。
  4. 並列バックエンドをマージ。 下記 JSON の意図どおり、ローカル優先度 10・クラウド 50、ルート別 maxConcurrency で Metal/ANE 競合を上限化します。
  5. launchd ラベルを二つに分離。 ollama serveopenclaw gateway を別 plist にし、電源不安定環境では ThrottleInterval を 2 秒以上確保します。
  6. リスナーを実証。 lsof -nP -iTCP:11434 -sTCP:LISTENlsof -nP -iTCP:18789 -sTCP:LISTEN。空なら終了コードより stderr ログを優先します。
  7. doctor と最小 generate。 openclaw doctor の後、16 トークン程度のスモークを Ollama に POST し、ゲートウェイ JSONL 監査末尾にリクエスト ID が現れることを確認します。

openclaw.json 断片——並列バックエンド(例示)

キー名は実際に導入した OpenClaw のスキーマに合わせてください。ここで伝えたい不変条件は 順序付きルートタイムアウト明示的 baseUrl です。

{
  "models": {
    "router": {
      "strategy": "parallel-failover",
      "routes": [
        {
          "id": "ollama-local",
          "priority": 10,
          "provider": "openai-compatible",
          "baseUrl": "http://127.0.0.1:11434/v1",
          "model": "llama3.1:8b",
          "timeoutMs": 8000,
          "maxConcurrency": 2
        },
        {
          "id": "cloud-overflow",
          "priority": 50,
          "provider": "anthropic",
          "model": "claude-3-5-sonnet-20241022",
          "timeoutMs": 20000,
          "maxConcurrency": 6
        }
      ]
    }
  },
  "gateway": {
    "bind": "127.0.0.1",
    "port": 18789,
    "healthPath": "/health"
  }
}

ゲートウェイ項目のネストが異なる配布でも、Ollama はループバック、外向きは nginx/Traefik で TLS を終端し 127.0.0.1 にフォワードする、という形を崩さないでください。生の 11434 をテナント境界に晒さないことが重要です。

引用しやすいパラメータ

  • 8 秒——ハイブリッド構成でローカルルートがタイムアウトしクラウドへ溢れるまでの既定目安(SLA に応じて調整)。
  • 11434——Ollama の既定 TCP;18789——多くのテンプレートで OpenClaw ゲートウェイ管理に使う慣例。Runbook に両方を明記します。
  • ≥1.3×——GGUF の公称バイト数に対し、APFS 上で pull を始める前に確保したい空き容量の経験則。
  • 2——16 GB 級ユニファイドメモリで Xcode 級ワークロードと同居するときの、ローカル同時生成の保守的な開始上限。

FAQ

OpenClaw と同居させる Ollama は 127.0.0.1 のみで待ち受けすべきですか?

典型的な無人ゲートウェイでははい。ループバックにバインドし、稀な LAN 要件は認証付きリバースプロキシ経由に限定します。

11434 は生きているのに 18789 が connection refused になるのは?

別デーモンです。launchd の終了コード、plist パス、ゲートウェイバイナリをブロックする macOS のプライバシー(TCC)を疑い、Ollama が健全でも管理面が落ちているケースを切り分けます。

pull と JSONL ローテーションを同時に走らせないには?

pull を直列化し、空き容量を継続監視します。監査ログが肥大化するなら OLLAMA_MODELS を専用ボリュームへ逃がしてください。

並列ルーティングは外向き統制を不要にしますか?

いいえ。ドメイン許可リスト、サンドボックス、ヒューマンインザループは維持します。ローカルモデルはコスト削減であり、セキュリティ上のスコープ縮小ではありません。

このスタックを載せるなら Apple Silicon Mac mini が筋がいい理由

Ollama と OpenClaw は メモリ帯域 と静音サーマル双方に恩恵があります。Apple Silicon は CPU/GPU/Neural Engine が同一メモリプールを共有し、小型 x86 ボックスに GPU を後付けしたときの PCIe 往復を抑えられます。macOS は launchd による常駐監督、低クラッシュ率、POSIX ツールチェーンの揃い方が揃い、KVM ヒーローなしの夜間運用に向きます。

セキュリティも重要です。Gatekeeper、SIP、FileVault により、API 資材とローカル重みを載せる信頼境界を段階的に強化できます。総合コストでは Mac mini クラスは待機時でもおおよそ 4 W 前後に抑えつつ推論をさばけ、タワー PC がディスクリート GPU を遊ばせる待機電力より有利な場面が多いです。

上記ハイブリッドルーティングを、静音 7×24 に耐える金属へ載せ替えたいなら、Apple Silicon 搭載 Mac mini がバランスの取れた出発点です。ZoneMac のノードを確認し、本 Runbook をそのまま本番チェックリストに落とし込んでください。

Apple Silicon ノード

OpenClaw 向け物理 Mac ゲートウェイを今すぐ借りる

ZoneMac の専用 Apple Silicon ホストは、ループバック安全既定、Ollama 重みの置き場、JSONL 監査の伸び余白まで本稿の前提に沿いやすい構成です。

低待機電力 macOS ハードニング ユニファイドメモリ
macOSクラウドレンタル Apple Silicon ゲートウェイ
今すぐ購入