2026年 OpenClaw × Ollama ローカル推論:ZoneMac リモート Apple Silicon 物理 Mac ゲートウェイの並列ルーティング Runbook(openclaw.json 断片+FAQ)
ヘッドレス物理 Mac 上で OpenClaw と Ollama を同居させる運用者向けに、ローカル優先の並列ルート、GGUF 取得の直列化、11434 と 18789 の意味の取り違えによる障害を整理します。意思決定表、七ステップ、コピペ可能な openclaw.json 断片、引用用しきい値、FAQ、および関連する launchd/長時間運用への内リンクをまとめました。
要約
ZoneMac で借りた Apple Silicon 物理ノードに Ollama と OpenClaw ゲートウェイを同居させると、並列 ollama pull 中のディスク圧、SSH ポートフォワード絡みのループバック誤認、推論 11434 と管理面 18789 のバインド順レースという三種の「静かな障害」に当たりがちです。
本文では ローカル優先+上限付きクラウド溢れ を表す openclaw.json のコピペ断片、ポート早見表、launchd 再起動後も崩れない検収手順までを一気通貫で示します。
OLLAMA_HOST や Secret を plist に載せる際の落とし穴は、環境変数と LaunchAgent の実戦記事に委ねます。
詳しくは:OpenClaw の環境変数・SecretRef・LaunchAgent Runbook
無人ゲートウェイで起きやすい三つのつまずき
- ディスクとユニファイドメモリの結合。 大きな GGUF の展開スパイクが JSONL ローテーションと重なると、APFS の空き不足やメモリ圧で両方が同時に失速し、UI には明確な OOM バナーが出ないことがあります。
- コンプライアンス錯覚。 ローカル推論でクラウドのトークン課金は下がりますが、プラグインは外向き API を叩き得ます。統制面は別軸として維持してください。
- ポート番号の意味の取り違え。 ノード上の
curl成功が、必ずしも開発者ノートブックから同じプロセスに届くことを意味しません。ヘルスチェックは 18789 系とモデル流量を分けて設計します。長時間運用の観点では次の安定化ガイドも参照してください。 詳しくは:OpenClaw 長時間実行における Mac mini の安定性最適化。
ルーティング意思決定表(ローカル/ハイブリッド/クラウド主)
バインド先を後から変えると、ファイアウォール申請と SSH ジャンプ表が一斉に無効化されます。設定を触る前にレーンを決めてください。
| プロファイル | 選ぶ場面 | Ollama の待受 | OpenClaw のフォールバック |
|---|---|---|---|
| 厳密ローカル | データが RAM/ディスクから出てはならない/エアギャップ方針 | 127.0.0.1:11434 | 無効(ミス時は fail-closed) |
| ハイブリッド(推奨) | コストと遅延のトレードオフ、キュー深度でクラウドへ溢れ | 127.0.0.1:11434 | タイムアウト 8s 超でクラウド経路へ |
| クラウド主 | ノード RAM がコンテキストに不足 | 開発専用に限定可 | 既定のクラウドモデル |
ポート衝突の切り分け表(11434 と 18789)
症状ごとに「どのリスナーを疑うか」を固定すると、オンコール時の grep が速くなります。
| 症状 | まず疑うポート | 最初のコマンド |
|---|---|---|
| モデル生成だけ失敗 | 11434(Ollama) | curl -sS http://127.0.0.1:11434/api/tags |
| doctor/reload が落ちる | 18789(ゲートウェイ管理面の慣例) | lsof -nP -iTCP:18789 -sTCP:LISTEN |
| 再起動直後だけ両方ダメ | launchd 順序競合 | 両ポートの LISTEN と ~/Library/Logs の stderr を突き合わせる |
七ステップ再現 Runbook
- ネットワーク受入を固定。 ゲートウェイ所在リージョンへの中央値 RTT、p95 ジッター、60 秒損失を記録。インタラクティブなツールループでは中央値 RTT が 120 ms を超える帯を警告として扱うとよいです。
- Ollama(ARM64)を導入しループバックに固定。
OLLAMA_HOST=127.0.0.1:11434をlaunchdの plist と同じ環境ブロックへ書き、再起動でワイルドカード待ち受けに戻らないようにします。 - pull を直列化。
ollama pullは常に一つ。展開後もdf -hで空きが 15% 未満にならないか確認し、タグ一覧は Git で固定します。 - 並列バックエンドをマージ。 下記 JSON の意図どおり、ローカル優先度 10・クラウド 50、ルート別
maxConcurrencyで Metal/ANE 競合を上限化します。 - launchd ラベルを二つに分離。
ollama serveとopenclaw gatewayを別 plist にし、電源不安定環境ではThrottleIntervalを 2 秒以上確保します。 - リスナーを実証。
lsof -nP -iTCP:11434 -sTCP:LISTENとlsof -nP -iTCP:18789 -sTCP:LISTEN。空なら終了コードより stderr ログを優先します。 - doctor と最小 generate。
openclaw doctorの後、16 トークン程度のスモークを Ollama に POST し、ゲートウェイ JSONL 監査末尾にリクエスト ID が現れることを確認します。
openclaw.json 断片——並列バックエンド(例示)
キー名は実際に導入した OpenClaw のスキーマに合わせてください。ここで伝えたい不変条件は 順序付きルート、タイムアウト、明示的 baseUrl です。
{
"models": {
"router": {
"strategy": "parallel-failover",
"routes": [
{
"id": "ollama-local",
"priority": 10,
"provider": "openai-compatible",
"baseUrl": "http://127.0.0.1:11434/v1",
"model": "llama3.1:8b",
"timeoutMs": 8000,
"maxConcurrency": 2
},
{
"id": "cloud-overflow",
"priority": 50,
"provider": "anthropic",
"model": "claude-3-5-sonnet-20241022",
"timeoutMs": 20000,
"maxConcurrency": 6
}
]
}
},
"gateway": {
"bind": "127.0.0.1",
"port": 18789,
"healthPath": "/health"
}
}
ゲートウェイ項目のネストが異なる配布でも、Ollama はループバック、外向きは nginx/Traefik で TLS を終端し 127.0.0.1 にフォワードする、という形を崩さないでください。生の 11434 をテナント境界に晒さないことが重要です。
引用しやすいパラメータ
- 8 秒——ハイブリッド構成でローカルルートがタイムアウトしクラウドへ溢れるまでの既定目安(SLA に応じて調整)。
- 11434——Ollama の既定 TCP;18789——多くのテンプレートで OpenClaw ゲートウェイ管理に使う慣例。Runbook に両方を明記します。
- ≥1.3×——GGUF の公称バイト数に対し、APFS 上で pull を始める前に確保したい空き容量の経験則。
- 2——16 GB 級ユニファイドメモリで Xcode 級ワークロードと同居するときの、ローカル同時生成の保守的な開始上限。
FAQ
OpenClaw と同居させる Ollama は 127.0.0.1 のみで待ち受けすべきですか?
典型的な無人ゲートウェイでははい。ループバックにバインドし、稀な LAN 要件は認証付きリバースプロキシ経由に限定します。
11434 は生きているのに 18789 が connection refused になるのは?
別デーモンです。launchd の終了コード、plist パス、ゲートウェイバイナリをブロックする macOS のプライバシー(TCC)を疑い、Ollama が健全でも管理面が落ちているケースを切り分けます。
pull と JSONL ローテーションを同時に走らせないには?
pull を直列化し、空き容量を継続監視します。監査ログが肥大化するなら OLLAMA_MODELS を専用ボリュームへ逃がしてください。
並列ルーティングは外向き統制を不要にしますか?
いいえ。ドメイン許可リスト、サンドボックス、ヒューマンインザループは維持します。ローカルモデルはコスト削減であり、セキュリティ上のスコープ縮小ではありません。
このスタックを載せるなら Apple Silicon Mac mini が筋がいい理由
Ollama と OpenClaw は メモリ帯域 と静音サーマル双方に恩恵があります。Apple Silicon は CPU/GPU/Neural Engine が同一メモリプールを共有し、小型 x86 ボックスに GPU を後付けしたときの PCIe 往復を抑えられます。macOS は launchd による常駐監督、低クラッシュ率、POSIX ツールチェーンの揃い方が揃い、KVM ヒーローなしの夜間運用に向きます。
セキュリティも重要です。Gatekeeper、SIP、FileVault により、API 資材とローカル重みを載せる信頼境界を段階的に強化できます。総合コストでは Mac mini クラスは待機時でもおおよそ 4 W 前後に抑えつつ推論をさばけ、タワー PC がディスクリート GPU を遊ばせる待機電力より有利な場面が多いです。
上記ハイブリッドルーティングを、静音 7×24 に耐える金属へ載せ替えたいなら、Apple Silicon 搭載 Mac mini がバランスの取れた出発点です。ZoneMac のノードを確認し、本 Runbook をそのまま本番チェックリストに落とし込んでください。
OpenClaw 向け物理 Mac ゲートウェイを今すぐ借りる
ZoneMac の専用 Apple Silicon ホストは、ループバック安全既定、Ollama 重みの置き場、JSONL 監査の伸び余白まで本稿の前提に沿いやすい構成です。