2026 — OpenClaw Gateway 7×24 : déconnexions et dépannage du démon — install-daemon, launchd et openclaw health (parcours reproductible)
Les équipes qui confient OpenClaw Gateway à launchd voient souvent « tout va bien au bureau, mort à 2 h du matin ». Cet article propose une boucle reproductible : qualifier avec openclaw health, isoler la cause de sortie dans launchd, puis rétablir la stabilité 7×24 avec install-daemon et l'ajustement du plist. Vous obtenez une matrice symptômes → preuves → actions, une checklist en sept étapes et trois paramètres prêts à copier-coller.
1. Qui subit les à-coups 7×24 de la passerelle ?
Lecteurs typiques : équipes qui délèguent OpenClaw Gateway à launchd pour l'automatisation sans session : connexions sortantes longues durée et orchestration multi-outils. Quand le processus reste coincé dans un backoff ThrottleInterval la nuit — ou que le PATH diffère du shell interactif (« ça marche en SSH mais pas en démon ») — le temps de diagnostic explose.
L'essentiel : découper en trois couches — faux positifs des sondes santé, tempêtes de redémarrage launchd, plists obsolètes ou dupliqués après upgrade — puis croiser openclaw health et launchctl print. La plupart des coupures intermittentes se reproduisent sur une seule machine et se stabilisent dans une fenêtre de maintenance.
Les sections suivantes détaillent les irritants numérotés, une matrice de décision et une liste en sept points pour votre runbook. Pour une installation de base avant de durcir le démon, voir aussi le Guide d'installation complet OpenClaw 2026 : Mac / Windows / Linux.
2. Trois causes racines fréquentes
- launchd contre shell interactif : lancer
openclaw gatewayà la main hérite de nvm/fnm/PATH personnalisé, alors que les LaunchAgents ne voient que lesEnvironmentVariablesdu plist. Symptômes :command not foundsporadiques ou chemins de modèles locaux manquants. - Spirales crash–throttle (ThrottleInterval) : erreurs 429 amont, rotation de certificats ou conflits de ports font quitter la passerelle vite ; launchd relance en quelques secondes, applique le backoff, et l'extérieur voit des « minutes silencieuses ». Sans LastExitStatus, on croit souvent à une panne réseau pure.
- Sondes « santé » qui ne sont pas des sondes de disponibilité : tester « le processus existe » au lieu de la readiness HTTP — ou sonder trop agressivement — provoque de faux redémarrages pendant le GC ou le renouvellement DNS, ce qui amplifie ThrottleInterval. Les charges planifiées OpenClaw (tarification, conformité) ajoutent du pic ; anticipez la capacité en parallèle des pratiques décrites dans Pratiques de déploiement sécurisé OpenClaw 2026 : passerelle d'agents IA hautement disponible avec ZoneMac pour éviter que la passerelle ne tombe en même temps qu'une tempête de cron aveugle.
3. Matrice : symptôme → preuve → action
Un tableau pour relier ce que voient les utilisateurs à la première commande à lancer — moins de défilement de journaux au hasard.
| Symptôme côté client | Preuve à collecter en premier | Action recommandée |
|---|---|---|
| 502 sporadiques / connexion réinitialisée | openclaw health, ports en écoute, horodatage des logs passerelle |
Séparer sortie de processus et timeout amont ; relever les timeouts de lecture ou le backoff côté client |
| Échec seulement sans session ; démarrage manuel SSH OK | ProgramArguments, WorkingDirectory, variables d'environnement du plist | Exécuter openclaw install-daemon pour aligner sur le modèle supporté |
| « Silence » régulier pendant des minutes | launchctl print gui/$UID → ThrottleInterval, LastExitStatus |
Corriger la cause racine, puis élargir ThrottleInterval ou réduire le taux de crash |
| Instabilité juste après mise à jour OpenClaw | Labels obsolètes, chemins binaires modifiés, LaunchAgents dupliqués | Supprimer l'ancien job, réinstaller via install-daemon, bootstrap propre |
4. Sept étapes de dépannage reproductibles
- Référence : à l'état sain, exécutez
openclaw health --jsonsi votre build l'offre ; conservez URL d'écoute, version et contrôles de dépendances comme instantané de référence. - Fenêtre de reproduction : utilisez
log stream --predicate 'process == "launchd"'ou la Console filtrée sur le label de la passerelle ; ciblez ±5 minutes autour d'un incident. - État launchd : exécutez
launchctl print gui/$(id -u)/com.openclaw.gateway(remplacez par votre Label réel) et notez LastExitStatus, runs et état. - Réinstaller le démon : en fenêtre de maintenance,
openclaw install-daemon, puislaunchctl bootoutsur l'ancienne entrée etlaunchctl bootstrapsur le nouveau plist pour éviter deux instances. - Passage paramètres : définissez un
ThrottleIntervalraisonnable (souvent ≥ 10 s),KeepAliveetExitTimeOut(point de départ courant 20 s) pour laisser la fermeture gracieuse drainer les connexions. - Sondes externes : pointez l'orchestration vers
openclaw healthtoutes les 30–60 s ; alertez seulement après trois échecs consécutifs pour lisser le jitter. - Acceptation : conservez 24 h de courbe santé et le nombre d'exécutions launchd ; une croissance en marches d'escalier signifie retour à l'étape 3 pour comparer les codes de sortie.
5. Paramètres citables et checklist
- ExitTimeOut 20 s : laisse à la passerelle le temps de se terminer après SIGTERM ; une valeur trop basse pousse launchd au SIGKILL et à des sorties non nulles.
- Sondes 30–60 s : cohérent avec la FAQ — équilibre faux positifs et délai de détection ; les métriques internes peuvent rester à 15 s sans lier la politique de redémarrage à cette granularité.
- ThrottleInterval ≥ 10 s : amortit temporairement les tempêtes de redémarrage avant correction durable ; associez limites amont et surveillance des certificats plutôt que de compter sur le seul backoff.
6. Pourquoi le Mac mini accueille mieux la passerelle
Les charges passerelle redoutent deux risques cachés : redémarrages thermiques ou alimentation, et une couche de virtualisation qui ajoute du jitter d'ordonnancement. Un Mac mini Apple Silicon se situe souvent autour d'environ 4 W au repos branché, ce qui convient aux démons toujours actifs ; la pile macOS + Silicon unifiée simplifie launchd, la pile réseau et TLS quand vous rédigez des runbooks.
Pour une sortie stable vers les API amont avec moins de bruit de voisinage qu'en VM multi-locataire, un nœud physique réduit aussi la « latence mystère ». Unix et SSH sont de première classe sur macOS : les étapes ci-dessus s'intègrent proprement au CI ou aux playbooks d'astreinte.
Si vous voulez OpenClaw Gateway sur du matériel silencieux, économe et prévisible dans la durée, le Mac mini M4 est l'un des meilleurs points d'entrée — découvrez les nœuds ZoneMac et alignez démon et supervision en une seule passe.
Stabilisez OpenClaw Gateway sur Mac mini bare metal
ZoneMac propose des Mac mini multi-régions conçus pour les jobs launchd longue durée et l'orchestration d'automatisation.