AI自動化 2026年4月8日

2026 クラウドMac上のOpenClaw本番カットオーバー:ヘルスチェック、スモークテスト、ロールバック手順

MacLogin AI自動化チーム 2026年4月8日 約12分で読めます

レンタルApple Silicon MacへOpenClaw Gatewayビルドを昇格させるプラットフォームチームは、金曜夜の「launchdを再起動するだけ」変更で月曜朝にリモート運用者を置き去りにしがちです。本プレイブックの結論:カットオーバーをミニリリース扱いにし、設定を凍結し、壁時計で少なくとも15分の層状ヘルスプローブを走らせ、plist差分を取得し、本番トラフィックに触れる前にロールバック用バイナリをステージする。プローブ表、数値目標(ポート、再起動回数、ログ行の上限)を含む8つの順序付きステップ、ロールバック条件、MacLoginの5リージョンに即したFAQを示します。

実行前にOpenClawデプロイガイドゲートウェイデーモンのトラブルシュートinstall.shとnpm globalSSHトンネル設定を読んでください。接続はヘルプ、スタンバイノード追加は料金を参照。

OpenClawリースにおける「カットオーバー」の意味

カットオーバーは、新しいゲートウェイバイナリ、Nodeランタイム、または環境ファイルが自動化フックに対して権威を持つ時間帯です。Kubernetes背後のステートレスマイクロサービスとは異なり、MacLoginのリースはSSH LocalForwardでノートPCから届くループバックリスナーを晒すことが多く、失敗モードには静かな部分アップグレードが含まれます—launchdは/usr/local/bin/nodeを指す一方、対話シェルはHomebrewのCellarパスを解決し続ける、など。チケットに影響範囲を記載:Slack、Telegramなどのチャネル、モデル、ゲートウェイに依存するcronスケジュール。

カットオーバー前のインベントリゲート(省略禁止)

  • Nodeメジャー固定:ログインシェルとplistのEnvironmentVariablesの両方でnode -vを記録。カットオーバー前に一致必須。
  • ポートマップ:sudo lsof -nP -iTCP -sTCP:LISTENの出力を取得し、ゲートウェイポート(多くは実験帯18000–19999—plistで確認)を強調。
  • 成果物ハッシュ:ロールバックをバイト検証するため、前のゲートウェイバイナリまたはnpmパッケージtarballのshasum -a 256を保管。
  • オペレーター名簿:HKと米国営業時間をまたいで重なる2名を指名。

ヘルスプローブ表(層状シグナル)

チェック合格基準典型的な失敗
プロセスlaunchctl print system/your.plist状態=実行中、最終終了=0環境ファイル欠落によるクラッシュループ
TCPnc -vz 127.0.0.1 PORT2秒以内に成功古いプロセスによるポート乗っ取り
アプリCLIステータスまたはHTTPヘルスHTTP 200または文書化済みOK JSON部分的マイグレーションによるDBロック残存
統合合成Webhook送信またはドライランツール呼び出しE2E遅延P95 5秒未満外向きAPIのDNSドリフト
スモーク継続時間:全層が一度合格したら、合成トラフィックを15分維持し、メンテナンス再起動を模す完全なlaunchctl kickstart -kサイクルを1回含める。

8ステップカットオーバー手順

  1. フリーズ:plistリポでマージ凍結;リリースタグ oc-cutover-YYYYMMDD
  2. スナップショット:環境変数ガイドに列挙された設定ディレクトリをtar。
  3. 候補インストール:承認済み経路(スクリプトまたはnpm)でステージングリースに先に適用。
  4. 並行実行(任意):カナリアを127.0.0.2または代替ポートにバインドしてシャドウトラフィック—トンネル設定に記載。
  5. plist切替:ProgramArgumentsまたはWorkingDirectoryを更新;plutil -lintを実行。
  6. リロード:launchdをキック;最初の200行のログでスタックトレースを監視。
  7. 表の検証:ヘルス表の各行を実行;スクリーンショットまたはJSON応答をチケットに添付。
  8. 連絡:共有チャネルに「カットオーバー緑」、タイムスタンプ、バージョン、ロールバックオーナーを投稿。
警告:OpenClawのセマンティックバンプと同じ窓でNodeメジャーを変える場合はチケットを分けてください—組み合わせるとロールバックの判断が曖昧になります。

ロールバック条件(自動ゴー/ノーゴー)

シグナルしきい値対応
終了ループ5分間に3回クラッシュ前バイナリ+plist復元;インシデント起票
エラー率合成失敗 > 5%ロールバックし、ラップトップトンネルでトラフィック保持
遅延P95 > ベースラインの5倍ロールバック;DNSまたはモデルプロバイダを調査
ディスクデータボリューム空き < 10%カットオーバー中止;リトライ前にログ掃除

FAQ

メンテナンスモードは必要? ユーザー向けチャネルでははい—チケットIDを参照するバナーメッセージを投稿。

プローブは自動化できる? Cronまたはlaunchdのcronパターンで可。ゲートウェイと別ユーザーで実行。

TLS終端は? リバースプロキシで終端する場合、表に証明書期限チェックを含める—Webhook TLSガイド参照。

安全なカットオーバーを加速するMacLoginのMac mini M4

Apple Silicon Mac miniはゲートウェイ負荷向けに予測可能なシングルノード性能を与え、ロールバック訓練中のnpmインストールやネイティブモジュール再ビルドの待ち時間を短縮します。香港、日本、韓国、シンガポール、米国にまたがるMacLoginのフットプリントにより、APIプロバイダ近くでカットオーバーをリハーサルでき、往復遅延のばらつきがヘルスチェックのフレークを隠すのを防ぎます。レンタルは「暗黒」スタンバイノードを安く保ちplistを複製してkickstart順序を練習でき、SSHと任意のVNCで同じメンテナンス枠にGUI寄りの失敗も監視できます。

トラフィックが増えたら料金から容量を追加し、ハッシュ・プローブ・ロールバックオーナーを同じプレイブックで各新リースIDに昇格させてください。

専用Apple Siliconでカットオーバーをリハーサル

リージョンごとに同一plistテンプレートのステージングと本番MacLoginノードを立ち上げ。