2026 クラウドMac上のOpenClaw本番カットオーバー:ヘルスチェック、スモークテスト、ロールバック手順
レンタルApple Silicon MacへOpenClaw Gatewayビルドを昇格させるプラットフォームチームは、金曜夜の「launchdを再起動するだけ」変更で月曜朝にリモート運用者を置き去りにしがちです。本プレイブックの結論:カットオーバーをミニリリース扱いにし、設定を凍結し、壁時計で少なくとも15分の層状ヘルスプローブを走らせ、plist差分を取得し、本番トラフィックに触れる前にロールバック用バイナリをステージする。プローブ表、数値目標(ポート、再起動回数、ログ行の上限)を含む8つの順序付きステップ、ロールバック条件、MacLoginの5リージョンに即したFAQを示します。
実行前にOpenClawデプロイガイド、ゲートウェイデーモンのトラブルシュート、install.shとnpm global、SSHトンネル設定を読んでください。接続はヘルプ、スタンバイノード追加は料金を参照。
OpenClawリースにおける「カットオーバー」の意味
カットオーバーは、新しいゲートウェイバイナリ、Nodeランタイム、または環境ファイルが自動化フックに対して権威を持つ時間帯です。Kubernetes背後のステートレスマイクロサービスとは異なり、MacLoginのリースはSSH LocalForwardでノートPCから届くループバックリスナーを晒すことが多く、失敗モードには静かな部分アップグレードが含まれます—launchdは/usr/local/bin/nodeを指す一方、対話シェルはHomebrewのCellarパスを解決し続ける、など。チケットに影響範囲を記載:Slack、Telegramなどのチャネル、モデル、ゲートウェイに依存するcronスケジュール。
カットオーバー前のインベントリゲート(省略禁止)
- Nodeメジャー固定:ログインシェルとplistの
EnvironmentVariablesの両方でnode -vを記録。カットオーバー前に一致必須。 - ポートマップ:
sudo lsof -nP -iTCP -sTCP:LISTENの出力を取得し、ゲートウェイポート(多くは実験帯18000–19999—plistで確認)を強調。 - 成果物ハッシュ:ロールバックをバイト検証するため、前のゲートウェイバイナリまたはnpmパッケージtarballの
shasum -a 256を保管。 - オペレーター名簿:HKと米国営業時間をまたいで重なる2名を指名。
ヘルスプローブ表(層状シグナル)
| 層 | チェック | 合格基準 | 典型的な失敗 |
|---|---|---|---|
| プロセス | launchctl print system/your.plist | 状態=実行中、最終終了=0 | 環境ファイル欠落によるクラッシュループ |
| TCP | nc -vz 127.0.0.1 PORT | 2秒以内に成功 | 古いプロセスによるポート乗っ取り |
| アプリ | CLIステータスまたはHTTPヘルス | HTTP 200または文書化済みOK JSON | 部分的マイグレーションによるDBロック残存 |
| 統合 | 合成Webhook送信またはドライランツール呼び出し | E2E遅延P95 5秒未満 | 外向きAPIのDNSドリフト |
launchctl kickstart -kサイクルを1回含める。8ステップカットオーバー手順
- フリーズ:plistリポでマージ凍結;リリースタグ
oc-cutover-YYYYMMDD。 - スナップショット:環境変数ガイドに列挙された設定ディレクトリをtar。
- 候補インストール:承認済み経路(スクリプトまたはnpm)でステージングリースに先に適用。
- 並行実行(任意):カナリアを127.0.0.2または代替ポートにバインドしてシャドウトラフィック—トンネル設定に記載。
- plist切替:ProgramArgumentsまたはWorkingDirectoryを更新;
plutil -lintを実行。 - リロード:launchdをキック;最初の200行のログでスタックトレースを監視。
- 表の検証:ヘルス表の各行を実行;スクリーンショットまたはJSON応答をチケットに添付。
- 連絡:共有チャネルに「カットオーバー緑」、タイムスタンプ、バージョン、ロールバックオーナーを投稿。
ロールバック条件(自動ゴー/ノーゴー)
| シグナル | しきい値 | 対応 |
|---|---|---|
| 終了ループ | 5分間に3回クラッシュ | 前バイナリ+plist復元;インシデント起票 |
| エラー率 | 合成失敗 > 5% | ロールバックし、ラップトップトンネルでトラフィック保持 |
| 遅延 | P95 > ベースラインの5倍 | ロールバック;DNSまたはモデルプロバイダを調査 |
| ディスク | データボリューム空き < 10% | カットオーバー中止;リトライ前にログ掃除 |
FAQ
メンテナンスモードは必要? ユーザー向けチャネルでははい—チケットIDを参照するバナーメッセージを投稿。
プローブは自動化できる? Cronまたはlaunchdのcronパターンで可。ゲートウェイと別ユーザーで実行。
TLS終端は? リバースプロキシで終端する場合、表に証明書期限チェックを含める—Webhook TLSガイド参照。
安全なカットオーバーを加速するMacLoginのMac mini M4
Apple Silicon Mac miniはゲートウェイ負荷向けに予測可能なシングルノード性能を与え、ロールバック訓練中のnpmインストールやネイティブモジュール再ビルドの待ち時間を短縮します。香港、日本、韓国、シンガポール、米国にまたがるMacLoginのフットプリントにより、APIプロバイダ近くでカットオーバーをリハーサルでき、往復遅延のばらつきがヘルスチェックのフレークを隠すのを防ぎます。レンタルは「暗黒」スタンバイノードを安く保ちplistを複製してkickstart順序を練習でき、SSHと任意のVNCで同じメンテナンス枠にGUI寄りの失敗も監視できます。
トラフィックが増えたら料金から容量を追加し、ハッシュ・プローブ・ロールバックオーナーを同じプレイブックで各新リースIDに昇格させてください。