- システム障害発生時、保守業者へ連絡する前に5分で確認すべき4つの初動チェック項目
- 第一報に含めるべき内容と「口頭で終わらせない」ための記録の残し方
- SLAの障害レベル分類(P1〜P4)と応答時間・復旧時間目安の確認方法
- 社内エスカレーション・経営層報告・顧客対応の並行フロー
- 復旧後に業者へ求めるインシデントレポートの内容と再発防止の追跡方法
システム障害が起きたとき、発注者はまず何をすればよいか
業務システムで突然エラーが発生した、サービスが繋がらないといった状況になったとき、保守を外部に委託している発注者側の担当者はどう動けばよいのでしょうか。「とにかく保守業者に電話する」だけでは対応が後手に回ることがあります。
本記事では、発注者(依頼する側)が障害発生時にとるべき行動を順番に解説します。保守業者へのエスカレーション方法、SLA(サービスレベル合意)の照合、経営層への報告フローまで、実務で使える内容をまとめました。
1. 障害発生時の初動確認(最初の5分)
まず自社側でできる基本確認を行います。保守業者に連絡する前に以下を確認しておくと、その後のやり取りがスムーズになります。
- 影響範囲の把握:どの機能・ページ・ユーザーが影響を受けているか
- 発生時刻の記録:いつから問題が起きているか(ログや証言を確認)
- エラーメッセージのスクリーンショット:画面に表示されているメッセージをそのまま保存
- 直前の変更有無:デプロイ・設定変更・データ登録など直前に行った操作がないか確認
これらを30秒〜1分で確認し、保守業者への第一報に含めることで、原因調査の時間を大幅に短縮できます。
2. 保守業者へのエスカレーション方法
障害発生時の連絡先と手順は、保守契約書または「運用・保守手順書」に明記されているはずです。契約書を手元に用意した上で以下を確認してください。
連絡手段と優先順位
一般的な優先順位は次のとおりです。
- 電話(緊急時・即時対応が必要な場合)
- チケットシステム・メール(内容を記録として残す)
- チャット(Slack・Chatworkなど)(業者との共有チャンネルがある場合)
重要なのは「口頭だけで終わらせない」ことです。電話で第一報を入れた後、必ずメールやチケットで文字に残してください。これが後のSLA検証や責任の所在確認に必要になります。
第一報に含める内容
- 障害の概要(何が動かないか)
- 発生時刻
- 影響範囲(何人・どの機能)
- 業務への影響度(売上停止・受注不能など)
- エラーメッセージや画面のスクリーンショット
3. SLA(サービスレベル合意)と照合する
保守委託契約にSLAが定められている場合、障害の重大度分類と対応時間の約束を確認します。
重大度(障害レベル)の分類例
| レベル | 状況の例 | 一般的な初回応答目標 |
|---|---|---|
| 重大(P1) | 全サービス停止・売上に直結する機能の完全停止 | 30分〜1時間以内 |
| 高(P2) | 主要機能の一部停止・重要データの参照不可 | 2〜4時間以内 |
| 中(P3) | 一部機能の不具合・回避手段あり | 翌営業日以内 |
| 低(P4) | 軽微な表示崩れ・操作性の問題 | 1週間以内 |
自社の状況がどのレベルに当たるかを把握した上で、保守業者に伝えてください。業者側の優先度設定に影響します。
4. 社内での並行対応と経営層への報告
保守業者に連絡した後、自社内でも以下を並行して進めます。
社内での対応フロー
- 関係者への第一報:影響を受ける部署・役員に現状を簡潔に伝える
- 代替手段の確保:手作業・別システムによる業務継続が可能か検討
- 顧客・取引先への対応判断:外部への影響が出る場合は謝罪・案内のタイミングを決定
- ログ・記録の保全:後の原因調査のためにシステムログを消去しない
経営層への報告内容
- 発生した障害の概要と業務への影響
- 現在の対応状況(保守業者への連絡済み・調査中など)
- 復旧見込みと、それまでの代替手段
- 顧客・取引先への影響有無
5. 復旧後に保守業者へ求める報告書
障害が復旧したら、それで終わりにしないことが重要です。再発防止のために、保守業者から以下の報告書を必ず受け取りましょう。
障害報告書に含まれるべき内容
- 障害の根本原因(RCA):何が原因だったか
- 発見から復旧までのタイムライン:各工程で何分かかったか
- SLA遵守状況:約束した応答・復旧時間を守れたか
- 再発防止策:同じ障害を起こさないための具体的な対策
- 次回の確認時期:対策の実施確認スケジュール
報告書を受け取ることで、同様の障害が繰り返されていないか・対策が実施されているかを追跡できます。
6. 発注者が持つべき「障害対応チェックリスト」
以下を参考に自社用のチェックリストを作成しておくと、いざというときに慌てずに動けます。
- 保守業者の緊急連絡先(電話番号・チケットURL)を共有フォルダに保管している
- 障害発生時の社内エスカレーション先(IT担当上長・役員)が明確になっている
- SLAの内容(応答時間・復旧時間・障害レベル分類)を把握している
- 障害記録フォーマット(日時・内容・対応記録)を用意している
- 過去の障害記録を保管している(年1回の棚卸し推奨)
まとめ:発注者も「対応フロー」を持つことが安心につながる
システム保守を外部に委託していると、「障害対応は業者任せ」になりがちです。しかし発注者側も初動確認・エスカレーション・社内報告のフローを持つことで、障害の影響を最小限に抑えられます。
保守契約の更新タイミングに合わせて、SLAの内容・連絡先・報告書フォーマットを見直すことを定期的に実施することをお勧めします。FUNBREWでは保守・運用の体制づくりから契約内容の相談まで対応しています。お気軽にご相談ください。
この記事をシェア