インシデントとは何ですか?システム運用における意味と「インシデント管理」で重要なことは?

あらゆるシステム管理では適切な「インシデント管理」が求められます。しばしば「障害」と混同される「インシデント」ですが、実際には同義ではありません。さらに、こうした混同が管理者・利用者双方のストレスを招くこともあります。こちらでは、システム運用におけるインシデント管理において重要なポイントをご紹介します。

情報システム運用分野における「インシデント」とは

英単語の「Incident」は「出来事」を指します。具体的には、「ゆくゆくは重大な事件に発展していく可能性がある事象・小事件」といった意味です。各産業において用いられる「インシデント」も、英単語の「Incident」の意味に大きな差異はありません。

どの程度の事象を「インシデント」とカテゴライズするかは、管理目的や現場によって異なります。情報システム運用分野では、「セキュリティに害をなす可能性を秘めた予期しないトラブルや、外部からの攻撃」という使われ方が一般的です。ISO/IECでは明確に定義づけられており、27001では「望まない、又は予期しない一連の情報セキュリティ事象であって、事業運営や情報セキュリティを脅かす可能性が高いもの」、13335では「事業活動又は情報セキュリティを損ねる可能性のある、予期しない又は望んでいない事象」とされています。

同じITの現場でも、「インシデント」の用いられ方はさまざまです。サービスマネジメントやソフトウェアテストの現場では、上述したセキュリティ現場の例とは異なり、必ずしも好ましくないリスクにつながりうる事象を意味しません。単純に「調査が必要な、予期しない事象」といった意味で使われます。

「インシデント=障害」ではない

システム管理を担う方であれば、突発的な障害対応に悩まされた経験があるはずです。利用者の立場としては24時間365日システムが問題なく利用できるのは当然のこと。実際には障害により利用できなくなるタイミングは訪れますが、その不満の矛先は例外なく管理者へと向けられます。

管理者の努力は関係なく、現実的に障害とその可能性をすべて取り除くことは不可能です。さらに「すべての障害に対応しなければならない」というプレッシャーは、管理者に大きなストレスを強いることになります。ここで重要なのが、しばしば同義の言葉として使われる「インシデント」と「障害」の違いを理解することです。

利用者にとってインシデントに該当するケースを列挙してみましょう。

・メールサーバにアクセスできない
・ソフトウェアがフリーズする
・プリンタの接続がうまくいっていない

これらはすべてインシデントですが、厳密には障害ではありません。障害とは、インシデントを引き起こしている何らかの要因のひとつです。利用者にとってのインシデントは、「やりたいことができない状態」と定義づけられます。

トラブルの際に利用者が望んでいるには、障害の復旧ではなく、インシデントへの対応です。もちろん、インシデントへの対応に障害の復旧が求められる場合もあります。しかし、それはすべてのインシデントに当てはまるわけではありません。

利用者にとっては、やりたいことができれば問題ありません。理想的なのはインシデントが発生しない状態が続くことですが、インシデントからすぐに復帰できる環境を与えることも、インシデント管理と言えます。「デバイスの再起動を促す」「トラブル時に利用できる代替機を提供する」といった対応は、障害への対応ではありませんが、インシデント管理においては有効な取り組みです。インシデント発生の度に、根本的な障害の究明、対応に労力を注ぐ必要があるわけではないのです。

システム利用者の立場に立ったインシデント管理

インシデント管理において重要なのは、「対応をシステム利用者の立場に立って考えること」です。システム利用者の側からすると、望んでいるのは障害の復旧そのものではなく、「やりたいことができるようになること」です。管理者は、まず「インシデント=障害」という固定概念から開放される必要があります。

また、利用者が感じるフラストレーションに配慮する場合、「インシデントがいつ取り除かれるのか」を伝えることも大切です。システム利用者は無駄に復旧を待っている時間を嫌います。例として、何もアナウンスせずに30分後にインシデントが解決された場合と、「60分後に解決されます」とアナウンスし実際に解決された場合を想定してみましょう。実際にインシデントを取り除くのに有した時間は後者のほうが長いものの、利用者を無駄に待たせないため後者のほうがフラストレーションを回避できます。

時間に関するアナウンスは、総合的なインシデント管理の一例です。インシデント管理では、まず利用者の立場に立つことを意識しましょう。

まとめ

システム管理では、着眼点を少し変えるだけでストレスを大きく軽減できるかもしれません。大切なのは、インシデントと障害の違いを理解することと、利用者の立場に立ったインシデント管理を心がけることです。根本的な障害の復旧は、すべてのインシデント発生時に求められるものではありません。今回ご紹介したような内容を意識し、利用者・管理者双方にとってフラストレーションにならないインシデント管理を目指しましょう。

この記事の著者

アバター画像
ReSM(リズム)サービス担当者
ReSMサービスはシステム運用の「 {re} design 」をコンセプトに、 「最適な運用」を「最適な価格」でご提供するマネージド・サービス・プロバイダーです。 クラウドの導入支援から安心の運用監視・保守までをトータルでご提案できます。

お問い合わせ

依頼内容に迷っているときは、課題の整理からお手伝いします。
まずはお悩みをご相談ください。

  • システム運用監視・保守サービスReSM(リズム)ご紹介資料

    クラウドの導入から24時間365日のシステム運用監視まで、ITシステムのインフラをトータルでサポートするReSM(リズム)サービスについて詳しく説明します。

  • 4つのポイントで学ぶ「失敗しないベンダー選び」

    運用アウトソーシングを成功させる第一歩は、サービスベンダーの選択です。この資料ではサービスベンダーを選択するポイントを4つ紹介します。

お電話でのお問い合わせも
受け付けています。

03-6914-5215 平日 9:00 - 17:00
03-6914-5215 平日 9:00 - 17:00