インシデントとは?システム運用での意味は? |ReSM

ReSM{Re}System Management

運用navi

システム運用の基礎知識から改善ポイントまで。
ITマネジメント専門業者の豊富な実績とノウハウで、
すぐに役立つ知識をご提供します。

システム運用

インシデントとは何ですか?
システム運用における意味と「インシデント管理」で重要なことは?

あらゆるシステム管理では適切な「インシデント管理」が求められます。しばしば「障害」と混同される「インシデント」ですが、実際には同義ではありません。さらに、こうした混同が管理者・利用者双方のストレスを招くこともあります。こちらでは、システム運用におけるインシデント管理において重要なポイントをご紹介します。

情報システム運用分野における「インシデント」とは

英単語の「Incident」は「出来事」を指します。具体的には、「ゆくゆくは重大な事件に発展していく可能性がある事象・小事件」といった意味です。各産業において用いられる「インシデント」も、英単語の「Incident」の意味に大きな差異はありません。

どの程度の事象を「インシデント」とカテゴライズするかは、管理目的や現場によって異なります。情報システム運用分野では、「セキュリティに害をなす可能性を秘めた予期しないトラブルや、外部からの攻撃」という使われ方が一般的です。ISO/IECでは明確に定義づけられており、27001では「望まない、又は予期しない一連の情報セキュリティ事象であって、事業運営や情報セキュリティを脅かす可能性が高いもの」、13335では「事業活動又は情報セキュリティを損ねる可能性のある、予期しない又は望んでいない事象」とされています。

同じITの現場でも、「インシデント」の用いられ方はさまざまです。サービスマネジメントやソフトウェアテストの現場では、上述したセキュリティ現場の例とは異なり、必ずしも好ましくないリスクにつながりうる事象を意味しません。単純に「調査が必要な、予期しない事象」といった意味で使われます。

「インシデント=障害」ではない

システム管理を担う方であれば、突発的な障害対応に悩まされた経験があるはずです。利用者の立場としては24時間365日システムが問題なく利用できるのは当然のこと。実際には障害により利用できなくなるタイミングは訪れますが、その不満の矛先は例外なく管理者へと向けられます。

管理者の努力は関係なく、現実的に障害とその可能性をすべて取り除くことは不可能です。さらに「すべての障害に対応しなければならない」というプレッシャーは、管理者に大きなストレスを強いることになります。ここで重要なのが、しばしば同義の言葉として使われる「インシデント」と「障害」の違いを理解することです。

利用者にとってインシデントに該当するケースを列挙してみましょう。

・メールサーバにアクセスできない
・ソフトウェアがフリーズする
・プリンタの接続がうまくいっていない

これらはすべてインシデントですが、厳密には障害ではありません。障害とは、インシデントを引き起こしている何らかの要因のひとつです。利用者にとってのインシデントは、「やりたいことができない状態」と定義づけられます。

トラブルの際に利用者が望んでいるには、障害の復旧ではなく、インシデントへの対応です。もちろん、インシデントへの対応に障害の復旧が求められる場合もあります。しかし、それはすべてのインシデントに当てはまるわけではありません。

利用者にとっては、やりたいことができれば問題ありません。理想的なのはインシデントが発生しない状態が続くことですが、インシデントからすぐに復帰できる環境を与えることも、インシデント管理と言えます。「デバイスの再起動を促す」「トラブル時に利用できる代替機を提供する」といった対応は、障害への対応ではありませんが、インシデント管理においては有効な取り組みです。インシデント発生の度に、根本的な障害の究明、対応に労力を注ぐ必要があるわけではないのです。

関連ページ  システム運用サービスの具体的な価格は?

システム利用者の立場に立ったインシデント管理

インシデント管理において重要なのは、「対応をシステム利用者の立場に立って考えること」です。システム利用者の側からすると、望んでいるのは障害の復旧そのものではなく、「やりたいことができるようになること」です。管理者は、まず「インシデント=障害」という固定概念から開放される必要があります。

また、利用者が感じるフラストレーションに配慮する場合、「インシデントがいつ取り除かれるのか」を伝えることも大切です。システム利用者は無駄に復旧を待っている時間を嫌います。例として、何もアナウンスせずに30分後にインシデントが解決された場合と、「60分後に解決されます」とアナウンスし実際に解決された場合を想定してみましょう。実際にインシデントを取り除くのに有した時間は後者のほうが長いものの、利用者を無駄に待たせないため後者のほうがフラストレーションを回避できます。

時間に関するアナウンスは、総合的なインシデント管理の一例です。インシデント管理では、まず利用者の立場に立つことを意識しましょう。

まとめ

システム管理では、着眼点を少し変えるだけでストレスを大きく軽減できるかもしれません。大切なのは、インシデントと障害の違いを理解することと、利用者の立場に立ったインシデント管理を心がけることです。根本的な障害の復旧は、すべてのインシデント発生時に求められるものではありません。今回ご紹介したような内容を意識し、利用者・管理者双方にとってフラストレーションにならないインシデント管理を目指しましょう。

関連ページ  運用設計・監視設計から24/365の運用までをワンストップ提供

お気軽にお問い合わせ下さい

03-6914-5215

平日 9:00〜17:00

お問い合わせ

  • 株式会社DTS

    1972年の創業以来、独立系の総合情報サービス企業として金融や通信をはじめ、さまざまな業種・業態のお客様に
    コンサルティングから設計、開発、運用、基盤構築までの多種多様なITサービスを提供しています。