問題管理とは?トラブル解決から再発防止までのプロセスとは |ReSM

ReSM{Re}System Management

運用navi

システム運用の基礎知識から改善ポイントまで。
ITマネジメント専門業者の豊富な実績とノウハウで、
すぐに役立つ知識をご提供します。

システム運用

問題管理とは何ですか?
具体的にどのようなプロセスがありますか?

システム運用においてインシデント管理と並び重要度の高いタスクが「問題管理」です。トラブルが起きた際の素早い復旧は適切なインシデント管理により実現されますが、そもそもインシデントが起きない暗転したシステムは「問題管理」が正しく行われていなければ実現できません。こちらでは、問題管理の概要や着手するきっかけ、また代表的なプロセスについてお話します。

問題管理とは?

システムの現場における「問題管理」とは、予期せぬ自体「インシデント」の原因となる要素を突き止め、分析を行ない、再発防止を試みるプロセスを指します。ユーザーにとって信頼できるサービスを提供し、品質を維持するためには非常に重要な取り組みです。

インシデントに対応する「インシデント管理」とはしばしば混同されますが、本来は分離して考えるべきものです。インシデント管理はトラブル発生の都度に行う「応急処置」、問題管理はインシデントそのものを避けるための「恒久対策」に当たります。

ユーザーがサービスを利用できる状態に普及した時点でインシデント管理はクローズしますが、問題管理はその後も原因を究明・是正するまで続きます。インシデント発生時はユーザーに配慮し、インシデント管理を有線して行うことになります。このように、インシデント管理と問題管理を分離して考えることが重要です。

問題管理が動き始めるきっかけは?

問題管理はサービス・システム運用において定型的に発生する業務ではありません。きっかけとなる事象として、大きく分けて3つ存在します。それぞれについて詳しくお話しましょう。

・未経験のインシデント発生時

過去に起こったことのないインシデントは、最もたる問題管理の対象です。同様のインシデント再発を防ぐため、根本的な原因の究明に注力する必要があります。問題管理では、最もスタンダードなケースと言えるでしょう。

・解決済みのインシデント発生時

解決済みと思われていた過去の例と同じ、もしくは類似したインシデントが再度発生した場合、過去の問題管理が根本原因の是正にいたっていなかったことを意味します。その場合は、再度原因究明・解決に向けた取り組みが必要です。

・過去の分析結果から何らかの傾向がわかった場合

集積されたインシデントのデータには、問題管理のきっかけとなる何らかの傾向が秘められていることがあります。インシデント自体がきっかけとなる上述した2つのケースに対し、こちらは能動的な分析がきっかけです。

関連ページ  システム運用監視サービスの具体的な価格は?

問題管理における解決までの3つのプロセス

問題管理は一般的に、以下の3つのプロセスで進行します。

・インシデントの記録・分類

問題管理において「問題」として認識されるのは、インシデントを引き起こした原因を特定不能な場合です。この認識後、対応漏れを防ぐ意味を込めて、発生日時やインシデント内容の報告者について詳細に記録しておきます。

・インシデント内容の調査・分析

「問題」の認識後は、問題管理の本筋である原因を究明するフェーズです。問題が単独の場合は、すぐに原因究明に取り組めますが、複数発生している場合はあらかじめ分類し、優先順位にもとづいて着手する必要があります。

・解決策実施

根本的な解決策が見つかり次第、適応します。また、問題管理の性質上、同様のインシデントと防ぐために発生経緯や解決までの道のりをナレッジとしてまとめておくことが大切です。ナレッジの記録までを終えて、はじめてひとつの問題管理がクローズしたことになります。

問題管理は「再発防止」が重要

インシデント管理がユーザーの目線にたち、サービス・システムの迅速な復旧を目指すのに対し、問題管理において重要視されるのはインシデントの「再発防止」です。その都度の原因究明、解決はあくまで前提と言えます。

インシデントの再発防止を実現するためには、発生時から解決までの詳細な情報をログとして残しておくことが重要です。過去の問題管理のデータが、新たな問題解決に役立つケースもあります。

問題管理のデータベースは「問題管理台帳」と呼ばれており、情報が一元管理できるかたちでまとめられています。また、問題管理担当に問題の削減目標を数値で求める取り組みも一般的なようです。

まとめ

問題管理、またインシデント管理への理解を深めていただけたのではないでしょうか。システムをインシデントがまったくない状態で維持することは困難ですが、問題管理によって限りなくインシデントの数をゼロに近づけることはできます。

また、ユーザーへとシステムを利用できる状態で速やかに戻すためにも、インシデント管理と問題管理を混同せず、分離して考えることは重要です。問題管理では、その場の原因究明・問題解決策の実施異常に、その後の再発防止を目的として情報の記録が求められます。社内利用システムにおいても、インシデントがもたらすビジネスへの悪影響を最小化するため、インシデント管理と問題管理に注力することが大切です。

関連ページ  運用設計・監視設計から24/365の運用までをワンストップ提供

お気軽にお問い合わせ下さい

03-6914-5215

平日 9:00〜17:00

お問い合わせ

  • 株式会社DTS

    1972年の創業以来、独立系の総合情報サービス企業として金融や通信をはじめ、さまざまな業種・業態のお客様に
    コンサルティングから設計、開発、運用、基盤構築までの多種多様なITサービスを提供しています。