失敗しない
ポイントは?
はじめての運用
アウトソーシング

サーバー・システム運用業務の自動化はなぜ失敗する?
スムーズに進めるためのポイントとは

DXがグローバルな潮流となる中で、日本でも戦略的なIT投資への意欲が高まり、現状のサーバー・システムを維持するための運用業務を自動化してコストを削減したいというニーズが高まっています。しかし運用業務は複雑なため、人手に頼る部分が多いという問題があります。運用自動化を実現するためにはどのような進め方をすればよいのでしょうか。

ニーズが高まるサーバー・システム運用の効率化

テクノロジーを活用することで企業の競争力を高める「デジタル・トランスフォーメーション(DX)」はもはや避けて通れないものとなり、多くの企業がテクノロジーやデータの活用に取り組んでいます。その結果、対象となるシステムが増えるだけでなく、仮想化技術やパブリッククラウドの併用によってシステムの形態が多様化しました。そのためシステムにまたがる障害の切り分けや復旧作業が複雑になり、作業負荷が増大しています。
「企業IT動向調査報告書 2020」によると、企業の IT 基盤の導入、保守、運用における現在の優先課題について質問したところ「IT 基盤の運用管理業務負担の軽減/省力化」「IT 基盤の保守/運用管理費の削減」が上位に挙がりました。
サーバー・システム運用業務の省力化やコストの削減は重要な課題ではあるものの、単にコストを圧縮するだけでは安定的な運用ができません。安定的な運用を維持しつつ、IT基盤の運用・管理の人件費、管理費を効率化していく必要があります。

サーバー・システム運用業務の自動化が進まない理由とは

サーバー・システム運用の品質を落とさずにコストを下げる対策として有効と考えられるのが、運用業務の自動化です。自動化はコストを削減するだけではなく、オペレーションミスを防いで運用するサービスの品質を保持し、安定稼働に貢献します。また昨今の新型コロナウイルスの影響や災害発生により担当者が通勤できない場合でも対処が可能になります。
しかしいざ自動化しようとすると、うまくいかないケースが多いのが実情です。というのも現在のサーバー・システム運用業務において、ジョブ管理、バックアップ管理、エラー通知などはすでに自動化されており、単純に自動化できる部分はそれほど多くないからです。一方でオンプレミスとパブリッククラウドにまたがるメンテナンスや障害対応等は、複雑な手順となるためにやむなく手作業で行っているケースが多々あります。
特に障害対応は、判断の分岐があって自動化が難しく、緊急対応もあるため作業負荷が重い領域です。そもそも膨大なエラー通知のほとんどは対処不要になっているのが現状で、「対処しない」という判断をするのにも負荷がかかっています。また障害の原因を切り分ける際に、周辺のシステムからログを収集して状況を把握するのに時間がかかります。どのシステムのログを見たらよいのか、どのような対処をしたらよいのかは複雑な条件分岐があり、自動化しにくい部分です。複雑な手順を自動化できたとしても、自動化の中身がブラックボックスになって却って属人化が進むリスクもあります。

RBAで複雑なサーバー・システム運用業務の自動化を実現

自動化が困難なサーバー・システム運用の領域が多く残る中で注目されているのがRBA(Run Book Automation)です。RBAは運用業務に関する定型作業を見える化・自動化するツールです。例えばエラーが発生したときに、担当者はどのシステムのログを調べ、どのような対処をしたらよいか、手順書をみて記載通りに作業をしますが、RBAではそのまま自動化することができます。RBAにはひとつひとつの手順をつなげて連続で実行する仕組みがあるため、複雑な手順を「見える化」しつつ自動化できるのが特徴です。手動と自動の手順を混在させたり、異常時の対処フローを定義したりといったことができるので、手順書で行うオペレーションを網羅できます。
ただしこのツールを使うためには、いくつかの準備が必要です。まずこれまで運用者を悩ませてきた大量のメッセ―ジを整理する必要があります。各システムからメッセージを集め、重複するメッセージは集約するといった形でメッセージを絞り込みます。
その上で必要となる作業を洗い出します。過去の対応履歴をもとに対処が必要なケースを洗い出し、手順を標準化していきます。
このような準備をした後に、ようやくツールを使って自動化する作業に入ることになります。そのため準備段階で非常に時間がかかるという問題があります。特に作業の洗い出しには関係者全員の協力を得る必要がありますが、各担当者が通常の運用業務を優先してしまい、洗い出しが後回しになって遅々として進まないことがよくあります。

サーバー・システム運用の自動化を成功させるためのポイント

サーバー・システム運用の自動化を成功させるには、現状把握にこだわらず、段階的・部分的に進めるのが一つの方法です。準備にかかる時間が少なくなるだけでなく、費用対効果が早い段階で測定できるために経営層の理解が得られるというメリットがあります。また、段階的・部分的に繰り返し自動化を実行することでプロセスを確立し、次に取り組む時にはより効率的に行うことができるようになります。
段階的に進める方法では、サーバーメンテナンスや障害対応時のログの取得など、よくある業務を選んで自動化し、その後にあらゆる業務に横展開していきます。部分的に進める方法では、人が判断する部分を残した形で自動化します。RBAでは手動と自動のプロセスを混在することができるので、段階的・部分的に進める方法でも対応が可能です。
もうひとつの選択肢として、マネージドサービスを利用して運用業務をアウトソースする方法もあります。マネージドサービス自体は完全自動化を提供するものではありませんが、24時間365日のシステム監視に加えて、準備段階において各担当者からヒアリングして運用手順書を整理・作成するサービスも提供しています。そのためできるだけ担当者の負担をかけずに運用業務の棚卸を行い、従来の業務のムダを省くことができます。また自動化についてもノウハウを持っているため、将来の完全自動化に向けた仕組みづくりのサポートも受けることができます。
DXの取り組みは不確実な部分が多く、すぐに利益を得て投資を回収できるわけではありません。それでも攻めの投資を続けるには、現行システムの維持にかかるコストの効率化が必要になってきます。その方策として運用業務の自動化やマネージドサービスを検討してみてはいかがでしょうか。

システム運用担当者さま必見のお役立ち情報

今の運用現場には、多くの悩みを生む「負のスパイラル」があります
「システム運用、負のスパイラルから脱却するには」
システムの維持保守をするだけで手一杯なのに要求は増えるばかり。でもコスト削減で体制は増強できないから改善が進まない。そんな負のスパイラルから抜け出すヒントをまとめた資料です。

【このコラムの著者】
ReSM(リズム)サービス担当

ReSMサービスはシステム運用の「 {re} design 」をコンセプトに、 「最適な運用」を「最適な価格」でご提供するマネージド・サービス・プロバイダーです。 クラウドの導入支援から安心の運用監視・保守までをトータルでご提案できます。
>>ReSMのサービス内容はこちら

関連サービス

{Re} System Management