PROJECT STORY
プロジェクトストーリー
大規模クラウドサービスの
マネジメント運用プロジェクト
大規模障害の危機を乗り越え理想のクラウドサービス確立を目指す
エンジニア未経験で入社した髙﨑は2年間、大規模クラウドサービスの監視運用チームに配属され、24時間365日体制で動きながら基本的な知識・クラウド運用ノウハウを学んだ。
そして3年目、満を持してサービスマネージャーへと昇格。実際にクライアントからの要望に対応し、チームメンバーに適切な指示を出しつつ、さらなる運用改善にチャレンジしていく。
その中で年に1回あるかどうかの大規模障害に直面。その危機をどのように乗り越え、理想のクラウドサービスを追求しているのか?今回はその一連の流れについて、髙﨑氏本人の声と共にご紹介したい。
INTERVIEW MEMBERS
-
- ITサービス事業部
- エンジニア
髙﨑 駿 SHUN TAKASAKI
大規模クラウドサービスの運用を効率化し、クライアント&自社運用チーム双方の稼働削減と安全性を追求する
クライアントの社員並びにエンドユーザーに対して提供する様々なサービスやシステム運用を、大規模クラウドシステムによって24時間365日支えている。
パソナがこの案件を請け負う以前から、システムやトラブルに関する問い合わせ件数が多く、その都度イレギュラーな対応を迫られるケースも少なくなかった。
そこで今回のプロジェクトでは、通常運用や緊急対応などのイレギュラー対応時、双方において業務の標準化による効率化を進めることによって、いつでも安心してシステムを利用してもらえる運用体制の構築をメインテーマとしている。
加えてクライアントに対して、既存顧客のサポートするための運用稼働削減も進めていく。
その重要なプロジェクトのサービスマネージャー(以下SM)に任されたのは、入社3年目の髙﨑駿氏だった。
彼は入社後2年間、同じプロジェクトの監視運用チームで、未経験から一通りの業務を学んだ後、3年目でメインSMをサポートするサブSMに抜擢されたのだ。
髙﨑氏「クラウドサービスの運用には幅広い知識が必要で、今の自分にSMが務まるのか、正直なところ不安を抱えたままのスタートでした」
年1度あるかないかの大障害にチーム全員で乗り切る。
それ以降、目に見えて問い合わせ件数が減る効果も
SM1年目の髙﨑氏は、周りのサポートを受けながらネットワーク・サーバ・セキュリティ等幅広い知識を一歩一歩着実に吸収していく。
「とはいっても自分一人では対処できないタスクが多いため、周りのベテランSMに対して自分なりの見解や仮説を考え、相手にぶつけながら解決策を見出していくスタイルを常に心がけています」と、普段から自分なりに創意工夫しながら少しでも早く、自分が理想とするSMになる努力を続けていると語る髙﨑氏。
そんな彼に、プロジェクト最大の危機が訪れた。
クラウド運用を支える重要なパーツである「ストレージディスク」が故障。しかも冗長化を目的に予備を含めて3本設置されていたが、3本同時に故障してしまったことでシステムダウンしたのだ。
髙﨑氏「その時は3日3晩、私を含めたチーム全員が原因調査や復旧作業に追われて、まさに『総力戦』で臨みました。その結果、何とか無事復旧できたので、周りのメンバーのサポートにはとても感謝しています」
万全であるはずだった冗長化の仕組みが不測の事態で機能しなくなってしまった為に、SMとして状況把握や顧客サポートにだいぶ手間取ってしまい、ユーザーに対し不信感を与える結果となってしまった。
この件を教訓に、大規模障害に備えて速やかに状況把握しユーザーと連携が取れる仕組みの再構築など、サポート体制の更なる改善を行った。
その後もSMとして地道な運用改善を重ねていくことでトラブルを未然に防ぎ、目に見えてユーザーからの問い合わせ件数が減少するなどの効果が表れたという。
理想のクラウドサービス実現のために、さらなる安定運用を目指す。
SMとして飛躍できるチャンスがパソナにある
今後も継続的にクラウドサービスの安定運用に向けた取組みが続いていく。
本プロジェクトにはSMが10名在籍していて、それぞれクラウド運用の案件を担当している。
中には案件は異なるものの、共通のストレージを使用しているケースもあるため、バグが発生した場合にはそうした事例をチーム内で共有することで、他の案件でも早速対策を取り入れることができるのはパソナならではの強みだ。
ちなみに現在、髙﨑氏は別の案件においてメインSMとして活躍しているが、早速今回の経験を活かせているという。
- 髙﨑氏
-
これだけ大規模なクラウドサービスのSMを経験できたことで、幅広い知識を身につけることができました。今後DX導入の流れが加速化していく中で、クラウドサービスはさらに重要な役割を担うことになるため、これまで以上に幅広い知識やスキルを吸収し、真のSMとしてキャリアアップできるように頑張りたいと思います。
また、今回の経験を通じて、システム障害が発生することのないよう未然にトラブルを防ぐことでユーザーからの問い合わせ件数を少なくし、お客様に安心してサービスを利用していただける環境を築くやりがいと責任感を感じられたのは、大きな収穫です。
パソナでは、未経験からでも本人のやる気と適性を十分考慮した上で、こうした重要な案件における責任あるポジションを任せていく風土がある。それは周りに経験豊富なメンバーをアサインし、彼らとスムーズな意思疎通や迅速にサポートできる環境があるからこそ実現できるのだろう。