2018.02.08

KCPS 2017Q4の稼働率について

KDDIクラウドプラットフォームサービス(以下、KCPS)のサービス運用担当の刀根です。

KCPSの2017Q4稼働率(※)は99.999912%でした。

(※)稼働率=月間VM稼働時間累計/(月間VM稼働時間累計+月間VM故障時間累計)ただしメンテナンス時間を除く

 
いつもKCPSをご利用いただきありがとうございます。

昨年11月初旬に実施いたしました、KCPS ver1管理ソフトウェアのバージョンアップは、メンテナンスに関する借用調整など、お客さま業務に影響を与える作業となりましたが、無事完了することが出来ました。KCPSを日頃ご利用いただいているお客さまのご理解、ご協力があってこそやり遂げることが出来たと思っております。ご協力、本当にありがとうございました。

およそ1年半以上も前から本メンテナンスに向けたプロジェクトが始動し、メンテナンスにより関連設備へ与える影響の調査や、スケジュール策定、実機検証といった一連の開発業務、ならびにお客さま対応などのサポート業務を企画、開発、運用部門が一体となって遂行してまいりました。事前の検証作業においては、下図に示す作業プロセスに関連した数千にも上る試験項目を網羅し、うち1パーセント未満の課題についてはワークアラウンド対応を準備し、致命的なリスクの解消に尽力いたしました。

 

また、お客さま業務への影響を考慮し、作業日時の選定やお客さまへのアナウンスについては細心の注意を払いました。作業日時はこれまでのAdmin Consoleへのアクセス数を分析し、比較的アクセスの少なくなる週末(週トータルのアクセスの数 パーセント)をターゲットといたしました。お客さま向けには作業日より半年前から数回にわたり個別に、かつ通信影響の発生する時間帯を3時間程度に絞り込んだ上でアナウンスを実施いたしました。さらに専用サイトを設置してお客さまの確認状況を日時でモニターいたしました。作業日までに確認が取れないお客さまについては、セールスエンジニアおよび担当営業からの個別説明を実施し、ご理解を賜ることが出来ました。

作業当日は万全の体制を期すため、クラウドプラットフォーム担当のエンジニアだけでなく、弊社回線サービスを中心とした法人サービスのテクニカルエンジニアも待機し、有事の際は密な情報連携を図りお客さま対応できる準備を整えました。自動実行ツールの導入などの作業効率化により、98 パーセントを超えるお客さまについて、事前のアナウンスの通り15分以内の通信影響で作業を完了することが出来ました。ただ、一部のお客さまにつきましては、想定外の事象が発生しご迷惑をおかけいたしました。パートナー含めた上級エンジニアを総動員して復旧対応にあたりましたが、今後はお客さま業務に影響を与える可能性のある作業プロセスについて、その時点で当該箇所を見直し、正確な影響を確認後、作業を実施するように改善してまいります。

 

3日間、延べ100人以上のエンジニアが関わる大規模な作業となり、KCPSをリリースして以降、最もチャレンジングな作業を完遂することが出来ました。しかし、我々は次なるステージに進む必要があると考えています。安定したクラウド基盤をベースに、各種マネージドサービスやIoTサービスなど、今後新たなフィールドをサポートラインナップに加え、徹底的なお客さま視点でKDDIの法人サービスを盛り上げてまいります。是非ご期待ください。
 

カテゴリ
タグ

KDDI株式会社 運用本部
サーバーオペレーションセンター クラウドオペレーションセンター

刀根 央樹

新着記事
タグ
アーカイブ
カテゴリー
Contact
TOP