2015.01.13

KCPS 2014Q4の稼働率について

KDDIクラウドプラットフォームサービス(以下、KCPS)開発リーダーの前原です。
KCPSの2014Q4稼働率(※)は99.9995%を記録しています。

1
(※)稼働率=月間VM稼働時間累計/(月間VM稼働時間累計+月間VM故障時間累計)ただしメンテナンス時間を除く

3ヶ月間の故障部位内訳は、サーバ・ホスト故障 60%、ストレージ故障 20%、仮想ネットワーク故障 20%となりました。

2

ストレージ故障については、冗長化されたストレージコントローラ内の1ファイルシステムに対してネットワークから無応答状態となり、一部インスタンスからのストレージアクセスが不安定となる事象が発生しました。仮想サーバ監視機能による検知後、ストレージコントローラを手動で切り替え復旧対応を行いました。故障発生原因の究明とともに、ストレージ単体での故障検知からの自動切換えが行えなかったことを改善するために、類似事象が発生した際にはより短時間での復旧を約束する新たな監視機能の導入を行っています。

 

3

ストレージ故障と監視新機能イメージ

KCPSでは過去の事故例から学び、安全性、信頼性を一層向上させる対策に取り組んでいます。今回の監視機能追加は一例ですが、故障を無駄にすることはありません。原因をとことん分析し根本原因を取り除くことは勿論として、必要な冗長度を確保するなどの設計見直し、予備部品をデータセンターにストックし交換時間を短縮させる対応など、”改善できることはやり尽くす”をモットーに、日々KCPSの更なる品質改善に努めています。

カテゴリ
タグ

KDDI株式会社 プラットフォーム開発本部
プラットフォーム技術部

前原 剛

新着記事
タグ
アーカイブ
カテゴリー
Contact
TOP