第9回：クラウドの障害対策と可用性設計の基本

2025年6月29日2025年7月9日

Cloud

ページ内に広告が含まれる場合がございます。

「クラウドだから障害がない」は大きな誤解です。

むしろクラウドにおいても「どこで・何が・どれだけ止まるか」を想定し、あらかじめ備える設計（可用性設計）が重要です。

本記事では、AWS・GCP・Azureにおける障害対策と可用性設計の基本的な考え方、よくあるパターン、設計時のポイントを解説します。

クラウドでも障害は起こる

階層	AWS	GCP	Azure
ゾーン	Availability Zone	Zone	Availability Zone
リージョン	Region	Region	Region
グローバル	Globalサービス（S3, IAM）	Global Load Balancer	Global Load Balancerなど

基本方針

典型的構成例（AWSベース）

項目	AWS	GCP	Azure
VM自動復旧	Auto Recovery（EC2）	Self-healing VM	VM自動再デプロイ（可用性セット）
ゾーン分散	Auto Scaling Group with Multi-AZ	Instance Group with Zones	Availability Set / Availability Zone
ロードバランサ	ALB / NLB	Cloud Load Balancing	Azure Load Balancer / Application Gateway
データベース可用性	RDS Multi-AZ / Aurora Cluster	Cloud SQL High Availability	Azure SQL Geo-replication

自動フェイルオーバーの設計ポイント

定期的なフェイルオーバーテストも必須

保護対象	対策	備考
スナップショット	EBS Snapshot / GCP Disk Snapshot / Azure Backup	バックアップはAZ間・リージョン間に分ける
オブジェクトストレージ	S3 versioning / GCS Object Versioning / Azure Blob Soft Delete	意図しない削除対策として有効
バックアップの多重化	リージョンまたぎのコピー	Vault、LifeCycle設定で自動化可能

DRとは？

障害発生時に、別リージョンやオンプレミスに切り替えて業務を継続する仕組み

DRタイプ	概要	コスト	復旧時間
ホットDR	常時同期・常時稼働	高	数分以内
ウォームDR	定期同期・起動は手動	中	数十分〜
コールドDR	バックアップだけ保持	低	数時間〜数日

クラウドは高可用性を支援する仕組みが豊富ですが、自動で可用になるわけではありません。

障害を前提に「構成の冗長化、フェイルオーバー、復旧手順」をあらかじめ設計することが、信頼性の高いシステムの鍵です。

次回は、「マルチクラウド・ハイブリッドクラウド設計の基本」をテーマに、各クラウドを併用するパターンと注意点を解説します。