Nutanixのバックアップソリューションについて
クララでは定期的にNutanixのアップデート情報などをキャッチアップする仕組みとして、「Nutanix Enterprise Cloud クラウド発想のITインフラ技術」の著者の一人でもあるNutanixのシステムエンジニア、中根大祐氏にWebinar形式のエンジニア向け勉強会を実施いただいております。
今回はその定期勉強会の中から、評判が高かった「Nutanixのバックアップソリューション」について詳細を本ブログにまとめさせていただきます!
BCPの観点で見直されるバックアップの価値
昨今、コロナ禍の状況で改めて自社のBCP対策について検討しなおすという企業が増えているのではないでしょうか。
コロナ以前は災害対策としての「BCP対策(事業継続性計画:Business Continuity Plan)」が一般的でしたが、アフターコロナの世界では以前に計画したBCP対策が本当に機能するのかという点について、もう一度考え直す必要があると考えております。
例えば、地理的な冗長性を確保する為に遠隔地バックアップを取得し、いざとなればバックアップ先で、バックアップデータを展開し業務を進められるDRサイトとしておくといった対策は、災害時の交通規制や計画停電への対策としてだけではなく、ロックダウン中のデータセンターへの入館規制のような状況にも必要になってくるのではでしょうか。
考えればキリがありませんが、コロナと言う未曽有の災害がもたらした影響はビジネスの事業継続性や情報システムのこれまでのあり方を見直すきっかけとするには充分に大きな影響をこの社会に与えたと思います。
また最近では、「SaaSの障害で業務が一切止まった」という話もありました。クラウドだからオンプレだからではなく、常にBCPの観点でバックアップを考える必要があると感じております。
データ冗長性の高いNutanixでバックアップを利用する理由について
データ冗長性の高いNutanixでバックアップを利用する理由は何なのでしょうか?それを知るために、ここではまずNutanixのデータの冗長性についておさらいしましょう。
■クラスタ(複数ノード)による分散処理
>データ多重度= Replication Factor(RF)
- RF2(2重化)、RF3(3重化)が選択可能
- ローカル+リモートノード(分散)で多重化
>ディスク&ノード障害に対応する保護
■冗長性の回復 = データの再多重化
>回復(リビルド)が早いのはなぜ?
- 空き領域を利用するためHW交換を待つ必要がない
- (パリティ計算を伴わない)単純な複製であるため
- リビルド対象データのRead/Writeを、クラスター全体で分散・並列して行うため
非常に優秀なアーキテクチャではあるのですが、Nutanixのデータ冗長化はハードウェア(ノード)障害発生時の「稼働継続」が主な目的であり、以下のような障害では業務影響を少なくすることが出来ません。
【様々な障害シナリオの例】
- アプリケーションレベル・OSファイルシステムレベルの障害
- 人為的なオペレーションミスに対するデータ保護
- ネットワーク・データセンター全体、地域全体の障害発生時に置ける稼働継続
1. や2. のような障害シナリオを想定した場合は、障害が起こる前の時点のデータを特定し、その時点のデータまでOSイメージ単位もしくはファイル単位でリストアするのが、効果的な対処と言えるでしょう。そうなった場合は、やはり定期的な時刻同期によるイメージバックアップの取得が有効となります。
3.のような大規模災害時を想定した場合は、本番環境とは別の筐体・別のファシリティでのバックアップ取得が有効となります。その際に当該システムが要求するRTO(目標復旧時間)に合わせて、バックアップからリストアして本番環境で動作させる構成、又はバックアップサイトで当該システムによるサービス提供を行える構成(DR)を検討する必要があります。
上記のように、システム運用中の様々なトラブルに対応できる耐障害性の高いシステム設計を行う上では、データ保護性の高いアーキテクチャを採用するNutanixだとしてもバックアップの取得は必須と言えます。
Nutanixのバックアップソリューション概要
Nutanixの機能を利用したバックアップ機能は大きく以下の二つに大別されます。
1) Nutanixのレプリケーション機能
仮想マシン単位で取得するNutanix純正のレプリケーション機能です。
[主な特徴]
- Prismによる管理
- ローカルor別クラスターにバックアップ取得
- 非同期、準同期、同期の3段階
- データ保管先でのリカバリー
いずれもバックアップデータ取得先のNutanixクラスタがある事が前提のサービスとなるため、Nutanixクラスタをバックアップ取得先としてお持ちでない方は3rd partyのバックアップ製品をご利用ください。(もちろん、Clara Cloudでも可)
2) 3rd partyのバックアップ製品
ハイパーバイザーに準じます。vSphereやHyper-VについてはNutanixクラスタだからと言って特別な対応は必要ありません。クラスタのハイパーバイザーがAHVの場合はveeamとHYCUがサポートしています。今後、他社も追随してくる予定のようです。
Nutanixと3rd partyバックアップベンダーの協業によるバックアップアプライアンス「Nutanix Mine」も気になるところですが、ページの関係で今回は割愛します。
Nutanixのレプリケーション機能
Nutanixのレプリケーション機能について、もう少し見てみましょう。
■データ保存先の選択肢
バックアップの取得先としては、3つの選択肢があります。
- 本番とは別のNutanixクラスタ(Nutanix Cluster)
- 本番とは別のNutanixクラスタの特定のノード(Single Node Replication Target)
- Nutanixのクラウドサービス「Xi」
複数を組み合わせて利用する事が可能なため、該当する仮想マシンや各システムの保護要件に合わせて選択する事が可能です。
■レプリケーションの種類
- 非同期レプリケーション(Async)
- 準同期レプリケーション(NearSync)
- 同期レプリケーション(ZeroSync)
- Leap
- Nutanix Xi Leap
1. 非同期レプリケーション(Async)
RPO(最短同期間隔)60分のレプリケーションとなります。Nutanixクラスタで利用できる全てのハイパーバイザーに対応しており、PrismからGUIで簡単にスケジュールや保存世代数(世代数に制限はありません)などのポリシーを設定出来ます。
RTOは最短で数分です(ネットワークの構成や品質などには依存します)。
また、リモートスナップショットは初回のバックアップ取得時に仮想マシンイメージ全てをレプリケーションしますが、2回目以降は差分のみのレプリケーションとなります。
[特徴]
- 仮想マシン単位・ファイル単位のリストアに対応
- アプリケーション整合性の担保が可能
- リモート転送は圧縮&帯域制御も可能
- 他拠点間レプリケーションに対応(Ultimate Edition)
- 異種ハイパーバイザー間レプリケーション対応
リモート転送時の帯域制御は遠隔バックアップ取得時にトラフィックを圧迫してしまうという事が内容にあらかじめ上限の設定が可能です。異種ハイパーバイザー間レプリケーション対応は様々なお客様のNutanixクラスタを取り扱う当社のような会社にとっては神機能です。
2. 準同期レプリケーション(NearSync)
Ultimate Editionで利用できるRPO(最短同期間隔)1分のレプリケーションとなります。ハイパーバイザーはAHVとvSphereに対応しており、こちらもPrismからの操作でスケジュールや保存世代数などのポリシーを設定出来ます。ライトウェイトスナップショットと呼ばれるマーカーを使用したOpLogベースのデータ取得方法で、非同期レプリケーションのvDiskベースのスナップショットとは異なります。
[特徴]
拠点間のレイテンシーや距離による制約なく利用可能
3. 同期レプリケーション(ZeroSync)
RPOゼロの完全同期型のレプリケーションとなります。クラスター間のRTT(Round Trip Time)が5msec以下の別のクラスターに対し、リアルタイムのデータ同期を実現します。常に同期されている為、世代の概念が無くアプリケーションレベルの障害には対応不可となります。ハイパーバイザーはvShpereとHyper-Vの対応となっており、AHVには対応しておりません。また、応用のソリューションとして、vShpereではサイト間を跨ぐHAクラスター化のMetro Availabilityと呼ばれる機能が実装されています。
こちらもUltimate Edition限定の機能となっております。
[特徴]
大規模災害があっても、データの損失を許容できないシステムに置けるサイト単位の障害対策に有効。
4. Leap
Leapは前項まででご紹介したレプリケーションにDR向け機能を追加したソリューションです。
これまでのものとの違い、Runbookと呼ばれる自動化機能を搭載しており、有事の際に予め登録した”リカバリプラン”を基に数クリックでサイトの切替が可能となります。
【主な機能】
- VM起動順序制御
- ネットワークマッピング設定
- サイト切り替え/切り戻し試験機能(試験用VLANによる隔離)
- Prism Centralによる運用管理
LeapもUltimate Editionでないと利用できない機能となりますのでご注意ください。
5. Xi Leap
Nutanixが提供するLeapのリモートサイト(Availability Zone : AZ)として使用できる、Disaster Recovery as a Service(DRaaS) です。リカバリーサイトの機器やセキュリティの管理はNutanixで実施している為、リカバリーサイトの運用をしなくてもDR構成を実現できる機能となっております。日本には大阪にサイトを開設しており、現在EAとなっておりますが近日にGAにて提供される予定との事でした。
[特徴]
- リカバリーサイトの管理はNutanixが実施
- リソース量とSLAを組み合わせた課金
- Ultimate Edition は不要
- オンプレミスサイトと接続するVPN機能もサービスとして提供
- VPN機器の持ち込みも可
Nutanixのバックアップ&DRまとめ
- データの冗長性だけでは特定の障害シナリオにしか対応できない為、多くの場合データの保護要件を満たすにはバックアップの取得が必要
- Nutanixのバックアップは純正のレプリケーション機能と3rd partyの2種類に大別される
- 純正のレプリケーション機能は非同期、準同期、同期の3種類があり、保護要件のRPOに準じて選択が可能
- 準同期と同期は共にUltimate Editionにて利用可能
- サードパーティバックアップを利用する際の要件はクラスタのハイパーバイザーに依存する
- 復旧作業を効率化する為の機能が付帯している(Leap及びXi Leap)
いかがでしたでしょうか。
こちらのブログを閲覧されているという事は既にNutanixをご利用の方が多いのではないかと思います。
そこで、少しだけ宣伝をさせて頂くと当社のClara CloudはNutanixを初期費用ゼロのサブスクリプション型で提供するサービスです。
Nutanixを購入して利用しているがバックアップ先のNutanixクラスタまではご用意されていない方に御社占有のNutanixクラスタを月額定額でご利用いただく事が可能です!また、北海道リージョンもございますので遠隔バックアップサイトとしても検討いただければ幸いです。
ご質問などあれば当社のWebフォームまでお気軽にご連絡ください。