vSAN 6.6.1 がリリースされました。

CJです。

先日、ESXi 6.5 Update 1 のリリースに合わせて、vSAN6.6.1 がリリースされました。

新機能としては、以下の3点が挙げられます。

  1. VMware Update Manager (VUM) に vSANが統合されました。 #VUMを通して通常の vSphere 環境と同じく vSANのバージョンアップなどを行うことができるようになりました。
  2. パフォーマンス診断ができるようになりました。
  3. vSANディスク上のLEDロケーターサポート向上 (HPE Gen-9 Controller : pass-through mode)

 

せっかくなので、以下 vSAN6.2 ~ 6.6.1 までの追加された新機能の一覧表を共有します。

vSAN の成長と伴う新機能の追加が今後も楽しみです。

 

[参考情報]

http://pubs.vmware.com/Release_Notes/jp/vsan/62/vmware-virtual-san-62-release-notes.html

http://pubs.vmware.com/Release_Notes/jp/vsan/65/vmware-virtual-san-65-release-notes.html

http://pubs.vmware.com/Release_Notes/jp/vsan/66/vmware-virtual-san-66-release-notes.html

https://docs.vmware.com/en/VMware-vSphere/6.5/rn/vmware-vsan-661-release-notes.html

vSAN ディスク故障時、適切なディスク交換手順とは?

CJです。

前回は、vSAN環境でディスク故障時に仮想マシンが受ける影響について共有しました。

今回は、その延長でディスク交換の適切なオペレーション方法を共有したいと思います。

 

まず、前提となる構成は以下の通りです。

前提構成 & 故障シナリオ

vSAN:6.2 All-flash

ホスト : 6台

DiskGroup: 1Group/ホスト

※安定の2重故障まで対応可能な RAID-6相当の構成です。(FTT=2, RAID-5/6 Erasure Coding)

故障シナリオ:キャパシティディスク1本が故障

 

適切なオペレーションの流れ

以下、ディスク故障から復旧まで、全体的な流れとなります。

詳細

ディスク故障発生

ディスク故障が発生した場合、以下のようにディスクが Absent 状態になります。

ESXi : メンテナンスモード

実はホストをメンテナンスモードにせずに、この後のディスクグループの削除なども行えるケースもありますが、ディスク故障時においてはまずホストをメンテナンスモードに変更することを強くお勧めします。

Virtual SAN データの移行オプションとしては、RAID-6相当の構成であること、別の空きディスクグループ (ストレージポリシーを守れる予備領域)が存在しないため、ここでは “データの移行なし” を選択しています。

故障ディスクが入っているホストがメンテナンスモードに変更されたら、次へ

GUI:対象 DiskGroup 削除

vSAN All-flash構成においては、キャッシュ または キャパシティどちらのディスクでも1本故障した場合は、そのディスクグループが使えなくなります。(vSAN 容量が減ります。)

この場合は、DiskGroupの再作成で復旧することが可能です。

参考:こちらの削除をCUIで行う場合は、以下のコマンドを活用してください。

esxcli vsan storage remove -u [DISKGROUPのUUID] –evacuation-mode=noAction

物理:DISK交換

ホストがメンテナンスモードに移っており、ディスクグループが削除されていれば vSAN上でのディスク交換準備は完了です。この後に、物理ディスクを交換してください。

環境に合わせて、RAID-0の設定が必要な場合は忘れずに設定してください。

GUI:対象 DiskGroup 作成

ディスク交換が完了したら、ディスクグループを再作成します。

その前に、All-flash構成のため、忘れず交換したディスクにフラッシュマークをつけましょう。

続いて、DiskGroup を再作成してください。

これでDISK故障から復旧となります。

確認

vSANはディスクグループが復旧したら、バックグラウンドで自動的に最同期が走ります。

Tip>

vSphere Web Client 上で、最同期が進んでいることが確認できますが、こちらの表示がうまく表示されない場合は、下記のRVC (黒い画面)画面での確認を試してみてください。

 

まとめ

一通り流れをみてみましたが、いかがでしょうか。

ディスクグループの削除などはオンラインでできるケースもあるため、実際ディスク故障時には間違ったオペレーションにより、vSANの想定外動作につながるケースもあると思います。

そのため、本記事を参考に少しでも適切な運用手順において、本記事が役に立てればと思います。

Tip>

より、安定した vSAN環境の運用を行いたい場合は、”2DISKGROUP/ホスト” をお勧めします。

 

[参考情報]

https://docs.vmware.com/en/VMware-vSphere/6.0/com.vmware.vsphere.virtualsan.doc/GUID-9A2DCE0B-CFA1-41C1-97CE-DA56A55426EA.html

vSAN ディスク故障時の仮想マシンの操作はどうなる?

CJです。

vSAN 環境において仮想マシンのデーターは ErasureCoding 機能により、RAID6相当の2重障害まで保護が可能です。 ところで、実際 DISK障害などが発生した際に、RAID6相当範囲内であれば仮想マシンはまったく何の影響もなく、使えるんでしょうか?

結論から伝えると、仮想マシンのデーターは保護されている状態ですが、一部の操作については影響を受けることとなります。

以下、実際仮想マシンが障害時 (DISK障害想定) に受ける影響の一覧表です。

#環境情報:ホスト6台のRAID6相当の構成、1DISKGROUP/ホスト。

こちらの表を少し補足すると、

RAID6相当の環境 (2重障害まで許容)で、稼動中の仮想マシンが1台、停止状態の仮想マシンが1台があり、この環境でキャパシティ用のDISK 1本が故障した際の動作を確認したものとなります。

スナップショット

スナップショットは作成も、復元も使えなくなります。取得してあったスナップショット削除することは可能です。

移行

同一 vsanDatastore でのホスト移行 (vMotion) は可能ですが、クラスタを跨いだ移行は基本できなくなります。

クローン作成

クローン作成もスナップショットも同じく使えなくなります。

設定の編集

当然といえば、当然ですが、仮想ディスクのサイズ変更はできなくなります。

#仮想マシンのネットワークアダプタ変更などは可能です。

なぜ、このように操作ができなくなるの?

これは vSANの構成による仕様のようです。

vSANは DISKが故障した際にリペアを試みる動きを行いますが、上記構成では代替となる空き領域がなくてリペアが完了できない状態です。 また、上記の操作を行うには vSAN内部で Component を作成する形となりますが、物理環境上 RAID6相当を満たせない状態のためです。

DISK障害時にも、上記の操作ができるようにするには?

お勧めはやはり、ホストごとに2つのDISKGROUPを持つことです。

そうすると DISK故障時に vSANが自動的にリペアを試みて空き領域(同一ホスト内の別DISKGROUP or 別ホストのDISKGROUP)があれば、障害状況が復旧となり、スナップショット・クローン作成などの操作もできるようになります。

※他の障害 or 構成によっては別の方法での対応が必要な場合もあります。

 

以上、vSANの動きを知り、日常の運用において少しでも役に立てればと思います。

 

[参考情報]

https://docs.vmware.com/en/VMware-vSphere/6.0/com.vmware.vsphere.virtualsan.doc/GUID-9A2DCE0B-CFA1-41C1-97CE-DA56A55426EA.html