CloudStackのアップグレード – 環境構築 ストレージ編
CloudStack環境を構築するには「ストレージサーバー」「ノードサーバー」
「クラウドコントローラー」が必要です。今回はストレージサーバーです。
ストレージサーバーのハードウェアは2台1組として構成します。
もちろんストレージはRAID構成です。弊社で使用しているOSはRockyLinuxでそこでNFSサーバーを
稼働させます。RAID以外にも冗長化のため複数サーバのストレージをリアルタイムに
複製するオープンソースのDRBDをインストールします。クラスターを構築するために
オープンソースのPacemakerとCorosyncもインストールします。これで通常は2台のサーバーが
ストレージサーバーとして稼働し1台故障した場合、データーやIPアドレスが故障していない
サーバーへ引き継がれ稼働し続けます。
滅多にハードウェアが故障して切り替わるということは無いと思いますが、実際に故障した場合
どうなるかと申しますとこのストレージサーバーを使用しクラウド上で起動している仮想サーバーは
ほぼ停止します。だたしデーターは消えていないので起動しなおせば復旧します。
このようにストレージサーバーが故障すると仮想サーバーが停止するなどの影響がありますが、
障害は絶対発生しないということはありませんのでデーターが消えないことと早く復旧させる事が
重要と考えております。
突然サーバーの電源が落ちた場合、運用良く問題無い事がありますが、大抵2台のサーバー間で
データー不整合が発生する場合があります。そのような時、ログを調査し原因を特定してコマンドを
打ち込んで復旧させるのですが、これが非常に難しく何度も障害を経験していないと慌ててしまい
復旧に時間がかかります最悪は復旧しないということにもなりかねません。
弊社は20年以上もこの構成を使用しておりますので様々な障害にも対応してきました。
ミッションクリティカルなシステムにはストレージ専用のサーバーを導入し保守をメーカーや
代理店にお願いすると思います。高価なだけあって1台くらいの故障では何の影響も無い
構成になっていると思います。
中小規模のシステムであれば中途半端にストレージ専用のサーバーを導入するとシステムが
ブラックボックスになって自社では対応することが出来ず。障害発生時、保守担当者が来るのを
待つということになります。さらにサーバー設置場所がデータセンターであれば入館手続きに
手間取って復旧が遅れるという最悪の自体にもなりかねません。
弊社では日本以外に中国でもCloudStackを導入しているので
ハードウェアの故障以外、自社で対応出来るように基本的にオープンソースを使用しております。
次回は「クラウドコントローラー」についてです。
■ あとがき
サーバーの中でもデーターを格納しているストレージサーバーの故障が
一番怖いです。障害時はOSではなく私がハングアップしてしまうこと間違いないです。