検索:

CloudStackのアップグレード – その後

新しいCloudStack環境は安定して稼働しております。
というのは間違いないのですが….

ある日…Webサーバーがダウンするという障害が発生しました。
ロードバランサーの下にWebサーバーが複数台ある構成ですので
ホームページは閲覧可能な状況ですがこれは問題です。

ログを調べたところメモリが不足したためOSがWebサーバーを自動で
シャットダウンしたというメッセージがありました。
そこでメモリを増強し様子をみることにしましたが…翌日またダウンしました。
そこでWebサーバーのメモリ関連のパラメーターを調整しました。
すると…ダウンする頻度は格段に減りましたがまだダウンします。
メモリは十分のはずなのにおかしいです。
コマンドでメモリの状況をじっくり確認したところ…なんと
3GBしか認識していません。他のサーバーを確認したところ同じ状況です。
これはおかしいです。異常です。問題です。

OSのログを調査しても原因が特定出来ません。
これはもしかしてノードサーバーの問題?具体的には「KVM + QEMU」の設定に
問題があるのかと考えました。設定ファイルを見てもパラメーターが多すぎて
調べるのに時間がかかります。そこでGoogle先生…ではなく今は
ChatGPT先生の出番です。最初はBIOSのバグが疑わしいとか32bitOSは4GB以上
認識しないという回答でしたが、KVMとQEMUを管理するlibvirtdやQEMUの
設定について質問すると…色々と詳しく提案してくれます。
スゴイですが…解決しません。

ノードサーバーを疑い調べていたのですが…今どき「KVM + QEMU」の
設定でデフォルトでメモリが3GBになっているわけないと…
これはもしかしてCloudStackコントローラー?
そこでCloudStackのメモリ関連のパラメーターを調べてみると…ありました。
何やらノードサーバーを効率よく使うためのパラメーターが
デフォルトでONになっていました。それをOFFにしてからクラウドコントローラーを
再起動しすべての仮想サーバーを停止→起動することで…解決しました。

——————————————————————————————————————–
■ あとがき
——————————————————————————————————————–

まさかすべてのサーバーがメモリの上限3GBで稼働していたとは…驚きです。

今回はバグではなく設定が原因でした。

CloudStackの最新版は非常に安定しております。

プライベートクラウドの導入でお困りでしたらご相談ください。

Windows Serverのライセンス再認証

WindowsServer2022の検証作業と移行作業が無事完了しました。
が…OSは問題なかったのですが、諸事情によりどうしてもあるサーバーの
OSを再インストールしなければならないことになりました。
お客様へのサービスには影響無いためそれほど急いでする作業ではありません。

とあまり緊迫感なく作業していたのですが、OSを別のサーバーで再インストール
したために画面右下に「…Windowsのライセンス認証を行ってください。」という
表示が出ます。もちろんライセンスは購入済みですのでライセンス認証を
実施したのですが…ダメです。何度やってもダメです。
おそらくハードウェアを変更したのが原因と思われます。
ハードウェアと言っても弊社のプライベートクラウド上にある仮想マシンです。

まずはGoogle大先生に聞いてみます。色々と解決方法を試したのですが、
どれもダメでした。次にマイクロソフト社のホームページでライセンスについて
調べてみます…昔から思っているのですがライセンスが非常に複雑です。
これを考えた人以外で理解している人はいるのでしょうかと思うくらいです。
ライセンスについての説明文を読んでも複雑過ぎて理解不能…という
より読む気になれません。そのうちに不安になってきました。購入したのに使えない…

ライセンス購入元へ問い合わせてみます。が…日本だと問い合わせてしてから
2~3日…遅くて1週間以上回答が無い場合があるのであまり期待出来ません。
ということでマイクロソフト社へ電話で直接問い合わせることにしました。
ホームページで問い合わせ電話番号を調べます。そこに電話すると…
「電話によるサポートは終了しました…」ん?え?
ライセンス認証終了していないのですが…

再度Google大先生で…今度はライセンス認証の電話番号を調べてみます。
ありました。早速電話です。番号を選択するようにとのガイダンスが
流れますので該当する番号を押していきますが…何度やっても人間様に
出ません何度もかけ直し押す番号を変えても機械様しか出てくれません。
格闘すること1時間…ようやく人間様が出てくれました。

電話サポートによると…まずサーバー上でコマンドを打ち込む…
すると数十桁の番号が表示されます。それを電話のボタンで入力することで
ライセンスが認証されるとのことです。慎重に番号を押していきます。
ようやく再認証されました。格闘すること2日間…非常に疲れました。
精神的に…


■ あとがき

WindowsServerのアップデート完了と安心していたら…次はLinuxです。
RockyLinux9のサポート期限2032/05/31…ただいまこれを検証中です。

中国のパブリッククラウド

米中の対立が激しくなっております。
IT業界では中国のスマホアプリがインストールされた端末からデーターを
中国のサーバーへ送信されている…中国メーカーの通信機器に
侵入可能なバックドアが仕掛けられている…などのウワサがございます。
そこでふと思ったのですが、中国のパブリッククラウドは大丈夫?

弊社は今のところ中国のパブリッククラウドは使用しておりません。
理由は色々ございますがご想像におまかせします。
そこで検証することにしました。お客様向けのサービスで検証するわけには
いきませんので上海在住ねこ様のブログを構築することにしました。

パブリッククラウドの管理コンソールからドメイン取得→サーバー作成
→ICP申請し取得出来たら公開となります。

パブリッククラウドで、ねこ様のブログを公開するべくWebサーバーを
設定し数日後…ねこ様のサーバーから警告メールが送られて来ました。
サーバーにセキュリティーホールがあると…なるほど
中国のパブリッククラウドはお願いしなくても親切に外部からの
セキュリティーホールをチェックしてくれるサービスがあるのだと…
ですが、メールの内容をよく見ると
「問題あるのは/usr/local/xxx/xxx」ですと…ん?えっ?あれ?
まさか…デフォルトで情報漏洩機能がある…わけないと思いますが、
なぜそこにファイルがあるのがわかるの?弊社しかOSにログイン出来ない
ようにしているしOSのFirewall機能をちゃんと設定しているのに…

そこで中国のパブリッククラウドのサポートに問い合わせてみました。
すると回答は「OSに監視エージェントがインストールされています」
どこにファイルがインストールされているのか?それと削除方法について
さらに問い合わせてみました。すると回答は…
「管理コンソールから削除できます」という回答だけでした。
ということはパブリッククラウド事業者からでも削除出来るし…
私が想像していることは無いと思いますが…

今回は私が中国のパブリッククラウドの管理コンソールで
サーバーを作成する時に監視エージェントを使用するにチェックしたのが
原因ですので情報漏洩ではありませんでしが…ねこ様からは
私の設定ミスにより情報漏洩疑惑で騒いだのでとても怒られました。

中国のパブリッククラウドは規模が大きいですし実績も
サービスもたくさんあるのでいずれまた検証してみたいと思います。


■ あとがき

ねこ様には日本のチャオちゅーる1年分をお納めすることで
何とか許して頂くことになりました。

猶予無しの強制遮断

それは突然の…「指導」でありました。
弊社のホスティングサービスをご利用頂いているお客様からメールが
使えないとの連絡を受けました。その後、同様の問い合わせが多数ありました。
弊社のサーバーやネットワークには問題無いのは確認済です。
これはただ事ではない雰囲気です。その数分後に1通のメールが
通信会社Aから届きました。
「ICPを登録していないドメインがみつかったのでIPを遮断した」と…
「遮断します」という「事前連絡」ではなく「遮断した」との
「事後連絡」です。まったくの猶予無しです。ようするに「指導」です。

10月の会議終了後に規制が緩和されるかと予想しておりましたが、
逆に規制がさらに強化されております。今までであれば事前に通達があり
期限までに手続きをすれば良かったのですが、今回は猶予が有りませんでした。
そして…今後もこのように猶予なしで遮断というリスクは続くと予想されます。

弊社スタッフは直ぐに通信会社Aへ連絡しIPの遮断を一時的に解除するよう
依頼しました。これにより数日の猶予は与えられたのですが、
いつまた遮断されるかわかりません。対策として深夜に影響を受けたお客様の
メールボックスを通信会社Bのデーターセンターへ移行しました。
このような事態は予め予想しており弊社は異なる通信会社の
データーセンターを複数利用しておりいつでも移行出来る準備はしております。

スタッフが調査したところによると政府機関がネットワークを
スキャンするプログラムを開発し中国で利用されている
ドメインのICP取得の有無をチェックしているとのことです。
それが今回、通信会社Aで実行されたらしいとのことです。
らしい…というのがポイントで、例のスゴイ壁もそうですが、
事実を確かめる手段がありません。
ドメインは中国で取得したものはもちろん国外で取得し中国で
利用しているドメインもチェックの対象です。

今後、通信会社BやCでもスキャンが実施される可能性があります。
運が良ければ事前に通達があると思いますが、通達が無い可能性がございます。
その際、中国のパブリッククラウドやホスティングサービスを
利用されている場合、突然メールが利用出来なくなっても復旧までに
時間がかかる可能性があります。
中国のパブリッククラウドやホスティングサービス…
技術的には世界に通用するどころか越えているかもしれませんが、
顧客の立場になって迅速に対応して頂けるのでしょうか?

問題が起きてからでは遅いので、不安があればご相談ください。
ICPの取得サポート、メールサーバーの移転など対応致します。
技術的なことは日本人SEが対応致します。はい。私が…


■ あとがき

この忙しい年末にすることは無いと思います…と言いたいところですが、
中国の年末は2018年2月中旬ですので…まだ何かありそうな予感です。

5年に一度の規制強化

5年に一度の重要な会議が今週から中国で開催されます。
そのため例のスゴイ壁が強化されております。
中国でITインフラの仕事を始めて18年になりますが、
今回はかなり気合が入っております。
通常の強化ではなくスゴイ強化です。

この会議のための準備会議が先週から開催されているようで
弊社は今週から規制強化されると予想しておりましたが、
既に先週から規制が強化されております。

当然、規制しますという発表はございません。
もちろん通信会社へ問い合わせても…「問題ない」で
終了となりますので色々と想像しながら対策することになります。
下記は今回の規制強化による現象の一部です。

・ほぼ毎日特定の時間帯にパケットロスが酷くなる
・一部のサーバーへ外部からアクセス出来ない
・あるホスティング会社のメールサーバーへ接続出来ない

毎度のことですが、機器の設定を変更していない…
設定に問題が無い…というのに何故か問題があるという
不思議な現象に遭遇します。
どこかに規制強化のための最新機器が導入されたのでしょうか?
設定がスゴイ複雑なのかいい加減なのかわかりませんが、
パターンがよめません。困ります。本当に…

ということで先週からずーっと監視画面の前でいつ問題が発生するか
ドキドキしながら過ごしております。

問題発生→設定とログを調査→回避策を検討・検証→対策実施
という作業を繰り返しております。
精神的にキツイです。

中国のITインフラでお困りであればご相談ください。


■ あとがき

中国ビザの申請方法や規則などが変更なり就労ビザの更新に
3週間の予定が6週間かかりましたが、なんとか更新出来たので安心です。

中国ネットワークトラブルの不思議

しばらく日本におりましたが、今週始めに上海入りしました。
早速お客様オフィス引っ越し作業があるので現場に駆けつけます。
毎度のことですが、今回もトラブル発生率100%間違い無しの予感がします。

インターネット回線ですが、サーバーラックには光ケーブルが来ており
光終端装置に接続されております。そこからお客様のFirewallに接続…
ではなく謎の「黒い箱」に接続されております。なんだかイヤな予感です。

回線の契約は複数のグローバル固定IPアドレスですので
おそらくルーターではないかと予想されます。その下にお客様のFirewallが
接続という一般的な構成です。それにしても気になります「黒い箱」の
存在が…Firewallのような気もします。通信会社に「この黒い箱要りません。
弊社でルーター用意するので設定情報教えてください」と言ったら
もちろん…「ダメです」と即答されてしまいました。

交渉しても時間がかかりそうなので「黒い箱」の存在は気にせず
ネットワークの確認作業をすることにしました。
WAN側のIPアドレスが変わるだけですので、それほど難しい作業ではありません。
がしかし何かヘンです。

お客様のネットワークと弊社データセンターをVPNで接続しておりますが、
VPN通信の「一部」がたまに切れます。VPNセッションを強制的に再接続すると
たまに復旧することがあります。以前はADSL回線でしたがこのような
現象はありませんでした。しかも今回は光回線にしているので速度や
安定性は格段に向上しているはずです。

そしてもう1つの問題…DNSの名前解決がたまに「成功」する…です。
たまに「失敗」ではありません。様々な方法を試しましたが、お手上げです。
中国国内にあるDNSサーバーへ名前解決してもタイムアウトする場合があります。
例のスゴイ壁に新機能でも追加したのでしょうか?困ります。
やるならちゃんと検証し安定稼働を確認してから投入して頂きたいものです。

自社のオフィスに戻りサーバーやネットワークの設定を眺め試行錯誤すること
数時間…ネットワークの設定を微妙に変更したところ解決しました。

中国では「どこか」で規制しているかもしれないということを念頭に
ネットワークトラブルシューティングをしなければならず
非常に困難を極めます。設定は間違っていないのに思い通りにいかない時は
本当に困ります。技術力というよりアイデアやヒラメキが必要な気がします。

中国でネットワークトラブルでお困りでしたらご相談ください。


■ あとがき

今回初めて格安航空券に搭乗してみました。狭い。これが第一印象です。
前席の人がリクライニングしたら目の前にドンと壁出現という感じです。
しかも深夜発ですのでまともに睡眠がとれず翌日は仕事になりません。
ですが、安いです。

インターネット回線設備の更新

上海オフィスのインターネット接続に使用している光回線ですが、
ある日突然「設備の更新作業を実施します」との連絡がありました。

上海で光回線というと光回線ではなくLANケーブルが末端まで
敷設されるのが一般的でした。

ですが、ここ数年日本のように光回線が末端まで敷設されるように
なりました。家はすでにLANケーブルから光回線に変更済みでしたが、
その際、いつものようにトラブルに見舞われましたので
今回も当然期待…ではなく覚悟はしておりました。

切り替え作業を実施したところ…お約束の問題発生です。
グローバルIPアドレスを使用する契約なのに
ルーターのWAN側に設定されるIPアドレスが
プライベートIPアドレスになってます。
光回線からLANケーブルに変換する「光回線終端装置」ですが、
これにはルーターの機能もあり「ルーターモード」と
「ブリッジモード」があります。それが初期状態では
「ルーターモード」になっているようです。

後日、通信会社から作業員のお兄さんがやって来て
「光回線終端装置」の設定を変更してくれました。
切り替え後にインターネットへの接続も出来るので
問題無いと思ったのですが….やはりやってくれました。
ルーターのWAN側に既存のインターネット回線(LANケーブル)が
そのまま接続されており「光回線終端装置」から出ている
新しいLANケーブルがルーターのLAN側に接続されています。
実は既存のインターネット回線経由で接続されていたのです。
しかも「光回線終端装置」に無線LANの機能があるので
撤収する際お兄さんを呼び止めて「無線LAN無効にして」と
言ったのですが、「無効にしてある」と言って帰って行きましたが、
もちろんお約束で….有効になっておりました。

後で自分でルーターの配線変更と無線LAN機能の無効化を
しました。ん~お兄さんかなりいい加減です。
たぶん通信会社の社員ではなく出で立ちから見て
アルバイトみたいです。

インターネット回線の切り替えやLANのトラブルで
お困りでしたらご相談ください。


■ あとがき

家でしばらく子猫を預かることになりましたので
私が子猫を教育します…の前に既にメロメロです。
子猫に教育されそうです。

台湾で海底ケーブル故障

またです。台湾で海底ケーブル故障…弊社が起業してからだと
1回目が2006年12月28日,2回目が2009年08月12日です。
数年後毎に故障しています。
今回は2014年03月24日(月)中国時間04:30頃からです。
朝オフィスに着いてからシステムをチェックしていたところ
何だかヘンだと気が付きました。いつもであれば00:00に経路が
意図的に…たど思わますが変更される経路が
その日は04:30です。これは明らかにおかしいと思い
調査したところ…APCN2という海底ケーブルが故障とのことです。
台湾の通信会社のホームページでは復旧時間…
なんと…未定です。03/24~03/31とは書いておりますが、
03/31に復旧するのでしょうか?

下記のページの「ネット状況」に情報を書きましたので
ご参照ください。

https://www.evolutionnetworks.net/support/

色々な経路を調べたところ広範囲に影響がでているはずですが…
日本のホームページやニュースを調べても情報がありません。
不思議です。影響無いのでしょうか?もしかして弊社だけ?

今回も例のごとくヒイーヒイー言いながらインターネット経路を
調査しました。結果…ほぼ全滅→終了。
というわけにはいきませんが今回はかなりヒドイです。
一部では遅延が300msオーバーとかパケットロスが
50%オーバーとかです。でも必ず良い経路があるはず…
イヤみつけなければなりません。

色々な回線からの経路を調査しました。そこで便利なのが
プライベートクラウドです。数分でサーバーを作成できます。
そこに仮想ルーターを起動させて色々と調査します。
とても便利です。プライベートクラウド最高!そして深夜に
ようやく解決策がみつかりました。なんとか影響を
緩和させました。先週からず~っとネットの監視画面と
にらめっこしてます。

回避策は色々ありますのでお困りでしたらお問い合わせください。
私がヒイーヒイー言いながら調査し改善策をご提案いたします。


■ あとがき

そろそろF1上海グランプリです。ワクワクです。

遮断されたらどうします?

中国のブログに書いてありました。「中国にはインターネットはない」
とのことです。でも「イントラネット」はあるとのことです。
中国でインターネットへ接続するということは国家のIT部門により
構築・運用されているインターネットに接続されたネットワークを
使わせていただいているということでしょうか?
そう考えれば管理者がいけないと判断したホームページを遮断する
というのも理解出来ないわけでもない…と一瞬考えてしまいます。

弊社スタッフから聞いた話です。友人の知り合いの日系ソフト開発会社での
話しです。ある日データセンターにあるサーバーが消えたとのことです。
ネットワーク的ではなく物理的に…何と「没収された」とのことです。
誰に?…って決まっています。

セキュリティーや安定稼働を考えデータセンターに預けるという考えは
この国では通用しないということです。
「自分のことは自分で守れ」←これ基本のようです。

中国に進出されている日系の通信会社様や大手SI会社様はICTやクラウド、
データセンターというキーワードで宣伝されております。
質問してみたいです。「機器が没収されたられたらどうするの?」と…
おそらく無視されます。弊社の場合は2~3時間で復旧するように
対策しております…という感じです。

G社が中国政府に喧嘩売っていますが、そろそろG社のサービスが遮断される
のでしょうか。弊社はスケジュール共有で使用しているので遮断されたら
困ります。でも遮断されてもイヤだから何とかします。

問題が発生した時や交渉の場面にて中国ではよくあることですが、
相手が「はいそうです」と言ったのに3秒後は「違います」とか「Aです」と
相手が言ったので「Aですね」と確認したら「いいえBです」というように
イスから転げ落ちそうになることがあります。おそらく言語の違による
表現方法の違いや勘違いだと思います。よく話しをすれば
解決出来るはずです…イヤしなければなりません。

リーマンショック以降、世界的に不況と言われておりますが、
中国は別で不景気って何?ってな感じです。世界的にも注目されている
中国…世界の工場ではなく販売先として中国へ進出または既に
ビジネスされている企業様が多いかと思います。その際、日本との接続は
国際専用線やIP-VPNで日中間を接続することを検討または既に
接続されていると思いますが、通信会社のルーターに接続されている
ケーブルを「ハサミで切られたら」終わりです。それよりは
インターネットVPNのほうが「切れずらい」です。これは台湾沖地震の時にも
経験しております。でも普通にインターネットVPNで接続しても
遅かったり問題が発生する可能性が大ですのでインターネットVPNを
ご検討であれば弊社までご相談ください。

https://www.evolutionnetworks.net/service/vpn.html

中国から海外へのインターネットは遅いという話を聞きますが、
そんなことはないと思います。太い回線があると思います。
スペシャルな設定をすれば速いです。
ちなみ現在、弊社の日中間ネットワークでは3~10Mbpsでてます。


■ あとがき

Twitter初めました。「中国から使えないんじゃないの?」
というツッコミはしないでください。

台湾沖海底ケーブルの故障

8月12日(水)の午前から台湾沖にある複数の海底ケーブルの故障により、
日中間のインターネットに遅延とパケットロスが発生しておりました。

弊社が異変に気が付いたのは8/12の午前です。日本のあるISPへの経路が
なぜか米国経由になってしまったり、異常な遅延が発生していたり完全に
撃沈されております。当初は10月の中国国慶節に向けての規制強化と
思いこんで調査しておりました。8/12の夜になり回復するどころか
さらに悪化しております。

弊社のネットワークも日中間のネットワークは撃沈された状態です。
遅延400ms以上、パケットロス40%…最悪です。こんなのイヤです。
ということで…良い経路を探すことにしました。なかなかありません。

深夜…みつけちゃいました。このような障害を想定し日本側の
データーセンターにはルータを用意してあります。
上海からリモートでルータの設定を変更しISPとセッションをはり
祝開通です。後は経路を…気合で調整して完了。

日本のキャリア様のホームページにある障害情報をチェックしたところ
今回の海底ケーブルの故障で一部の国際IP-VPNが使えなくなったようです。
復旧に要した時間が数時間から数日間のようです。
弊社でこのように長時間の障害が発生したら大変です。
私がイジメられます…お客様に…ではなく女性スタッフに(-_-;
泣きそうな顔しながら必死にキーボートをカチカチ打っている自分の
姿が想像されます。

結論…アジアでは国際IP-VPNなどの専用線サービスより
インターネットVPNのほうが切れないです。台湾沖の海底ケーブルの
故障は数年に1度のペースで発生しますので国際IP-VPNを使用されている
企業様はインターネットVPNでバックアップ経路を準備しては
いかがでしょうか?ということで弊社までご相談ください。

https://www.evolutionnetworks.net/service/vpn.html


■ あとがき

現在は一部の経路で以前より速度が向上しています。
倍くらい…しあわせです。というか…速すぎです。
中国国慶節の前ですので例のごとく規制強化でインターネット速度が
急減速するのでしょうか…