新・闘わないプログラマ No.157

トラブル報告書


先日の貴社システムの障害についてご報告させていだだきます。

あ〜あ、なんで私がこんなこと書かにゃならんのだよ〜。めんどくせ〜な〜。

■障害の経緯
23:00 タイマーにより、当該システムを停止。バッチ処理を開始。
01:20 バッチ処理終了。データベースのバックアップ処理開始。バックアップ処理完了後、当該システムが自動起動されるようになっている。
06:00 運用監視システムより、当該システムが起動されていない旨の警告がされる。バックアップ処理が完了していない。
07:20 当システム担当者が出勤。データベースのバックアップ処理を中断して、システムを起動しようと試みるが、起動できない。
08:40 データベースサーバと他のサーバ・クライアント間のネットワークに障害があることが判明。その間の通信のスループットが極端に悪い。
10:20 データベースサーバを接続しているスイッチングハブを交換。ネットワーク障害は解決。
10:35 当該システムが復旧。

朝っぱらから電話でたたき起こされてさあ、あわてて出社したんだけどさあ。分からんって〜の、このシステム。だいたい、今までの担当者が異動になったから、こっちにその「担当者」の役がまわってきただけで、全然、中身知らんかったもんなあ。
だいたいさあ、営業は「急いでいるんだから、タクシーで来い」なんて言っていたけど、平日のこんな時間にタクシーに乗ったら、渋滞に巻き込まれて電車より時間がかかる、ってばさ〜。

■今後の対応
(1) スイッチングハブを、信頼性の高い製品に交換することを検討。

だいたい、1万円もしないような安物のスイッチングハブなんか使ったのは、どこのどいつだよ。あのテの製品って、つけっぱなしにしていると、発熱で暴走したりすることもあるもんなあ。ほとんど家庭用だろ、あの類は。
って思って、以前の担当者に聞いて見たら、客が見積書を見ながら「なんだ、この高いスイッチングハブは。そんなもん、数千円も出せば買えるだろ」と、初心者向けのパソコン雑誌を引っ張り出してきて言ったらしいしなあ。
他にも、「ルータなんて、古くなっていらなくなったパソコンに『りなっくす』とかいうものを入れれば、それで代用できるそうじゃないか」とも言ったらしい。それだけはなんとか阻止したらしいけど、変に中途半端な知識があるってのも困り者だよなあ。
そんなに重要な基幹システムだ、ってのなら、変なところでカネをケチらない方がいいと思うんだけどなあ。だいたいさあ、客の方も、最近はいろいろ知識を蓄えてきた、と言えば聞こえがいいけど、家でパソコンを使うのと、基幹システムを組むのと、一緒にして欲しくないんだけど。

(2) ネットワーク機器の常時監視

なんで今までやってなかったんだろ? と思って、これも前の担当者に聞いたら、営業から開発費の削減を言われて、止めたんだそうで…とほほ。せいぜい1人月くらいで出来る話なのになあ。

(3) 障害機器の交換の迅速化。保守契約・バックアップ機器の導入の検討

やっぱり経費削減で、保守契約も結んでいなければ…って、数千円のスイッチングハブでも保守契約は結べるのかしらん…ネットワークのバックアップも考えていないんじゃあ、ねえ。
あの会社、そんなに儲かっていないとは思えんのだけどなあ。なんでそんなに経費削減ばかり言うんだろうなあ。そのわりに、障害が起こると「これはウチの基幹システムなんだから、云々」だもんなあ。だったらもうちょっとお金を出した方がいいと思うんだけど…。

■まとめ
今後、このような障害が発生することのないように、上記の対応をとらせていただきたく 、詳細につきましては追ってご提案させていただきたいと存じます。
最後に、今回の障害で、貴社に多大なご迷惑をおかけしたことを、深くお詫び申しあげます。

だからさあ、カネをケチるとこうなるんだってば。ハードウェアは壊れるのを前提に考えないといけないんだけど。最初は、データベースのバックアップすらいらない、と言ったらしいし。
基幹システムで、1分1秒たりとも止まったら困る、ってのなら、それなりにカネをかけてもらわんとなあ。
ぶつぶつぶつぶつぶつぶつぶつぶつ…。

このお話はフィクションです。フィクションったらフィクションです、ってば。

[前へ] [次へ]

[Home] [戻る]


mailto:lepton@amy.hi-ho.ne.jp