新・闘わないプログラマ No.37

トラブル人間模様


この業界の仕事としては、パッケージソフトを作って不特定多数に売る、というのと、注文に応じてシステムを構築する、の二通りがあります(もちろん、それ以外にも、その中間的なやつとか、その他さまざまな形態もありますが)。
私などがやっているのは、基本的に後者です。顧客(法人やその他の団体)からの注文に応じて「なんちゃらオンラインシステム」やら「かんたら情報システム」やら、といったシステムを構築するわけですが、この場合、顧客側にあるコンピュータや通信機器で稼動させることは希で、こちら側で運用も面倒を見ることがほとんどです。
私自身は、運用そのものには携わったことはありませんが、何かトラブルが発生すると、原因究明に狩り出されることも多かったりします。

私が入社したころは、ホストコンピュータをコンピュータセンターに置き、支社・支店・営業所といったところに端末を置いた、いわゆる「ホスト・端末型」システムが花盛りでした。端末はダム(dumb)端末と呼ばれる、それ自体ではプログラムを実行することが出来ない、端末です。
余談になりますが、最近よく金融機関なんかが「WindowsNTを使って業務システムを再構築」なんて言っていますが、あれってほとんどが、今までの端末をWindowsNTを載せたパソコンに置き換える、というだけの話です。パソコン側では、ホストコンピュータと通信するための端末エミュレータ(ダム端末に見せかけるためのソフト)を動かして(Microsoft SNA Serverを使うのだって、これと大差無い)いるだけだったりします。これが、Microsoftの手にかかると「WindowsNTを使って業務システムを再構築!」になったりするわけですね。そりゃあ、まぁ、システム全体のOSの稼動本数はWindowsNTが一番多くなるのは確かですけどね。MicrosoftのSQL ServerとTransaction ServerとVisual Basicあたりだけを使って勘定系システムを構築した銀行とかあれば・・・・私は、そんなところにお金を預けたくないです :-p 知らないうちに残高が減っていたり。

すみません、余談が長くなってしまいました。
数千台もの端末が接続されているシステムでトラブルが起きると、運用センターは大騒ぎになります。端末を使っているユーザーは殺気立っていますから、怒鳴り声の電話がじゃんじゃんかかってきます。中には、有らん限りの罵詈雑言を並べ立てる人間もいるようです。
ある日、運用センターに、そういう電話がかかってきました。その人物は怒り狂っているようで、何を言ってもこちらの話など聞かない状態です。その時は、システムの稼動状況を調べてみても特に問題は無いし、そのユーザーの使っている端末もホストコンピュータと正常に接続されている状態で、特におかしな所も見受けられません(ただ、その怒り狂っている人間から、問題のある端末番号を聞き出すのに苦労したようですが(^^;))。どうやらディスプレイに問題があるらしい、とあたりをつけて、調べてもらおうとしたのですが、件の人物は延々怒鳴りまくるだけでお手上げの状態です。なんとかなだめすかして、他の人に電話を替ってもらい、あれこれ調べてみると、ディスプレイの「明るさ」が最小になっていただけ、でした。どうやら、そいつ、自分でそうしたらしいのです。でも、原因が判った後も「画面が見えなくなるまで明るさを調節できるのがおかしい」とか、さんざんごねていたそうですが・・・・。
こういうことに付き合わなければいけない運用センターの人間は大変です。「俺は客だぞ」と威張り散らしたり、「お前、名前なんて言うんだ。クビにしてやる」なんていうやつもいるそうですし。←こういうことを言う奴の方をクビにすべきだと思いますけどね。

まぁ、この例なんかは笑い話で済むかも知れませんが、ホストコンピュータのソフトウェアが異常終了してしまった(我々は「コケる」とか「死ぬ」とか言いますけど)ときなんかは、うち側の責任ですから、調べなければいけません。私も入社2〜3年目のころは、これによく付き合わされました。
ホストコンピュータで動いているソフトウェアが異常終了すると、ダンプリストと言って、その時のメモリーの内容を印刷したものが出力されるのですが、これが数千ページに及んだりします。これを解析して原因を突き止めるわけですが、簡単に分からない場合は大変です。電卓片手に、深夜までああだこうだやっていたことも何度もあります。
どうでもいいシステムの場合はそうでも無いのですが、重要なシステム(要するに儲けの多いシステム)の場合には、原因を調べている場所に、だんだん偉い人が集まってきます。こういうときに、その「偉い人」の人物というか、度量というか、そういうのがよく分かります。いらいらして歩き回ったり、やたら損害金額のことを言って急かしたり、なんていうのは、後で無視されたりするわけですね。
原因が、誰かのバグ、ということが分かると、それは大概の場合、デキる人間です。デキない人間は、そんな重要なところのプログラミングは担当してませんから(そもそも仕事してない、という話も)、大きなトラブルを起こすことは希です。かく言う私も、自分のバグでトラブルを起こしたことはほとんどありませんから、要するにデキない人間、ということですね(^^;)

最近は、私はトラブルの調査でも、いわゆる分散系システムの方に狩り出されることが多くなっています(もう、件のダンプリストを見る技術も無くなってしまっていますし)。
で、こっちの方は、原因追求が難しいのが多いです。ネットワークが介在していますし、WindowsNTのような仕様が不明確なOSなんかも使っていますし、「多分、これが原因かな」なんてことしか分からないことも度々ですね。前にも書きましたが、この上、DCOMとか訳の分からないものは使いたくないですね。もう、トラブルが起きたらお手上げ、というか・・・。

うーん、今回はなんか暗い話になってしまいましたね。もっと明るい話にする予定だったのですが・・・トラブルを巡る面白い話とか。でも、書きたくても書けないような話もあったですし。そういえば「日経コンピュータ」という雑誌に以前あった「動かないコンピュータ」というコーナーは秀逸でしたね。「おいおい、ここまで書くんか、それも実名で」なんてのがたくさんありましたし。
というわけで、次回はもっと明るい話題にしたいな、と思っております。

[前へ] [次へ]

[Home] [戻る]


mailto:lepton@amy.hi-ho.ne.jp