全日空がシステム障害で大量欠航
これ、前にもありましたよね。
あの時は、ネットワーク機器の障害が発端で、世界的にも事例がないケースだったとか聞いたことがあるけど。
システム関係者としては、
1.二重化はしているだろうが、なぜ切り替わらなかったのか。
2.開発や運用体制をどう管理していて、どこに深層原因があるのか。
3.障害発生時にシステムに依存せず、パフォーマンスが低下(この場合は、運行本数の減少)があっても事業継続をする仕組みや方法はあったのか。
ということが気になります。
これは、決して他山の石ではなく、どの会社でも起こり得ることですから。たまたま全日空という公共交通網で起こったから騒ぎになっているわけですからね。
例えば、1.の二重化が切り替わらない理由は、どこかにウィークポイントがあった可能性(二重化できない部分)もあるし、切り替わったが同一のシステム構成でダウンしてしまったのかもしれない。
2.は近年特に言われていること。今までの大型コンピューター(ホストコンピューター)時代だと、特定のベンダーや開発会社に頼んでしまっていたので、システムの隅々をベンダーや開発会社が知っていて、統制も取りやすかった。
近年のオープンなタイプだと、色々な会社が携わっていることも多いし、変化が激しいせいか技術者も素人に毛が生えた程度から、熟知している人までマチマチ。
NTT東日本・西日本のひかり電話の障害多発もこのパターンでしたよね。前者が電話交換機で、後者がひかり電話のようなIP技術を利用した電話がこれでした。で、トラブルのきっかけもコマンドの投入ミスとか、些細なことだったんだけど、あっと言う間にあちこちの機器が止まったんじゃなかったかな。
そうすると、システムを発注する企業側が、どんな開発体制・運用体制をしていて、どの程度のスキルがあって、ベンダーや開発企業とどういう付き合い方(業務分担)をしていたのか。システム部門のスキルが低くて、丸投げしちゃう企業もありますからね。さすがに全日空が丸投げとは考えにくいけど。
3.のことは、わざと項目に「事業継続」と入れたとおり、ある種のBCP(Business Continuty Plan;事業継続計画)の一つの考え方として必要なことだと思います。現代社会は、システム化によって効率を高め、それを極限まで使っていて競合企業と厳しい戦いをしているわけです。なので、システム依存度が高くなっている。
だけど、緊急時には普段はシステム化されている部分を手操作で行って、効率は大幅に落ちるけど、事業が完全停止しないようにすることも必要だと思うんですね。
今回のシステム障害について読んだソースでは、「単にシステム障害が起こっている」という一報段階ですから、どの部分が止まったかわかりません。
航空会社のシステムについて詳しくは知りませんが、恐らく、「運行管理(航空機のやり繰り、整備スケジュール)」、「座席管理(予約・割当)」、「情報収集(航空気象など)」ぐらいには機能を分けていると思う。
例えば、座席管理をする部分が止まった場合、航空券がある場合だと券面に行先(搭乗便)と氏名はありますよね。チェックインしていれば、搭乗便と座席位置が半券に印刷されているでしょうけど。
そうすると、航空券があれば、とりあえずその人を案内することはできるわけですよね。
チケットレスの場合には、携帯電話か何かに同様の情報があれば、それも同じことだろうし。
座席の決めようがないなら、使用する機材の座席表を用意して、決まったところを塗るとか。とんでもない時間がかかるけど、他社に振替できない路線(自社しか運航していない路線)なら、こうでもするしかないでしょう。
運行管理がやり繰り用途だったら、データを後追いで入力して運航距離や所在位置を訂正すれば済むけど、機体に問題がないなら飛べそうだし。
・・・と、何らかの代替手段で完全ストップを避けるとか、そういうことをどう考えていたのかな・・・と気になるんですね。役に立つ方法とか、考え方があれば知りたいですし。それを自分の会社に使えるなら使って、万が一の事態が発生した時に備えたいですからね。
まずは、早期復旧を。その後に検証と原因追究をしっかりと。公開可能な部分は公開していただいて、他の企業も事例研究をしてみたほうがいいかもしれない。
全日空でシステムトラブル
http://news.livedoor.com/article/image_detail/3819514/
※12:57追記
[全日空]14便欠航 システムトラブルでダイヤ大きな乱れ
http://news.livedoor.com/article/detail/3819500/
このソースによると、搭乗手続きを行うシステムとのこと。
また、人海戦術で対応しているが、それでもカバーし切れなくて14便が欠航とのことです。
なので、3.の手作業などによる~というのは行われているようですね。ならば、次はそれを効率よくできる半自動化とか、そういうことを考えてもいいですね。
例えば、単体のパソコンとラベルプリンタで動作するような仕組みがあれば、手荷物の荷札はどうにかなりそうですよね。到着空港に情報が送信できないなら、一覧情報を印刷したものをドアの内側に貼付するとか。