説明

情報管理システム

【課題】本発明は、メモリリークによるハングアップが回避でき、かつ、クライアントに対する情報サービスを継続して提供できる情報管理システムを提供することを目的とする。
【解決手段】本発明は、クライアント端末と、前記クライアント端末に通信手段を介して接続される複数の情報管理サーバを有する情報管理システムにおいて、順次実行される前記情報管理サーバの再起動時期は、メモリリーク等によるハングアップの予想発生時期以前で、かつ再起動が互いに時間的に重ならないようにし、再起動中の情報管理サーバの業務処理を、他の情報管理サーバが代行することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、製造業界向に用いられる情報管理システムに関するものである。
【0002】
製造業向け情報管理システムでは、最低1回/日の電源切断をするのが普通である通常のコンピュータを24時間365日無停止で製造業向け情報管理システムの情報管理サーバとして用いる。
【背景技術】
【0003】
製造業向けの情報管理システムにおいては、信頼性上の枢要な要素はシステムの中核に位置するサーバコンピュータ群である。これらのサーバコンピュータ群が故障すると情報管理システム系全体の情報管理、システム運用等に重大な影響が及ぶため、これらのサーバコンピュータ群はクラスタ構成等の冗長化手法による高信頼化が図られるのが通例である(例えば、特許文献1参照)。
【0004】
【特許文献1】特開2000−155698号公報
【特許文献2】特開2004−213122号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、ハードウェアを冗長化したとしても、コンピュータが使用したメモリ領域の開放命令の欠如等が原因でメモリ等のリソースを次第に食い潰す不具合に起因して、システムがハングアップに至るケースが多い。
【0006】
これは、1回/日は電源の切断が行われる一般のビジネス用途のコンピュータ等と異なり、製造業向け等のヘビーデューティシステムは、24時間365日、無停止運用が通例で、1回/日の電源切断で解消される筈のメモリリーク現象が何日も何ヶ月も継続するため、ある日、突然に、ハングアップとなって顕在化するものである。
【0007】
この、メモリリーク等のリソース食い潰しを原因とするハングアップは、いつ起きるとも判然とせず、又、ハードウェアの二重化、三重化等による冗長化の対策を施しても、複数の処理装置において同時期に発生する可能性も低くなく、ハードウェアの冗長化による高信頼化では十分でない面があった。
【0008】
なお、メモリリークは、コンピュータの動作中に、使用可能なメモリ容量がだんだん減っていく現象である。OSやアプリケーション・ソフトが処理のために占有したメモリ領域を、なんらかの理由で開放しないまま放置してしまうために起きる。多くの場合、OSのメモリ管理方法に問題があったり、アプリケーション・ソフトに不具合(バグ)が残っていたりすることが原因である。メモリリークにより利用可能なメモリ領域が減少すると、システムの性能が低下したり、不安定になったりする。
【0009】
また、特許文献2に示されるサーバシステムでは、サーバを再起動してハングアップの防止をしている。サーバの再起動タイミングは、サーバの稼動状況に関係するメモリリークのしきい値に基づいてしている。
【0010】
しかし、サーバの再起動時には、サーバはクライアントに対する情報サービスの提供ができなくなる。クライアントに対し複数のサーバを用いて対応しているが、メモリリークのしきい値による再起動タイミングが重なってしまうと、クライアントに対する情報サービスの提供ができなくなる。
【0011】
本発明は、上記の問題に鑑み、メモリリークによるハングアップが回避でき、かつ、クライアントに対する情報サービスを継続して提供できる情報管理システムを提供することを目的とする。
【課題を解決するための手段】
【0012】
本発明は、クライアント端末と、前記クライアント端末に通信手段を介して接続される複数の情報管理サーバを有する情報管理システムにおいて、順次実行される前記情報管理サーバの再起動時期は、メモリリーク等によるハングアップの予想発生時期以前で、かつ再起動が互いに時間的に重ならないことを特徴とする。
【発明の効果】
【0013】
本発明によれば、メモリリークによるハングアップが回避でき、かつ、クライアントに対する情報サービスを継続して提供できる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の実施例を、図1〜図7を引用して説明する。
【0015】
まず、図7を引用して製造業向けの業務システムについて説明する。
【0016】
製造業向けの業務システムは、二つの情報管理サーバ701、製造情報LAN704、業務情報LAN702、計測・制御LAN708、クライアント端末703などを有する。
【0017】
計測・制御装置709は、製造装置710から計測・制御信号をスキャンして個々の機器を動かす。その過程での生産に関する各種のデータを業務システムの情報管理サーバ701が製造業務用操作卓705を経由して収集し、入力情報、出力情報としての蓄積・管理を行う。
【0018】
又、業務システムサーバは、製造装置710のみならず、現場操作卓706、秤量器707などの動きを含めて製造全体を統括する役割を果たす。このため、業務システムサーバは通常、冗長化構成が適用される。
【0019】
製造業における業務システムは、従来、計測・制御装置709、計測・制御LAN708及び製造業務用操作卓705を中心に、計測・制御を重点に構築されてきた製造システムを、原料の入荷から製造、品質管理、製品の出荷までの一連の製造実行システムのレベルまで拡大し、全体の業務を効率化するというものである。
【0020】
この一貫として、業務システムの情報管理サーバ701が、全体を最適に動かす業務処理を行う。
【0021】
図1を引用して情報管理システムについて説明する。
【0022】
オペレータが操作するクライアント端末101は、モニタ104、キーボード105、及びマウス106が接続されている。オペレータは、クライアント端末101を介して、情報管理サーバA102、あるいは情報管理サーバB103の業務処理や情報交換を行う。
【0023】
クライアント端末101は、クライアントOS部107、GUI処理部108、接続管理部109、通信制御部110を有する。
【0024】
情報管理サーバA102は、サーバOS部111、通信制御部112、業務処理部113、一時保存用データファイル部114、リセット制御処理部115を有する。
【0025】
情報管理サーバB103は、サーバOS部116、通信制御部118、業務処理部117、リセット制御処理部120、DB管理部119、DB部(データベース機構)121を有する。
【0026】
クライアント端末101、情報管理サーバA102、情報管理サーバB103は、LANを含む通信手段を介して接続される。
【0027】
オペレータの操作により、クライアント端末101のGUI処理部108が通信制御部110を通じて、情報管理サーバA102の通信制御部、あるいは情報管理サーバB103の通信制御部118との通信接続ルートを介して、業務処理部113、あるいは業務処理部117と情報交信が行なわれる。
【0028】
情報管理サーバA102の業務処理部113は、通信制御部112、118、及びDB管理部119のルートでDB部121へのデータの保存、及びDB部121からのデータの参照を行う。
【0029】
情報管理サーバB103の業務処理部117は、直接、DB管理部119の経由でDB部112へのデータの保存、及びDB部112からのデータの参照を行う。
【0030】
情報管理サーバA102のリセット制御処理部115は、情報管理サーバA102本体が起動して、メモリリーク等のリソース食い潰しを起因とするシステムのハングアップが起こる時間間隔より短い時間範囲内で、適切な再起動タイミングを計数する。
【0031】
そして、その再起動タイミングが来たら通信制御部112を介してクライアント端末101に自身が自動再起動移行の時期であることを伝え、かつ、サーバOS部111に自動再起動に移行するよう指令を出す。
【0032】
サーバOS部111は、業務処理部113、及び通信制御部112の処理を停止させ、再起動処理に移行する。
【0033】
同様にして情報管理サーバB103のリセット処理部120も自動再起動のタイミングが来たら通信制御部118を介してクライアント端末101に自身が自動再起動移行のタイミングであることを伝え、かつ、サーバOS部116に自動再起動に移行するよう指令を出す。
【0034】
そして、サーバOS部116は業務処理部117、及び通信制御部118の処理を停止させ、再起動処理に移行することになる。
【0035】
情報管理サーバB103本体が起動してからメモリリーク等のリソース食い潰しを起因とするシステムのハングアップが起こる時間間隔より短く設定する起動タイミングは、情報管理サーバA102の自動再起動処理とのオーバーラップを生じない、適当な時間差を付け、かつ、DB部に保存されている過去のデータを参照する業務処理が働く時間帯を避けるように適切に計算される。
【0036】
この再起動処理とのオーバーラップ回避は、情報管理サーバA102と情報管理サーバB103が互いに連絡をとって行なわれる。
【0037】
このように情報管理サーバA102と情報管理サーバB103は、メモリリークによるシステムのハングアップが生じる前に再起動処理が行なわれので、ハングアップによるシステムダウンを防止することができる。
【0038】
また、情報管理サーバA102と情報管理サーバB103の再起動処理が重複しないように処置されるので、クライアントに対する情報管理サーバA102と情報管理サーバB103の情報サービスは、継続して提供することができる。
【0039】
又、情報管理サーバB103の自動再起動処理中は、情報管理サーバA102の業務処理部113は情報管理サーバB103の業務処理部117の業務も代行し、かつ業務処理中に発生するデータを一時保存用データファイル部114に保存する。
【0040】
そして、情報管理サーバB103が自動再起動処理を完了したら通信制御部112、及び118、DB管理部119を経由して、一時保存用データファイル部114から保存データをDB部121に転送する。
【0041】
また、自動再起動処理が実行されているときは、自動再起動処理中の情報管理サーバA102または情報管理サーバB103とクライアント端末101との接続が回避されるようになっている。
【0042】
すなわち、クライアント端末101では、接続管理部109が通信制御部110を通じて情報管理サーバA102のリセット制御処理部115からの情報、又は情報管理サーバB103のリセット制御処理部120からの情報を得て、GUI処理部108と情報管理サーバA102、又は情報管理サーバB103との通信の接続ルートを、自動再起動処理を実行中のサーバとの接続を回避するように調整する。
【0043】
図1の情報管理システムの処理フローについて、図2〜図6に沿って説明する。
【0044】
図2は情報管理サーバA102の業務処理部113の業務処理フローを示している。
【0045】
本処理のメインの業務は、原料の入荷から製造、品質管理、製品の出荷までの一連の製造実行システムとしての情報管理業務である。本フローでは本発明の主要部であるサーバの高信頼化に関する部分のみのフローに限定している。
【0046】
まず、サーバ情報管理B103の状況掌握処理ステップ201では、通信制御部112を介して情報管理サーバBの状況を掌握し、その情報に基づいて情報管理サーバBの状況判定処理ステップ202で情報管理サーバBが自動再起動処理中であるかどうかを判定する。
【0047】
自動再起動処理中であれば、収集データの一時保存処理ステップ203に移行して本サーバでの収集データを自サーバ内の一時保存用データファイル部114に保存するようにし、次に情報管理サーバBの、業務代行移行処理ステップ204にて、以後、情報管理サーバBの業務を、その自動再起動処理が完了するまで代行するようにする。
【0048】
又、情報管理サーバBの状況判定処理ステップ202で情報管理サーバBが自動再起動処理中でないと判定した場合、情報管理サーバBの自動再起動完了判定ステップ205に移行し、情報管理サーバBが自動再起動処理を完了した時点にあるか判定する。
【0049】
処理完了時点であれば、一時保存データの情報管理サーバBのDBへの転送処理ステップ206へ移行し、一時保存用データファイル部114の内容を通信制御部112、118、及びDB管理部121を通じて情報管理サーバBのDB部121に転送する。
【0050】
続いて、情報管理サーバBの業務代行中止の処理ステップ207に移行し、情報管理サーバBの業務の代行を以後、中止する。
【0051】
図3は、情報管理サーバB103の業務処理のフローを示す。
【0052】
本フローにおいても製造実行システムとしての情報管理業務については省略し、本発明の主要部であるサーバの高信頼化に関する部分のみのフローに限定している。
【0053】
フロー的には図2の情報管理サーバAの業務処理と同等であるが、情報管理サーバAと異なり情報管理サーバBはDB部121を有するため、一時保存用データファイル部114が必要でなく、その分、フローがシンプルとなる。
【0054】
まず、サーバBの状況掌握処理ステップ301で通信制御部118を介して情報管理サーバAの状況を掌握し、その情報に基づいて情報管理サーバBの状況判定処理ステップ302で情報管理サーバAが自動再起動処理中であるかどうかを判定し、自動再起動処理中であれば、情報管理サーバAの業務代行移行処理ステップ303にて、以後、情報管理サーバAの業務を、その自動再起動処理が完了するまで代行するようにする。
【0055】
又、情報管理サーバAの状況判定処理ステップ302で情報管理サーバAが自動再起動処理中でないと判定した場合、情報管理サーバAの自動再起動完了判定ステップ304に移行し、情報管理サーバAが自動再起動処理を完了した時点にあるか判定し、処理完了時点であれば情報管理サーバAの業務代行中止の処理ステップ305へ移行し、情報管理サーバAの業務の代行を以後、中止する。
【0056】
図4は、情報管理サーバA102のリセット制御処理のフローを示す。
【0057】
まず、自身の自動再起動タイミングの計算処理ステップ401で、情報管理サーバAの自動再起動のタイミングを計算する。
【0058】
続いて、自動再起動への移行の判定処理ステップ402において、現時点が自動再起動のタイミングであるかどうかを判定し、合致するなら、自動再起動移行処理ステップ403でサーバOS部111に対し、再起動を要求し、かつ通信制御部を通じ、クライアント端末111の接続管理部109に自動再起動開始を通知する。
【0059】
図5は、情報管理サーバB103のリセット制御処理のフローを示す。
【0060】
フロー的には、図4の情報管理サーバAのリセット制御務処理と同等であるが、情報管理サーバAと異なり、情報管理サーバBはDB部121を有するため、データベース内の過去の保存内容を参照するような業務が走る時間帯は自動再起動処理を避ける必要があり、その分、フローが複雑となる。
【0061】
まず、自身の自動再起動タイミングの計算処理ステップ501において、情報管理サーバBの自動再起動のタイミングを計算する。
【0062】
次に、時間差付与ステップ502に移行し、情報管理サーバAの自動再起動タイミングの時間に対し必要十分なる時間差を付加する。
【0063】
そして、データベース内過去保存データ参照業務との時間衝突判定ステップ503に移行し、求めた自動再起動タイミングの時間が過去のデータベース保存内容を参照する業務処理の時間帯と重ならないかをチェックする。
【0064】
重なるようであれば、自身の自動再起動タイミングの計算処理ステップ501に戻って再計算する、という具合にして重なることの無い自動再起動タイミングを求め、自動再起動への移行の判定処理ステップ504に移り、現時点が自動再起動のタイミングであるかどうかを判定する。合致するなら、自動再起動移行処理ステップ505でサーバOS部116に対し、再起動を要求し、かつ通信制御部を通じ、クライアント端末101の接続管理部109に自動再起動開始を通知する。
【0065】
図6は、クライアント端末101における接続管理部109のフローを示す。
【0066】
まず、情報管理サーバA,Bの自動再起動の状態把握処理ステップ601において、通信制御部112、又は118から通信制御部110を通じて送られてくる情報管理サーバA、又はBの自動再起動の状況を掌握する。
【0067】
続いて、いずれかのサーバの自動再起動移行の判定処理ステップ602で、情報管理サーバA、又はBのいずれかで自動再起動処理が始まったかどうかを判定し、始まったならば、GUI処理部の通信接続ルートの調整処理ステップ603に移行し、GUI処理部108が通信制御部110を介して情報管理サーバA、又はBの通信制御部112、又は118と接続するルートを自動再起動処理を実行中でない方に設定する。
【0068】
上述した本発明の実施例に係わる主な特徴を列挙する。
(1).複数の情報管理サーバを重複しないように時間差を設けて1台ずつ順次に再起動させることにより、単なる情報管理サーバの冗長化構成では防止し難いメモリリーク現象等のリソース食い潰しに起因するハングアップの発生を未然に防ぐことができ、情報管理システムの信頼性をより高めることができる。
(2).ある1台の情報管理サーバの再起動中、別の情報管理サーバが業務を代行するため、情報管理システム全体をダウンさせることなく継続稼働させる能力、即ち可用性を高めることができる。
(3).複数台の情報管理サーバの内1台にデータベース機構を持たせ、これに対し、他のサーバが情報通信によってデータの保存、参照を行い、又、データベース機構を有するサーバの自動再起動中は他のサーバ自体でデータを保持し、再起動完了時にデータベースに集約する方式を提案した。
【0069】
すなわち、データベース機構を有する情報管理サーバを1台で運用する形式であるため、冗長化もデータ一致化も不要となり、シンプルにシステムを構成でき、信頼性・保守性が向上する。
(4).クライアントの端末がある情報管理サーバと通信接続関係を維持中に情報管理サーバの再起動に至った場合、別な情報管理サーバが自動的に割り当てられ、速やかに通信接続関係を確立し、クライアントの画面表示・操作の動作中断は発生しないため、システム運用面で可用性向上の効果がある。
(5).システム運用上、データベース機構を有する情報管理サーバにおいて、過去に保存されたデータベース内容を参照して行う業務処理が多くなる時間帯をはずして、再起動のタイミングの計算が行われるため、システム運用面で可用性向上の効果がある。
【0070】
本実施例によれば、メモリリーク等のリソース食い潰しに起因するハングアップの発生を未然に防ぐことができ、又、複数台の情報管理サーバを運用するシステム構成ながら、データベース機構を抱える情報管理サーバを1台で運用することができて、全体としてシステムの信頼性向上、可用性向上の効果がある。
【図面の簡単な説明】
【0071】
【図1】本発明の実施例に係わるもので、クライアント端末、二つの情報管理サーバ(A・B)により構成された情報管理システムの概要を示す図である。
【図2】本発明の実施例に係わるもので、情報管理サーバAの処理フローを示した図である。
【図3】本発明の実施例に係わるもので、情報管理サーバBの処理フローを示した図である。
【図4】本発明の実施例に係わるもので、情報管理サーバAのリセット制御処理を示した図である。
【図5】本発明の実施例に係わるもので、情報管理サーバBのリセット制御処理を示した図である。
【図6】本発明の実施例に係わるもので、クライアント端末の管理処理フローを示した図である。
【図7】本発明の実施例に係わるもので、製造業務システムのハードウェア構成を示した図である。
【符号の説明】
【0072】
101…クライアント端末、102…情報管理サーバA、103…情報管理サーバB、107…クライアントOS部、108…GUI処理部、109…接続管理部、110…通信制御部、111…サーバOS部、112…通信制御部、113…業務処理部、114…一時保存用データファイル部、115…リセット制御処理部、116…サーバOS部、117…業務処理部、118…通信制御部、119…DB管理部、120…リセット制御処理部、121…DB部、201…情報管理サーバBの状況掌握処理ステップ、202…情報管理サーバBの状況判定処理ステップ、203…収集データの一時保存処理ステップ、204…情報管理サーバBの業務代行移行処理ステップ、205…情報管理サーバBの自動再起動完了判定処理ステップ、206…一時保存データの情報管理サーバBのDBへの転送処理ステップ…207…情報管理サーバBの業務代行中止の処理ステップ、301…情報管理サーバAの状況掌握処理ステップ、302…情報管理サーバAの状況判定処理ステップ、303…情報管理サーバAの業務代行移行処理ステップ、304…情報管理サーバAの自動再起動完了判定処理ステップ、305…情報管理サーバAの業務代行中止の処理ステップ、401…自身の自動再起動タイミングの計算処理ステップ、402…自動再起動への移行の判定処理ステップ、403…自動再起動移行処理ステップ、501…自身の自動再起動タイミングの計算処理ステップ、502…時間差付与ステップ、503…データベース内過去保存データ参照業務との時間帯衝突判定ステップ、504…自動再起動への移行の判定処理ステップ、505…自動再起動移行処理ステップ、601…情報管理サーバA、Bの自動再起動の状況把握処理ステップ、602…いずれかのサーバの自動再起動移行の判定処理ステップ、603…GUI処理部の通信接続ルートの調整処理ステップステップ、701…業務システムサーバ、702…業務情報LAN、703…業務システムクライアント、704…製造情報LAN、705…製造業務用操作卓、706…現場操作卓、707…秤量器、708…計測・制御LAN、709…計測・制御装置、710…製造装置。

【特許請求の範囲】
【請求項1】
クライアント端末と、前記クライアント端末に通信手段を介して接続される複数の情報管理サーバを有する情報管理システムにおいて、
順次実行される前記情報管理サーバの再起動時期は、メモリリーク等によるハングアップの予想発生時期以前で、かつ再起動が互いに時間的に重ならないことを特徴とする情報管理システム。
【請求項2】
請求項1記載の情報管理システムにおいて、
再起動中の情報管理サーバの業務処理は、他の情報管理サーバが代行することを特徴とする情報管理システム。
【請求項3】
請求項1記載の情報管理システムにおいて、
データベース機構を備えない情報管理サーバは、データベース機構を備える情報管理サーバのデータを通信手段を介して保存、参照を行い、
前記データベース機構を有する情報管理サーバが再起動中は、前記データベース機構を備えない情報管理サーバがデータを一次的に保持し、前記データベース機構を有する情報管理サーバが再起動を終えたら前記一次的に保持したデータを前記データベース機構が備わる情報管理サーバに転送して前記データベース機構に保存を行うことを特徴とする情報管理システム。
【請求項4】
請求項1記載の情報管理システムにおいて、
前記クライアント端末と通信接続中の情報管理サーバが再起動時期に至った場合には、当該クライアント端末との通信接続を別の情報管理サーバが担うように割り当てることを特徴とする情報管理システム。
【請求項5】
請求項1記載の情報管理システムにおいて、
データベース機構を有する情報管理サーバについては、過去に保存されたデータベース内容を参照して業務処理を行う時間帯をはずして、再起動のタイミングの割当てを行うことを特徴とする情報管理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate