説明

中継サーバ

【課題】現場の研究開発者が自ら英語以外の言語を用いた特許調査を接続先を意識せずに容易に行うことが可能な特許検索システムのための中継サーバを提供する。
【解決手段】検討対象特許データから重要語を抽出するために検討対象特許データの各単語の重要度を算出する重要度算出手段(330)と、前記重要度に基づいて抽出された重要語を用いて前記検討対象特許データの特許分類を判定する第1の特許分類判定手段(335)と、前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて前記重要語を所望の言語に翻訳する第1の翻訳処理手段(340)と、前記所望の言語に翻訳された重要語を用いて検索式を生成する第1の検索式生成手段(345)と、前記所望の言語に応じた接続先である特許データベースサーバに対して、前記接続先に応じた接続要求を生成する第1の接続要求生成手段(350)とを備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特許検索のための中継サーバ、特許検索方法およびそのプログラムに関する。特に外国特許検索のための中継サーバ、特許検索方法およびそのプログラムに関する。
【背景技術】
【0002】
特許文献1では、任意の言語でキーワードを入力しても目的の文書を検索することを目的とし、英語のキーワードを入力した場合は、入力キーワードが翻訳処理部で日本語に翻訳された後、検索処理部に入力され、英語インデックスファイルを参照して英語文書ファイルから目的の文書が検索される文書検索システムが開示されている。
【0003】
又、特許文献2では、入力した第1の言語のキーワードをキーとして置換テーブルに記憶した第1の言語のキーワードに対応する第2の言語のキーワードを読み出し、この第2の言語のキーワードを用いて検索式を作成する特許情報検索システムが開示されている。
【0004】
又ドキュメント内の重要語を抽出するために文書内の単語の重要度を計算する方法としては、例えば特許文献3の0024段落乃至0037段落に示されている残差IDF(RIDF)を用いた方法が公知である。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平5−324719
【特許文献2】特登録3666005
【特許文献3】特開2004−145790
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、上記従来技術によれば、例えばドイツやフランス等の海外で第一国出願された特許を日本出願及び審査請求するかの判断を行おうとする場合の手間を軽減することができないという課題(第一の課題)があった。すなわち、このような場合以下の作業が必要になる。1)ドイツ語で記載された明細書及び特許請求の範囲のポイントを把握し、2)把握したポイントから日本語キーワードを選定してこのキーワードの同義語を考え、3)必要により把握したポイントから該当するFタームを確認し、4)最終的な検索式を決め、5)日本の公報を検索可能な特許DBに接続して検索を行い、6)検索でヒットした日本公報の内容を確認する。ここで1)のドイツ語等の外国語で記載された明細書及び特許請求の範囲のポイント把握に多大な工数がかかってしまうという課題があった。又外国出願で付与されたIPC等の特許分類が必ずしも適切ではないという課題もあった。
【0007】
このような場合、第一国出願された特許のテキストデータを機械翻訳してから、機械翻訳の訳文を見て日本語キーワードを選定することも考えられる。しかし、特段の工夫をしない場合機械翻訳の精度はあまり高くなく、機械翻訳の訳文から日本語キーワードを選定すると、結果的にしばしば不正確なキーワードを選定することがあるという課題(第2の課題)があった。他方正確なキーワードの選定を行うために、特許文献2に記載の従来技術を用いた場合、複数の言語のキーワードのペアを場合によっては技術分野別に予め用意する必要があり、多大な工数がかかってしまうという課題があった。
【0008】
又、逆に日本で第一国出願した出願件を海外に出願しようとした場合、例えばロシアや中国に特許出願しようとする場合、出願調査を行おうとすると以下のような問題に直面せざるをえなかった。1)海外、特に非英語圏の出願調査や侵害調査の精度に問題がある。例えば海外の特許調査会社に非英語圏の出願調査を依頼すると費用が高額な割に調査の精度が疑わしい場合がある。2)検索結果を自ら検証することができない(特許調査会社を信じるしかなかった)。特に研究開発部門のエンジニアが自ら特許調査を行う場合に、非英語圏の出願調査や侵害調査は困難を極めていた。
【0009】
上記の1)および2)の問題を解決するために、英訳された明細全文を検索可能な有料の特許DBを使用して検索しても、機械翻訳による英訳のため精度が必ずしも充分ではないため、いわゆるノイズ件の除外等による件数の絞込みに用いるには不安がある。更に日本語キーワードをターゲット言語に翻訳して、ターゲット言語に翻訳したキーワードをターゲット国の特許DBに入力して、検索結果を日本語に機械翻訳する場合でも翻訳精度の低さから、同様に絞込みに用いるには不安があった(第3の課題)。例えばいわゆる統計ベースの翻訳エンジンでは、充分な量のコーパス分析を行うことで名詞を中心とした専門用語についての訳文精度は良くなるが、他方形態素解析を行わないため、動詞の訳を中心とした文の表現が不自然になることが多い。他方、ルールベースの翻訳エンジンでは、形態素解析が正確なため文の表現は自然になるが、他方文脈に応じた専門用語の選択ができないため、専門用語の精度を上げることが困難である。特に特許文献の場合同じ単語が技術分野により異なる訳語を選択する必要がある場合が少なくない。例えば英語のlineは、通信分野では「回線」の意味に用いられ、ワープロ等の文書作成ソフト分野では「行」、グラフィック分野では「線分」、強電分野では「電力線」、生産技術分野では「製造ライン」、ビジネス分野では「(指揮命令系統を意味する)ライン」の意味に用いられるが、機械翻訳でこれらを訳し分けるのは容易ではない。

【0010】
本発明の目的は、英語以外の言語を用いた特許調査を特許事務所や知的財産部のスタッフが自ら行う以外に、現場の研究開発者が自ら英語以外の言語を用いた特許調査を接続先を意識せずに容易に行うことが可能な特許検索システムのための中継サーバを提供することにある。
【課題を解決するための手段】
【0011】
上記第1の課題を解決するために、請求項1に記載の中継サーバは、クライアント端末及び特許データベースサーバと通信可能に構成された中継サーバであって、 前記クライアント端末より受信した検討対象特許データから重要語を抽出するために検討対象特許データの各単語の重要度を算出する重要度算出手段と、 前記重要度に基づいて抽出された重要語を用いて前記検討対象特許データの特許分類を判定する第1の特許分類判定手段と、 前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて前記重要語を所望の言語に翻訳する第1の翻訳処理手段と、 前記所望の言語に翻訳された重要語を用いて検索式を生成する第1の検索式生成手段と、 前記所望の言語に応じた接続先である特許データベースサーバに対して、前記接続先に応じた接続要求を生成する第1の接続要求生成手段とを備えることを特徴とする。
【0012】
上記第2の課題を解決するために、請求項2に記載の中継サーバは、クライアント端末及び特許データベースサーバと通信可能に構成された中継サーバであって、 前記クライアント端末より、入力されたキーワードを用いて特許分類を判定する第2の特許分類判定手段と、 前記所望の言語に翻訳されたキーワードを用いて検索式を生成する第2の検索式生成手段と、 前記所望の言語に応じた接続先である前記特許データサーバに対して、前記接続先に応じた接続要求を生成する第2の接続要求生成手段と 前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて前記特許データベースサーバより取得した検索データを所望の言語に翻訳する第2の翻訳処理手段と、を備えることを特徴とする。
【0013】
上記第3の課題を解決するために、請求項3に記載の中継サーバにおいて、前記第2の翻訳処理手段は、コーパス分析を行った結果を蓄積し該蓄積したコーパス分析結果を用いて統計処理を行うことで翻訳を実行する統計ベースの翻訳エンジンと、所定の翻訳ルールを適用して形態素解析を行い単語に分割した原文を翻訳をするルールベースの翻訳エンジンとを備え、前記統計ベースの翻訳エンジンの翻訳実行結果と前記ルールベースの翻訳エンジンの翻訳実行結果とを、前記クライアントの画面に対比して表示するための表示情報を生成する生成手段を更に備えることを特徴とする。
【0014】
好ましくは、請求項3に記載の中継サーバにおいて、前記統計ベースの翻訳エンジンの翻訳対象特許データ又は前記ルールベースの翻訳エンジンの翻訳対象特許データに対応する英文データを前記特許データベースより取得する英文取得手段を更に備え、前記表示情報生成手段は、前記統計ベースの翻訳エンジンの翻訳実行結果と前記ルールベースの翻訳エンジンの翻訳実行結果の少なくともいずれか1つと、前記取得した英文データとを前記クライアントの画面に対比して表示するための表示情報を生成することを特徴とする。
【発明の効果】
【0015】
本願の請求項1記載の発明によれば、外国語で記載された検討特許データから重要語を抽出して、特許分類を特定し、特定した特許分類に応じて専門辞書を選定し、選定した専門辞書を用いて日本語に翻訳してから検索するので、外国語で記載された検討特許データを用いて手間を掛けずに日本の特許DBに対して高精度の検索を実行することができる。
【0016】
本願の請求項2記載の発明によれば、入力されたキーワードを用いて特許分類を判定する第2の特許分類判定手段と、前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて所望の言語に翻訳する第2の翻訳処理手段と、前記所望の言語に翻訳されたキーワードを用いて検索式を生成する第2の検索式生成手段と、前記所望の言語に応じた接続先に対して、前記接続先に応じた接続要求を生成する第2の接続要求生成手段とを備えるので、接続先のDBを指定するだけで言語や接続方法を意識せずに日本語のキーワードにより日本語の検索結果を取得可能な特許検索を実行することができる。
【0017】
本願の請求項3記載の発明によれば、前記統計ベースの翻訳エンジンの翻訳実行結果と前記ルールベースの翻訳エンジンの翻訳実行結果とを、前記クライアントの画面に対比して表示するので、両方の弱点をカバーすることが可能になり、機械翻訳の結果の把握が容易になる。特に英文と両方の翻訳エンジンの3つを対比表示し、あるいはこれらのうちの所望の2つを対比表示することで機械翻訳で訳しきれなかった原文の意図をより正確に把握することが可能になる。
【図面の簡単な説明】
【0018】
【図1】本発明の中継サーバを含む特許検索システムの全体を示したシステム構成図である。
【図2】本発明の中継サーバ15及び各クライアント及び各特許DBサーバのハードウェア構成を示したハードウェア構成図である。
【図3】本発明の中継サーバの機能構成を示した機能ブロック図である。
【図4】本発明のクライアント及び中継サーバ及び特許DBで実行される処理の前半部分(検索処理)を示すフローチャートである。
【図5】本発明のクライアント及び中継サーバで実行される処理の後半部分(検索処理以外)を示すフローチャートである。
【図6】本発明の図4のS430の詳細フローを示す図である。
【図7】本発明の図4のS433の詳細フローを示す図である。
【図8】本発明の再翻訳処理(図5のS528)の詳細フローを示す図である
【図9】本発明の検索要求生成・送信処理(図4のS428)の詳細フローを示す図である。
【図10】本発明の外国特許検索システムの初期画面を示す図である。
【図11】本発明の外国公報データによる国内出願調査のクライアント表示画面(図4のS404)を示す図である。
【図12】本発明の日本語キーワードによる外国特許調査のクライアント表示画面(図4のS404)を示す図である。
【図13】図11の画面でジョブ作成ボタン149を押下した場合、又は図12の画面でジョブ作成ボタン159を押下した場合に表示される未実行バッチジョブを一覧表示するクライアント表示画面を示す図(図4のS404)である。
【図14】本発明の検索結果表示時(図4のS407)のクライアント表示画面を示す図である。
【図15】本発明のジョブ実行履歴参照時(図5のS530)のクライアント表示画面を示す図である。
【図16】本発明のRIDFテーブルの一例を示す図である。
【図17】本発明の事前確率テーブルの一例を示す図である。
【図18】本発明の条件付き確率テーブルの一例を示す図である。
【図19】本発明の履歴テーブルの一例を示す図である。
【図20】本発明の接続先情報テーブルの一例を示す図である。
【図21】本発明の辞書マスターの一例を示す図である。
【図22】本発明の辞書テーブルの一例(辞書ID =D1002)を示す図である。
【発明を実施するための形態】
【0019】
以下、本発明の中継サーバを中心とする特許検索システムの一実施形態について図面を参照しつつ説明する。
【実施例】
【0020】
まず、図1は特許検索システムのシステム構成を示す図である。中継サーバ15とクライアントA11とクライアントB12とクライアントC13と特許DBサーバP16と特許DBサーバQ17と特許DBサーバR18はネットワーク10を介して通信可能に構成されている。クライアントA11とクライアントB12とクライアントC13とはこの3台に限らず、もっと多数のクライアントから構成されても良い。特許DBサーバP16と特許DBサーバQ17と特許DBサーバR18はこの3台に限らず、もっと多数の特許DBから構成されても良い。
【0021】
ネットワーク10はいわゆるインターネットでもローカルエリアネットワーク(LAN)でも専用回線でも良く、通信可能であれば形式は問わない。プロトコルとしてはTCP/IPが典型例であるが、これに限らない。特許DBサーバP16と特許DBサーバQ17と特許DBサーバR18とはそれぞれ異なる国の特許データベースを記録しているが、同一の国の特許DBを複数の特許DBサーバが重複して記憶していても良いし、一つの特許DBサーバが複数の特許DBを記憶していても良い。
【0022】
例えば特許DBサーバP16は中国特許(中国語)のDBと国際出願の特許(英語)のDBを記憶しており、特許DBサーバQ17はロシア特許(ロシア語)のDBを記憶しており、特許DBサーバR18は日本特許のDBを記憶している。この他にも不図示の他の特許DBサーバが米国特許やEP特許のDBを記憶しており、中継サーバ15はこれら不図示の特許DBサーバとも通信可能に構成されている。クライアントA11とクライアントB12とクライアントC13はそれぞれ異なる企業や個人が使用しているが、同一企業で複数のクライアントをこの特許検索システムに接続することも勿論可能である。
【0023】
クライアントA11とクライアントB12とクライアントC13は典型的にはいわゆるパソコンであるが、ネットワーク10を介して通信可能であれば携帯型の端末でも良い。中継サーバ15はクライアントA11とクライアントB12とクライアントC13等のクライアント側各端末と、特許DBサーバP16と特許DBサーバQ17と特許DBサーバR18等の特許DBサーバ側の中間で両者の間の通信を中継するとともに、翻訳や検索式生成、検索結果の表示レイアウトの作成等を実行する。中継サーバ15の処理は図3以降で詳細に説明する。以上で図1の説明を終わる。
【0024】
次に図2は中継サーバ15及びクライアントA11とクライアントB12とクライアントC13と特許DBサーバP16と特許DBサーバQ17と特許DBサーバR18のハードウェア構成を示す図である。CPU21とROM22とRAM23とビデオグラフィックアダプタ(VGA)24とLANアダプタ25とキーボード26とマウス27とHDD28とDVD-ROMドライブ29はそれぞれシステムバス20を介して接続されている。
【0025】
なお、これらと各構成要素とシステムバス20との間にインタフェース部が存在する場合があるが図では省略されている。CPU21は中継サーバ全体の制御を司り、具体的には起動時にはROM22から起動プログラム(ブートローダ)を読み込んでハードウェアのチェック及び初期化を行い、その後HDD28からシステムプログラムを読み出してRAM23にロードし、オペレーティングシステム(OS)を立ち上げる。更にCPU21はユーザの操作に応じてアプリケーションプログラムをHDD28からRAM23にロードし、実行する。
【0026】
ROM22は前述のように起動プログラムを記憶しており、RAM23はいわゆるメインメモリとしてオペレーティングシステム及びアプリケーションプログラム及びワークエリアとして使用する。VGA24は液晶ディスプレイ又はCRTに接続して画面表示を行うためのアダプタであり、LANアダプタ25は外部のネットワークと接続しデータの送受信を行う。キーボード26及びマウス27はユーザの操作を入力する入力手段として機能する。又HDD28には各種プログラム(オペレーティングシステム、本発明の図4乃至図12に記載のフローチャートを実行する各アプリケーションプログラム及びクライアント画面に表示するためのHTMLの画面のレイアウト情報)や各種テーブルや検索履歴情報(検索条件情報及び検索結果の詳細情報)を記憶している。DVD−ROMドライブ29は各種プログラムを記憶したDVD−ROMやDVD−Rを読み込むためのドライブであり、各種データ類をDVD−Rに書き出すことも可能である。以上で図2の説明を終わる。
【0027】
次に図3を参照して本発明の中継サーバ15の機能構成及び中継サーバ15での処理の概要について説明する。図3は本発明の中継サーバの機能ブロック図である。操作制御部305は外部から受信した操作情報や検索結果情報をこれらに含まれるセッションIDに基づいて適切なRAM23中のセッションメモリやHDD28に記憶し、外部から受信した操作情報は操作情報判定部310に送信する。操作情報判定部310では操作情報が検索要求であるか、又は履歴参照要求であるかを判定する。操作情報が検索要求の場合、検索条件を含む操作情報を重要度算出部330に送る。操作情報が履歴参照要求の場合、履歴参照条件を履歴参照部315に送る。履歴参照部315は受信した履歴参照条件を用いて履歴情報記憶部320から条件に合致した履歴情報を操作情報判定部310経由で接続制御部305からクライアントに送信する。
【0028】
一方、操作情報が検索要求の場合、重要度算出部330はこの検索要求を受信し、検索要求に含まれる検索条件で日本語でないファイルが指定されている場合、重要度算出部330はファイルに含まれている各単語の重要度を算出し、算出した重要度が高い単語を重要語として抽出しRAM23のワークエリアに記憶する。IPC判定部335はRAM23のワークエリアに記憶した重要語とこの重要語をキーにしてKW・IPC記憶部355から読み出したIPCを用いて、特許分類を判定してRAM23のワークエリアに記憶する。なお、日本特許を検索する場合(特許DBサーバR18を検索する場合)は、特許分類はIPCでなくFIであっても勿論構わない。
【0029】
次に翻訳処理部A340はワークエリアに記憶した特許分類を用いて辞書情報記憶部360のどの専門辞書を使用するかを特定し、特定した専門辞書を用いてファイルに含まれる重要語を日本語に翻訳し、翻訳した重要語をRAM23のワークエリアに記憶する。更に検索式生成部345はRAM23のワークエリアに記憶した日本語に翻訳済みの重要語と、IPC判定部335が判定した特許分類を用いて検索式を生成し、RAM23のワークエリアに記憶する。接続要求生成部350は日本特許の特許DB(特許DBサーバR18)への接続スクリプトと接続先URLとを接続先情報記憶部325から読み出してRAM23のワークエリアに記憶し、接続制御部305はRAM23のワークエリアに記憶された接続スクリプトを接続先URLに送信し、次いでRAM23のワークエリアに記憶された検索式を特許DBサーバR18に送信し、折り返し特許DBサーバR18から受信した検索結果情報をRAM23のワークエリアに記憶する。
【0030】
翻訳処理部B365はRAM23のワークエリアに記憶した検索結果情報が日本語であることを判定すると処理をソート処理部370に進め、ソート処理部370は操作情報にソート指定がある場合は、検索結果情報を指定されたソートキーでソートしRAM23のワークエリアに記憶する。次いで表示情報生成部375は操作情報に含まれるレイアウト指定に応じてソート済みの検索結果情報からクライアントの画面に結果情報を表示するための表示情報(例えばHTML)を生成してRAM23のワークエリアに記憶する。接続制御部305はこの表示情報を要求元のクライアントに転送する。
【0031】
他方、検索条件で日本語のキーワードが指定されている場合、重要度算出部330は、各キーワードの重要度を算出して、各キーワードを重要度の降順にソートし、RAM23のワークエリアに記憶する。次いでIPC判定部335はRAM23のワークエリアに記憶した操作情報に含まれるIPC指定又は分野指定に基づいて、特許分類を特定してRAM23のワークエリアに記憶する。次に翻訳処理部A340はワークエリアに記憶した特許分類を用いて辞書情報記憶部360のどの専門辞書を使用するかを特定し、特定した専門辞書を用いてキーワードを操作情報に含まれているターゲット言語に翻訳し、翻訳した重要語をRAM23のワークエリアに記憶する。更に検索式生成部345はRAM23のワークエリアに記憶したターゲット言語に翻訳済みのキーワードと、IPC判定部335が判定した特許分類を用いて検索式を生成し、RAM23のワークエリアに記憶する。
【0032】
接続要求生成部 350はターゲット言語の特許DB(特許DBサーバP16)への接続スクリプトと接続先URLとを接続先情報記憶部325から読み出してRAM23のワークエリアに記憶し、接続制御部305はRAM23のワークエリアに記憶された接続スクリプトを接続先URLに送信し、次いでRAM23のワークエリアに記憶された検索式を特許DBサーバP16に送信し、折り返し特許DBサーバP16から受信した検索結果情報をRAM23のワークエリアに記憶する。翻訳処理部B365はこの検索結果情報を操作情報に含まれるターゲット言語の辞書であり、かつIPC判定部が判定した特許分類に応じた辞書を用いて日本語に翻訳し、翻訳結果をRAM23のワークエリアに記憶する。ソート処理部370は操作情報にソート指定がある場合は、日本語に翻訳された検索結果情報を指定されたソートキーでソートしRAM23のワークエリアに記憶する。次いで表示情報生成部375は操作情報に含まれるレイアウト指定に応じてソート済みの検索結果情報からクライアントの画面に結果情報を表示するための表示情報(例えばHTML)を生成してRAM23のワークエリアに記憶する。接続制御部305はこの表示情報を要求元のクライアントに転送する。以上で図3の説明を終わる。全体の処理の詳細は図4以下のフローチャート及び画面で詳細に説明する。
【0033】
次に本発明の中継サーバ15を中心とした特許検索処理等の概要を図4及び図5のフローチャート等を用いて説明する。本フローではステップS421乃至ステップS433は中継サーバ15のCPU21の制御の下で実行する処理であり、ステップS401乃至ステップS408はクライアントA11のCPU21の制御の下で実行する処理であり、ステップS441乃至ステップS446は特許DBサーバP16のCPU21の制御の下で実行する処理である。
【0034】
まずステップS401ではクライアントA11は中継サーバ15に接続要求を送信し、ステップS421では中継サーバ15が接続要求を受信し、折り返し認証要求画面をクライアントA11に送信し、クライアントA11では不図示の認証画面でユーザIDとパスワードが入力されOKボタンが押下されたことをCPU21が検知すると、CPU21は入力されたユーザIDとパスワードを中継サーバ15に送信する。中継サーバ15はユーザIDとパスワードを受信してRAM23のワークエリアに記憶し、CPU21は処理をステップS422に進める。ステップS422では中継サーバ15のCPU21はユーザIDをキーにしてHDD28に記憶している不図示の認証テーブル(ユーザIDとパスワードを暗号化して記憶しているテーブル)を検索し、ユーザIDに対するパスワードが一致しているかを判定し、一致している場合は処理をステップS423に進め、不一致の場合(ユーザIDは一致するがパスワードが一致しない場合、又はユーザIDで一致するものがない場合)は、処理をステップS424に進める。
【0035】
ステップS424では中継サーバ15のCPU21はユーザID又はパスワードが一致しない旨のエラーメッセージをクライアントA11に送信する。ステップS403ではクライアントA11はエラーメッセージを受信し、不図示のダイアログ画面(メッセージと「OK」ボタンを表示する画面)にエラーメッセージを表示する。このダイアログ画面で「OK」ボタンが押下されたことをCPU21が検知すると、処理をステップS401に戻す。他方ステップS423では中継サーバ15のCPU21はHDD28に記憶しているクライアントに初期画面を表示するための初期画面情報(例えばHTML。以下同様)をクライアントA11に送信する。ステップS402ではクライアントA11は初期画面情報を受信し、図13に示す初期画面をディスプレイに表示し、処理をステップS404に進める。ステップS404において、図10に示す初期画面130では、1.外国公報データによる国内特許調査、2.日本語キーワードによる外国特許調査、3.検索結果照会、4.管理情報設定・変更の各メニューを選択ボタン131乃至135を押下することにより、各メニューに対応した画面情報を中継サーバ15に要求するための要求情報を送信する。
【0036】
ステップS425では中継サーバ15は受信した要求情報に応じた画面情報をクライアントA11に送信する。例えば図10の画面で選択ボタン「1」131が押下された場合、クライアントA11の画面には図11に示す外国公報データによる国内出願調査の画面が表示されることになる。又図10の画面で選択ボタン「2」132が押下された場合、クライアントA11の画面には図12に示す日本語キーワードによる外国特許調査の画面が表示されることになる。又図10の画面で選択ボタン「4」134が押下された場合、クライアントA11の画面には管理情報設定・変更の画面が表示され、ディフォルトの検索エンジンの選択や、検索結果の書誌情報の表示項目の選択や接続先情報テーブル(図20)の新規追加や変更入力、辞書マスター(図21)のメンテナンス等を行うことができ、これらの翻訳オプションや表示項目情報や管理情報は中継サーバ15のHDD28に記憶される。ステップS404で所定の時間(例えば0.2秒)が経過すると処理をステップS405に進める。
【0037】
ステップS405ではクライアントA11のCPU21は処理要求があったかを判定する。具体的には、例えば図11の画面でUS、WO等の国用のチェックボックスのうちの少なくとも1つ、例えばCNのチェックボックス141にチェックが入り、元データペースト欄143にテキストがペーストされるか又はファイル参照ボタン144が押下されて不図示のエクスプローラ類似の画面で特定のファイルが選択され、最大件数のラジオボタンで例えば「100件」のボタン147が選択された状態で、検索ボタン148又はジョブ作成ボタン149が押下されたことをCPU21が検知した場合である。図12の画面でも同様であり、図11の画面との違いは元データペースト欄143にテキストがペーストされるか又はファイル参照ボタン144が押下されて不図示のエクスプローラ類似の画面で特定のファイルが選択されるのではなく、図12では検索式入力欄153に検索式(キーワード及び論理和を意味する+や論理積を意味する*とカッコ記号を組合せた式)が入力される点と、更にIPC欄154又は分野指定欄155で分野(例えば「自動車」)のうち少なくとも1つが指定される必要がある点(両方とも指定がないとエラーとなる点、である。又図11の画面のソート指定ボタン142又は図12の画面のソート指定ボタン152を押下することでソートオプションを指定することができる。これら各ボタンの選択や各入力欄への入力は操作情報としてRAM23のワークエリアに記憶される。
【0038】
上述の状態で、図11で検索ボタン148が押下され、又は図12で検索ボタン158が押下された場合、処理をステップS406に進め、RAM23のワークエリアに記憶されている操作情報や検索要求であることを示す要求区分、ユーザID、処理要求時刻を含む処理要求情報を中継サーバ15に送信する。
【0039】
上述の状態で、図11でジョブ作成ボタン149が押下され、又は図12でジョブ作成ボタン159が押下された場合、CPU21は処理をステップS406に進める。RAM23のワークエリアに記憶されている操作情報及びジョブ記憶要求(操作情報で指定された検索を1件のジョブ情報として中継サーバ15のRAM23のワークエリアに記憶することの要求)であることを示す要求区分を含む処理要求情報を中継サーバ15に送信し、折り返し当該ユーザの作成済みで未実行のバッチ検索ジョブの情報を中継サーバ15から受信して、図13の画面を表示する。図13の画面でバッチジョブ実行ボタン162が押下されると、CPU21はバッチジョブの実行要求を含む処理要求情報を中継サーバ15に送信する。
【0040】
中継サーバ15はステップS426で処理要求情報を受信しRAM23のワークエリアに記憶して処理をステップS427に進める。ステップS427では、RAM23のワークエリアに記憶している処理要求情報を参照し、処理要求が検索要求であるかを判定する。検索要求である場合は処理をステップS428に進める。検索要求でない場合は処理を図5のステップS521に進める。
【0041】
ステップS428では、RAM23のワークエリアに記憶している処理要求情報を参照し、接続先の特許DB(特許DBサーバP16のHDD28に記憶されている特許DB)を特定して、特定した特許DBサーバP16への接続要求を生成して、生成した接続要求を要求先の特許DBサーバP16に送信し、折り返し特許DBサーバP16から受信した認証画面情報をRAM23のワークエリアに記憶し、対応する認証情報を接続要求先の特許DBサーバP16に送信して処理をステップS429に進める。ステップS428については後に図9のフローチャートで更に詳細に説明する。
【0042】
ステップS429では、特許DBサーバP16から受信した画面情報に応じて、検索条件入力画面に遷移するまで画面情報を要求して、折り返し特許DBサーバP16から次の画面情報を受信し、検索条件入力画面に遷移したら処理をステップS430に進める。ステップS430ではRAM23のワークエリアに記憶している処理要求情報に含まれる検索条件に基づいて検索式を含む検索要求を生成し特許DBサーバP16に検索要求情報として送信する。その際検索要求が外国特許DBの検索であれば、日本語の検索キーワードを検索先の言語に翻訳して検索式を生成する。ステップS430については後に図6のフローチャートで詳細に説明する。
【0043】
ステップS433では、特許DBサーバP16は検索要求情報を受信しRAM23のワークエリアに記憶し、検索要求情報に含まれる検索式に基づいて検索を実行し、検索式に合致する特許や実用新案の一覧情報をRAM23のワークエリアに記憶し、処理をステップS444に進める。ステップS444ではRAM23のワークエリアに記憶している一覧情報(公報番号、出願人、発明の名称、出願日等を含む1件を一行で表示可能な情報)を中継サーバ15に送信する。ステップS431では中継サーバ15は一覧情報を受信し、RAM23のワークエリアに記憶し、処理をステップS432に進める。ステップS432では、RAM23のワークエリアに記憶している操作情報に含まれる最大件数に応じた数の詳細情報(他の書誌情報、課題、クレーム1等)を特許DBサーバP16に要求する旨の詳細情報要求を送信する。
【0044】
ステップS445では、特許DBサーバP16は詳細情報要求を受信し、RAM23のワークエリアに記憶し、処理をステップS446に進める。ステップS446では最大件数に応じた数の詳細情報を特許DBから読み出して中継サーバ15に送信する。
【0045】
ステップS433では、受信した詳細情報に外国語テキストが含まれる場合は日本語に翻訳して、表示用レイアウトを生成し、クライアントA11に表示情報として送信する。又受信した検索結果情報である詳細情報と、検索条件情報である操作情報とを含む検索要求情報とを履歴情報としてHDD28の履歴情報記憶部320の履歴テーブル(図19)及び明細ファイル(図19の履歴テーブルの結果・条件情報で特定されるファイル)に記憶する。ステップS433については後に図7のフローチャートで詳細に説明する。なお、所定の期間(例えば2ヶ月)が経過すると詳細情報はHDD28から削除され、検索条件情報はHDD28に引続き記憶される。
【0046】
ステップS407ではクライアントA11が表示情報を受信してRAM23のワークエリアに記憶に記憶し、この表示情報に基づいて検索結果を画面に表示する。検索結果の表示画面の一例を図14に示す。図14の画面では条件に合致する件数(645件)が最大件数の100件を超えているため冒頭の100件を表示している旨のメッセージが表示されているが、ソート指定されている場合は、中継サーバ15のソート処理によって、発行日の新しい順、発行日が古い順などソートキーとして設定可能な所望の項目でソートして表示させることもできる。所定の時間(例えば0.2秒)が経過したら処理をステップS408に進める。ステップS408では画面の遷移要求(例えば図14の画面でメイン画面への遷移要求ボタン177の押下)があった場合、処理をステップS402に戻す。S402に戻す代わりに、「前の画面」ボタンを図14の画面で表示し、「前の画面」ボタンの押下に応じて、処理をステップS404に戻しても勿論かまわない。以上で図4の説明を終わる。
【0047】
次に検索要求以外の処理要求があった場合の中継サーバ15側の処理の概要を図5のフローチャートを用いて説明する。図5のフローチャートでステップS501乃至ステップS504はクライアントA11のCPU21の制御の下で実行する処理であり、ステップS521乃至ステップS532は中継サーバ15のCPU21の制御の下で実行する処理である。
【0048】
ステップS521では、中継サーバ15はRAM23のワークエリアに記憶している処理要求情報に含まれる操作情報を参照して、参照要求があったか(図10の画面で検索結果照会を要求するボタン「3」133が押下され、かつ図14の画面で検索履歴参照ボタン176が押下されたか)を判定し、参照要求があった場合は処理をステップS522に進め、参照要求がなかった場合は処理をステップS531に進める。参照要求があった場合のステップS522では、HDD28に記憶されている図19に示す履歴テーブルの結果・条件情報を参照して図15に示す検索ジョブ実行履歴一覧を表示し、処理をステップS523に進める。
【0049】
ステップS523では、検索条件は残っているが、詳細情報がない場合は、この検索条件に基づいて検索を行うために、処理を図4のステップS428に進める。詳細情報がある場合は処理をステップS524に進める。ステップS524では、図15の画面を表示したままRAM23のワークエリアに記憶している操作情報を参照して、ソート指定があったか、すなわち図15に示す画面で、結果・条件情報のファイルへのリンク181が選択される前にソート指定ボタン182が押下され、不図示の画面でソート項目と昇順又は降順が指定されたかを判定する。ソート指定があった場合は処理をステップS525に進める。ソート指定がなく、結果・条件情報のリンクが選択された場合は処理をステップS526に進める。更に、図15の画面で再翻訳ボタン184を押下してから特定の結果・検索情報のファイルへのリンクが選択された場合は、選択されたファイルの再翻訳条件を指定するための不図示のダイアログが表示され、当初の検索時とは異なる翻訳エンジン(例えば当初はルールベース翻訳のみだが、再翻訳ではルールベース翻訳と統計ベース翻訳の両方のエンジン)を選択することが出来るし、英語データ(当該特許の英訳情報又は対応特許の英語公報情報)を、公報番号をキーにして他の特許DBから取得して表示することもできる。
【0050】
ステップS525では、指定されたソート項目を指定された昇順又は降順でソートしてRAM23のワークエリアに記憶し、処理をステップS526に進める。ステップS526では、RAM23のワークエリアに記憶されているソート済み又はHDD28から読み出された詳細情報を用いてクライアント画面に表示するためのレイアウトされた表示情報(例えばHTML)を生成して、クライアントA11に送信する。
【0051】
ステップS501では、クライアントA11は表示情報を受信してRAM23のワークエリアに記憶し、この表示情報に基づいて図14と同様の画面を表示し、処理をステップS502に進める。ステップS502では、図14のメイン画面ボタン177が押下された場合は図4のステップS402に処理を戻し、再検索ボタン178が押下された場合は図4のステップS404に処理を戻す(この部分はフローチャートに示さず)。
【0052】
他方、ステップS521で参照要求がなかったと判定した場合には、処理をステップS531に進める。ステップS531では、RAM23のワークエリアに記憶されている操作情報を参照して、図4のステップS404でジョブ作成要求があったかを判定する。すなわち図11の画面でジョブ作成ボタン149が押下されたか、又は図12の画面でジョブ作成ボタン159が押下されたかを判定する。ジョブ作成要求があったと判定した場合は処理をステップS532に進め、ジョブ作成要求がなかったと判定した場合はステップS527に処理を進める。ジョブ記憶ステップS532では、中継サーバ15のHDD28に記憶されている履歴情報記憶部320の履歴テーブル(図19)に新たに作成されたジョブの条件情報等を追加して処理をステップS527に進める。追加の時点では結果・条件情報ファイルには検索条件が記憶されており、結果情報は記憶されていない。ジョブが複数(例えば5件)のバッチジョブの1つである場合は検索条件の一部として例えば1−5(5件中の1件目の意味)などのバッチ件数情報も記憶される。
【0053】
ステップS527では、RAM23のワークエリアに記憶されている操作情報を参照して、図4のステップS404において図15の画面で再翻訳ボタン184が押下されたかを判定する。再翻訳ボタン184が押下されたと判定した場合は処理をステップS528に進める。再翻訳ボタン184が押下されなかったと判定した場合は処理をステップS530に進める。ステップS530では、その他の処理とは、例えば図10の画面で管理情報設定・変更ボタン「4」134が押下され、図20に示す接続先情報のURLや接続パラメータファイル内のパラメータの変更処理や図22に示す辞書テーブルのメンテナンスを行う処理や、図14の検索結果画面で表示切替要求ボタン179が押下された場合等を意味する。
【0054】
ステップS528では、RAM23のワークエリアに記憶されている操作情報を参照して、指定されたオプションでの再翻訳を行い、再翻訳結果をRAM23のワークエリアに記憶し、処理をステップS529に進める。ここでのオプションは例えばW翻訳(ルールベース翻訳エンジンによる翻訳と統計ベース翻訳エンジンによる翻訳の両方を実行)や英語データの取得(英訳データの取得又は対応英語公報データの取得)を意味する。W翻訳の場合には異なる複数のルールベース翻訳エンジンを用いても良いし、異なる複数の統計ベース翻訳エンジンを用いても良い。又同じ翻訳エンジンを使用して異なる専門辞書セットを用いて翻訳することも可能である。ステップS528については後に図8のフローチャートで詳しく説明する。
【0055】
ステップS529では、RAM23のワークエリアに記憶された再翻訳結果をレイアウトしてクライアントA11に表示するための表示情報を生成して、クライアントA11に送信する。ステップS503では、ステップS504では、クライアントA11は表示情報を受信してRAM23のワークエリアに記憶し、この表示情報に基づいて図14と同様の画面を表示し、処理をステップS504に進める。ステップS504では、図14のメイン画面ボタン177が押下された場合は図4のステップS402に処理を戻し、再検索ボタン178が押下された場合は図4のステップS404に処理を戻す(この部分はフローチャートに示さず)。以上で図5の説明を終わる。
【0056】
次に図4のステップS430(検索要求生成・送信処理)の詳細を図6のフローチャート等を用いて説明する。図6のステップS621乃至ステップS630、ステップS641乃至ステップS649は中継サーバ15のCPU21の制御の下で実行する処理である。
【0057】
まず、ステップS621では、RAM23のワークエリアに記憶されている操作情報を参照して、要求された検索が、図11の外国公報データによる国内特許調査なのか図12の日本語キーワードによる外国特許調査なのかを判定し、判定結果をRAM23のワークエリアに記憶して処理をステップS622に進める。ステップS622では、ステップS621で外国特許調査と判定した場合処理をステップS623に進め、外国特許調査でないと判定した場合処理をステップS641に進める。
【0058】
まず、外国特許調査でない(従って外国公報データによる日本特許の調査を行う)と判定した場合について説明する(ステップS641乃至ステップS649)。本実施例では図11に示すように中国語の公報データを元にIPCを推定して日本特許の特許DBを検索する。この処理を実行する前の前処理として、以下の処理を行う。まず、IPCの全分野をカバーするのに充分な数n個の特許ドキュメントを収集してコーパスを作成する。実際にはn=約6万であり、nはIPCの全分野をカバーするのに充分な数となっている。コーパスの全ドキュメントを分析し、まず次にn個の各ドキュメントの筆頭特許分類(筆頭IPC)が特定の特許分類である事前確率を計算して図17に示す事前確率テーブルを作成する。ここでカテゴリIDは特許分類(IPC)に1対1に対応し、その総数はn n n n n個となっている。なおIPCを適当な桁数で集約することでn n n n nは数百から数千程度にすることが望ましい。
【0059】
更にコーパスの全ドキュメントからm個の単語を抽出する。mは例えば最大で100万語程度を想定しているため6桁の数字となっており、図16及び図18の単語IDが6桁であることに対応している。又本発明の中継サーバでは最大100言語程度への対応を想定し、1言語あたりの辞書数は最大100辞書程度を想定し図21の辞書マスターの辞書IDは文字Dの後に言語コード2桁と辞書番号2桁の合計4桁を有している。例えば中国語の言語コードは05であり、英語は01、ロシア語は11となっている。更に図22の辞書テーブルの単語IDは言語コード2桁+図16及び図18の単語コード6桁で合計8桁となっている。次にm個の各単語の各IPCにおける出現確率をそれぞれ計算して、図18に示すIPC別の各単語の条件付確率テーブルを作成する。更に特許コーパスに含まれるm個の単語それぞれに対するRIDF=log(n/ni)+log(1-exp(-Fi/n))を計算して図16の重要度テーブルに記憶する。RIDFはいわゆる残差IDFであり、RIDFはポアソン分布が数字や一般的に表れる語である一般語に対して当てはまるが、他方特別な内容を持つ内容語には当てはまらないという観点から、ドキュメントにおける単語の出現頻度にポアソン分布をあてはめて推定したドキュメント頻度と実測値との差を単語の重要度とするものである。上の式中nはコーパスに含まれるドキュメント数、niは単語Wiを含むドキュメント頻度、Fiは単語Wiの特許コーパスにおける頻度である。図16と図17と図18の各テーブルは中継サーバ15のHDD28に記憶する。
【0060】
次に、ステップS641乃至ステップS649の処理について説明する。まずRAM23のワークエリアに記憶されている検索の基礎となる外国公報データ(図11の元データ入力欄143又はファイル参照ボタン144が押下されて指定されたファイル)をRAM23の他のワークエリアに記憶し、処理をステップS642に進める。ステップS642では、処理対象の公報データであるドキュメントdに含まれる各単語の出現頻度とコーパスでの各単語での出現頻度とを用いて以下の式である単語Wiの重要度iを以下の定義で計算する。
重要度i = fi×RIDF
= fi×(log(n/ni)+log(1-exp(-Fi/n)))
ここでfiは単語Wiのドキュメントd(処理対象の公報データ)における頻度であり、nはコーパスに含まれるドキュメント数、niは単語Wiを含むドキュメント頻度、Fiは単語Wiの特許コーパスにおける頻度である。図16に特許コーパスに含まれるm個の単語それぞれに対するRIDFのテーブルを示す。これにより、処理対象の公報データであるドキュメントdに含まれる各単語の重要度iを全て計算することができる。この各単語の重要度iをRAM23のワークエリアに記憶して処理をステップS643に進める。
【0061】
次にステップS643ではドキュメントd(処理対象の公報データ)に含まれる各単語の出現頻度を計算してRAM23のワークエリアに記憶して処理をステップS644に進める。ステップS644では、ステップS643で計算した処理対象の公報データに含まれる各単語の出現頻度と、図18に示す条件付確率テーブルにおける対応する各単語の条件付確率とカテゴリIDをキーとして図17に示す事前確率テーブルを参照し、ドキュメントdがカテゴリIDに属する確率(事後確率)をすべてのカテゴリについて計算し、計算したカテゴリID毎の確率をRAM23のワークエリアに記憶し、処理をステップS645に進める。ステップS645ではRAM23のワークエリアを参照して、最も高い確率を与えるカテゴリIDを特定してこのカテゴリIDに対応する特許分類(IPC)を処理対象の公報データの特許分類と推定する。推定した特許分類をRAM23のワークエリアに記憶して、処理をステップS646に進める。
【0062】
上記の計算を数式で示すと以下の通りである。
ドキュメントdがあるクラスc(カテゴリID)に属する条件付確率を
P(c|d)とすると、ベイズの定理より
【数1】

とかける。ここでtkは語wkの重要度とする。最大事後確率を与えるクラス
Cmapは
【数2】


をドキュメントのクラスと推定する。ここでP^(c)はコーパスから推定されたクラスcの事前確率、P^(tk|c)はコーパスから推定された語wkの条件付確率で、

【数3】

と計算される。Tckはクラスcの属するドキュメントにおける語wkの重要度の総和である。
【0063】
ステップS646では、RAM23のワークエリアに記憶したIPCの所定桁数(図21の辞書マスターの例では3桁でIPCの上3桁はG05)と言語(CN)とをキーとして図21に示す辞書マスターを参照して、翻訳に使用する辞書IDを特定し、この辞書IDをRAM23のワークエリアに記憶してから、処理をステップS647に進める。本実施例では辞書ID=D0502となる。ステップS647では、この辞書IDで特定される辞書テーブルを参照して翻訳を実行する。本実施例では図11の画面でCNを選択していることから中国語の公報データに含まれる重要度の高い単語を数語(通常5語程度)選択して日本語に翻訳して、日本語キーワードをRAM23のワークエリアに記憶し、処理をステップS648に進める。
【0064】
ステップS648では、RAM23のワークエリアに記憶した日本語キーワードの同義語を中継サーバ15のHDD28に記憶されている不図示の同義語辞書から読み出して元々のキーワードと共にRAM23のワークエリアに記憶し、このキーワード及び同義語とRAM23のワークエリアに記憶している推定したIPCとを用いて検索式を生成し、RAM23のワークエリアに記憶して処理をステップS649に進める。ステップS649では、接続先である日本特許の特許DB(本実施例では特許庁電子図書館)への接続先URL及び接続パラメータを、接続先ID(本実施例ではPD0001)をキーにして図20に示す(HDD28の接続先情報記憶部325に記憶されている)接続先情報テーブルおよび接続パラメータファイルから読み出して、接続先の特許DB(特許DBサーバR18)に送信し、折り返し検索条件入力画面情報を特許DBサーバR18から受信した後、RAM23のワークエリアに記憶した検索式を送信して処理を終了する。以上で、図6において外国公報データによる日本特許の調査を行う場合の処理の説明を終了する。
【0065】
次に図6で外国特許調査を行う場合について説明する(ステップS623乃至ステップS631)。ステップS622では、ステップS621で外国特許調査と判定した場合処理をステップS623に進める。ステップS623では、図12の画面で、IPC入力欄154でIPCが指定されているかを判定するために、RAM23のワークエリアに記憶している操作情報を読み出して変数領域に記憶し、処理をステップS624に進める。ステップS624では、読み出した操作情報に基づいてIPCの指定の有無を判定し、IPCが指定されていないと判定した場合は処理をステップS625に進める。IPCが指定されていると判定した場合は処理をステップS627に進める。
【0066】
ステップS625では、図12の分野指定欄155で分野が選択されたかをRAM23のワークエリアに記憶している操作情報を読み出して判定する。分野指定があると判定した場合は処理をステップS626に進める。分野指定がないと判定した場合は処理をステップS631に進める。 ステップS631では、「IPCを入力するか又は分野の1つを指定してください。」とのエラーメッセージをクライアントA11に送信して、処理を図4のステップS425に戻して処理を終了する(ステップS425で再度図12の画面情報をクライアントA11に送信することになる)。
【0067】
他方、ステップS627では、図12の対象国の指定(図12ではCN)に基づいて国名をキーにして図20の接続先テーブルを参照して、国名から言語(CN)を特定し、この言語と図12の画面の分野指定欄155で指定された分野とをキーにして図21の辞書マスターを参照し、辞書IDを特定して、この辞書ID(実施例ではD0502)をRAM23のワークエリアに記憶して、処理をステップS628に進める。ステップS628では、RAM23のワークエリアに記憶している辞書IDの辞書を用いて、検索式欄153に入力された日本語キーワードをターゲット言語(実施例では中国語)に翻訳してRAM23のワークエリアに記憶し、処理をステップS629に進める。
【0068】
ステップS629では、ターゲット言語に翻訳されたキーワードの同義語を中継サーバ15のHDD28に記憶されている不図示の同義語辞書から読み出して元々のキーワードと共にRAM23のワークエリアに記憶し、このキーワード及び同義語とRAM23のワークエリアに記憶している特定したIPCとを用いて検索式を生成し、RAM23のワークエリアに記憶して処理をステップS630に進める。ステップS630では、接続先である中国特許の特許DB(本実施例ではSIPO)への接続先URL及び接続パラメータを、接続先ID(本実施例ではPD0003)をキーにして図20に示す接続先情報テーブルおよび接続パラメータファイルからから読み出して、接続先の特許DB(特許DBサーバP16)に送信し、折り返し検索条件入力画面情報を特許DBサーバR16から受信した後、RAM23のワークエリアに記憶した検索式を送信して処理を終了する。以上で日本語キーワードによる外国特許の調査を行う場合の処理の説明を終了し、図6の説明を終わる。
【0069】
次に図4のステップS433(表示情報生成・送信処理)の詳細を図7のフローチャートを用いて説明する。図7のステップS720乃至ステップS738は中継サーバ15のCPU21の制御の下で実行する処理である。ステップS720では、特許DBサーバから受信した、検索条件に合致した特許の詳細情報をHDD28に記憶し、処理をステップS721に進める。ステップS721ではRAM23のワークエリアに記憶している操作情報から検索オプションを読み出して、処理をステップS722に進める。ステップS722では、読み出した検索オプションが外国特許検索である(図12の画面で検索条件が入力され検索が実行された)場合は処理をステップS723に進め、外国特許検索でない場合(図11の外国公報データによる日本特許検索の場合)は処理をステップS727に進める。ステップS727では、HDD28に記憶している検索条件に合致した日本特許の詳細情報をRAM23のワークエリアに読み込んで記憶し、処理をステップS728に進める。
【0070】
ステップS723では、RAM23のワークエリアに記憶されている操作情報のうち指定されたIPC又は分野と対象国をキーとして、図21の辞書マスターを参照し、対応する辞書IDをRAM23のワークエリアに記憶して翻訳に用いる辞書を特定し、処理をステップS724に進める。ステップS724ではRAM23のワークエリアに記憶されている操作情報を参照して、操作情報にルールベース翻訳と統計ベース翻訳の両方の翻訳指定が含まれているかを判定し、両方の翻訳指定が含まれている場合は、処理をステップS725に進め、両方の翻訳指定が含まれていない場合は処理をステップS726に進める。ディフォルトの翻訳エンジン指定が統計ベース翻訳エンジンの場合は、ステップS725とステップS726の実行順序は逆になる。
【0071】
ステップS725では、外国特許DBサーバPから受信してHDD28に記憶した検索条件に合致する外国特許の詳細情報を統計ベースの公知の翻訳エンジン(例えばモーゼズ)を用いて日本語に翻訳して翻訳結果をRAM23のワークエリアに記憶し、処理をステップS726に進める。ステップS726では、外国特許DBサーバPから受信した検索条件に合致する外国特許の詳細情報をルールベースの公知の翻訳エンジン(例えば特開2000−330988に開示されている従来技術の機械翻訳エンジン(文を表す文字列に含まれる語を列挙し、文頭から文末まで連なる一連の語に付けられた品詞の列に対して、品詞の配列パターンが一致する文法規則の点数を合計し、得点の高いものを最適解とする形態素解析方法を用いた機械翻訳エンジン)や、クロスランゲージ社製の翻訳エンジン)を用いて、あるいは公知の統計ベースの翻訳エンジン(例えば特開2007−141133の0009段落に開示されているような原言語文と目的言語による対訳文を大規模に準備した対訳コーパスを構築し、この対訳コーパスから翻訳を行う変換ルールとその確率値を求める手法であり、確率値の最も高い変換ルールを適用されるような翻訳結果を求める翻訳エンジン)を用いて日本語に翻訳して翻訳結果をRAM23のワークエリアに記憶し処理をステップS728に進める。
【0072】
ステップS728では、ステップS724ではRAM23のワークエリアに記憶されている操作情報を参照して、操作情報にソート指定(図11の画面のソート指定ボタン142又は図12の画面のソート指定ボタン152が押下されてソート項目と昇順/降順が指定)されたかを判定し、ソート指定された場合は処理をステップS729に進め、ソート指定されていない場合は処理をステップS730に進める。ステップS729では、指定に応じて詳細情報のソート処理を実行し処理をステップS730に進める。
【0073】
ステップS730では、履歴テーブルの結果・条件情報のファイルで特定されるファイル(結果・条件情報ファイル)を1ジョブ毎に新規に作成して、HDD28の履歴情報記憶部320に記憶し、操作情報を含む処理要求情報に含まれるジョブID、開始年月日時刻、ユーザIDの他、キーワード、IPC、ソート指定有無等の操作情報と、ジョブが複数(例えば5件)のバッチジョブの1つである場合は1−5(5件中の1件目の意味)などのバッチ件数情報、特許DBサーバから受信した詳細情報及びその翻訳データも含めて結果・条件情報ファイル(例えばXMLでタグ付けして各種情報を区別する)に記憶し、処理をステップS731に進める。ステップS731では、処理が正常に実行されている場合、図19に示す履歴テーブルの「ステータス」を、実行中を意味する0(初期値)から、正常終了を意味する1に更新する。検索結果が1件もないとか、特許DBサーバへの接続を失敗したなど処理が異常終了した場合は異常終了を意味する2に更新して処理をステップS732に進める。
【0074】
ステップS732では、RAM23のワークエリアに記憶されている操作情報を参照して、操作情報にバッチジョブの実行を指示する情報が含まれるかを判定し、バッチジョブが指示されていた場合は処理をステップS733に進め、バッチジョブが指示されていない場合は処理をステップS734に進める。ステップS733では履歴テーブルのバッチ件数情報を参照し、バッチジョブが未完了の場合は図4のステップS430に処理を戻す。バッチジョブが完了した場合(例えばバッチ件数情報5−5のジョブが完了した場合)は処理をステップS734に進める。
【0075】
ステップS734では、RAM23のワークエリアに記憶されている操作情報を参照して処理をステップS735に進める。ステップS735では、結果表示に関連する指定(例えばW翻訳指定がされているか等)を読込んで、この指定に応じたクライアントA11の画面に検索結果を表示するための表示情報をレイアウトを含めて生成しRAM23のワークエリアに記憶して、処理をステップS736に進める。ステップS736では、RAM23のワークエリアに記憶した表示情報をクライアントA11に送信して処理をステップS737に進める。ステップS737では、履歴テーブルのバッチ件数情報を参照して今回のジョブがバッチジョブであるかを判定し、バッチジョブの場合は処理をステップS738に進め、バッチジョブでない場合は処理を終了する。ステップS738ではHDD28又は他の不図示人事サーバに記憶されているユーザマスタをユーザIDをキーにして照会して当該ユーザIDに対応する電子メールアドレスを読み出し、当該ユーザIDの電子メールアドレス宛に一連のジョブの完了を通知する電子メールを送信して処理を終了する。以上で図7の説明を終わる。
【0076】
次に図5のステップS528の再翻訳処理の詳細を図8のフローチャートで説明する。図8のステップS1121乃至ステップS1130は中継サーバ15のCPU21の制御の下で実行する処理であり、図15の画面で再翻訳ボタン184が押下された場合に実行する処理である。ステップS1141乃至ステップS1146は特許DBサーバのCPU21の制御の下で実行する処理である。
【0077】
ステップS1121では、RAM23のワークエリアに記憶されている操作情報を参照して再翻訳の要求でW翻訳(ルールベース翻訳エンジンによる翻訳と統計ベース翻訳エンジンによる翻訳の両方)が要求されているかを判定し、W翻訳が要求されている場合には処理をステップS1122に進め、W翻訳が要求されていない場合には処理をステップS1124に進める。ステップS1122では、図19に示す履歴情報テーブルの結果・条件情報を参照して、前回実行時の翻訳指定を参照し翻訳が不足しているかを判定して処理をステップS1123に進める。ステップS1123では、不足分があれば結果・検索情報の特許DBサーバから受信した詳細情報とIPC情報とを用いて追加翻訳を実行して処理をステップS1124に進める。
【0078】
S1124では、ステップS1121では、RAM23のワークエリアに記憶されている操作情報を参照して再翻訳の要求で英語データ(当該公報の対応するWIPOやUSPTO英語公報又は当該公報自体の英訳データ)が要求されているかを判定し、英語データが要求されている場合には処理をステップS1125に進め、英語データが要求されていない場合には処理をステップS1127に進める。ステップS1125では、中継サーバ15は図20に示す接続先情報テーブルを参照して、英語データを記憶している特許DBサーバへの接続要求を送信する。ステップS1141では、英語データを記憶している特許DBサーバは接続要求を受信し、処理をステップS1142に進める。ステップS1142では、認証画面情報を中継サーバ15に送信する。ステップS1126では、中継サーバ15は受信した認証画面情報をRAM23のワークエリアに記憶し、処理をステップS1127に進める。
【0079】
ステップS1127では、中継サーバ15は受信した認証画面情報に応じて図20に示す接続先情報テーブルの接続パラメータファイルを参照して、認証情報を、英語データを記憶している特許DBサーバに送信する。ステップS1143では、英語データを記憶している特許DBサーバ認証情報を受信してユーザID及びパスワードが合致しているかの認証処理を行い、処理をステップS1144に進める。ステップS1144では、DB検索のための画面情報を中継サーバ15に送信する。ステップS1128では、中継サーバ15は画面情報を受信し、受信した画面情報に応じて図20に示す接続先情報テーブルの接続パラメータファイルを参照し、接続パラメータと英語データを要求している公報番号を含む照会情報を生成して、ステップS1129に処理を進める。ステップS1129では、この照会情報を、英語データを記憶している特許DBサーバに送信する。
【0080】
ステップS1145では、英語データを記憶している特許DBサーバは照会情報を受信し、公報番号をキーにして対応する英語特許データを読み出してRAM23のワークエリアに記憶し、処理をステップS1146に進める。ステップS1146では、英語特許データを中継サーバ15に送信する。ステップS1130では、中継サーバは英語特許情報をRAM23のワークエリアに記憶し、処理を終了する。以上で図8の説明を終わる。
【0081】
ステップS1221では、RAM23のワークエリアに記憶されている操作情報を参照して接続しようとしている特許DBサーバを特定し、次にRAM23の中のセッションメモリ(特許DBサーバに接続してセッションが確立しようとする際に、当該特許DBサーバとの通信や各種パラメータ記憶用にRAM23に割り当てられ、セッション維持中は確保されているメモリ領域)を参照して、当該特許DBサーバとのセッションが維持されているか(既に接続されそれが維持されているか)を判定し、接続済みでセッションが維持されている場合は図4のステップS430(特許検索要求生成・送信)に処理を戻す。接続済みでないか又はセッションが維持されていない場合は、処理をステップS1222に進める。
【0082】
ステップS1222では、図20の接続先情報テーブルを参照してURLや接続パラメータをRAM23のワークエリアに記憶し、処理をステップS1223に進める。ステップS1223では、RAM23のワークエリアに記憶しているURLや接続パラメータに基づいて接続要求を生成してRAM23のワークエリアに記憶し、処理をステップS1224に進める。ステップS1224では、接続しようとしている特許DBサーバに、接続要求を送信して、処理をステップS1225に進める。
【0083】
ステップS1225では、接続しようとしている特許DBサーバから認証画面情報を受信してRAM23のワークエリアに記憶し、処理をステップS1226に進める。ステップS1226では、受信した認証画面情報に応じて、接続先情報テーブルを参照して、接続しようとしている特許DBサーバに、認証情報を送信する。以上で図9の説明を終わる。以上の実施例で説明した本発明は中継サーバ15を制御するフローチャート図4乃至図9に記載の制御プログラムを記憶媒体や通信回線を介した通信媒体で提供した場合も含むことは勿論であり、これらのフローチャートで実行する各制御ステップを中継サーバで実行する制御方法も本発明に含まれる。
【産業上の利用可能性】
【0084】
本発明の中継サーバは既存の複数の特許データベース及び複数のクライアント端末と接続して多言語対応の特許検索サービスを提供する中継装置として好適である。
【符号の説明】
【0085】
10 ネットワーク
15 中継サーバ
11 クライアントA
12 クライアントB
13 クライアントC
15 中継サーバ
16 特許DBサーバP
17 特許DBサーバQ
18 特許DBサーバR
20 システムバス
21 CPU
22 ROM
23 RAM
28 HDD
305 接続制御部
310 操作情報判定部
315 履歴参照部
320 履歴情報記憶部
325 接続先情報記憶部
330 重要度算出部
335 IPC判定部
340 翻訳処理部A
345 検索式生成部
350 接続要求生成部
355 KW・IPC記憶部
360 辞書情報記憶部
365 翻訳処理部B
370 ソート処理部
375 表示情報生成部

【特許請求の範囲】
【請求項1】
クライアント端末及び特許データベースサーバと通信可能に構成された中継サーバであって、
前記クライアント端末より受信した検討対象特許データから重要語を抽出するために検討対象特許データの各単語の重要度を算出する重要度算出手段と、
前記重要度に基づいて抽出された重要語を用いて前記検討対象特許データの特許分類を判定する第1の特許分類判定手段と、
前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて前記重要語を所望の言語に翻訳する第1の翻訳処理手段と、
前記所望の言語に翻訳された重要語を用いて検索式を生成する第1の検索式生成手段と、
前記所望の言語に応じた接続先である特許データベースサーバに対して、前記接続先に応じた接続要求を生成する第1の接続要求生成手段とを備えることを特徴とする中継サーバ。
【請求項2】
クライアント端末及び特許データベースサーバと通信可能に構成された中継サーバであって、
前記クライアント端末より、入力されたキーワードを用いて特許分類を判定する第2の特許分類判定手段と、
前記所望の言語に翻訳されたキーワードを用いて検索式を生成する第2の検索式生成手段と、
前記所望の言語に応じた接続先である前記特許データサーバに対して、前記接続先に応じた接続要求を生成する第2の接続要求生成手段と
前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて前記特許データベースサーバより取得した検索データを所望の言語に翻訳する第2の翻訳処理手段と、
を備えることを特徴とする中継サーバ。
【請求項3】
前記第2の翻訳処理手段は、コーパス分析を行った結果を蓄積し該蓄積したコーパス分析結果を用いて統計処理を行うことで翻訳を実行する統計ベースの翻訳エンジンと、所定の翻訳ルールを適用して形態素解析を行い単語に分割した原文を翻訳をするルールベースの翻訳エンジンとを備え、前記統計ベースの翻訳エンジンの翻訳実行結果と前記ルールベースの翻訳エンジンの翻訳実行結果とを、前記クライアントの画面に対比して表示するための表示情報を生成する生成手段を更に備えることを特徴とする請求項2に記載の中継サーバ。
【請求項4】
前記統計ベースの翻訳エンジンの翻訳対象特許データ又は前記ルールベースの翻訳エンジンの翻訳対象特許データに対応する英文データを前記特許データベースより取得する英文取得手段を更に備え、前記表示情報生成手段は、前記統計ベースの翻訳エンジンの翻訳実行結果と前記ルールベースの翻訳エンジンの翻訳実行結果の少なくともいずれか1つと、前記取得した英文データとを前記クライアントの画面に対比して表示するための表示情報を生成することを特徴とする請求項3に記載の中継サーバ。
【請求項5】
クライアント端末及び特許データベースサーバと通信可能に構成された中継サーバの制御方法であって、
前記クライアント端末より受信した検討対象特許データから重要語を抽出するために検討対象特許データの各単語の重要度を算出する重要度算出ステップと、
前記重要度に基づいて抽出された重要語を用いて前記検討対象特許データの特許分類を判定する第1の特許分類判定ステップと、
前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて前記重要語を所望の言語に翻訳する第1の翻訳処理ステップと、
前記所望の言語に翻訳された重要語を用いて検索式を生成する第1の検索式生成ステップと、
前記所望の言語に応じた接続先である特許データベースサーバに対して、前記接続先に応じた接続要求を生成する第1の接続要求生成ステップとを備えることを特徴とする中継サーバの制御方法。
【請求項6】
クライアント端末及び特許データベースサーバと通信可能に構成された中継サーバの制御プログラムであって、
前記中継サーバを、
前記クライアント端末より受信した検討対象特許データから重要語を抽出するために検討対象特許データの各単語の重要度を算出する重要度算出手段と、
前記重要度に基づいて抽出された重要語を用いて前記検討対象特許データの特許分類を判定する第1の特許分類判定手段と、
前記判定した特許分類を用いて専門辞書を特定し、該特定した専門辞書を用いて前記重要語を所望の言語に翻訳する第1の翻訳処理手段と、
前記所望の言語に翻訳された重要語を用いて検索式を生成する第1の検索式生成手段と、
前記所望の言語に応じた接続先である特許データベースサーバに対して、前記接続先に応じた接続要求を生成する第1の接続要求生成手段として機能させるための制御プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate