説明

画像検索システム、画像検索方法および画像検索プログラム

【課題】スキャナにより読み込んだ文書画像を検索時に呼び出す場合において、システムへの負荷を大幅に減らし、検索、閲覧そしてダウンロードや編集のスピードを向上させるシステムの提供。
【解決手段】スキャナにより読み込まれた文書画像データをタグ形式画像フォーマットへ変換する際、頁毎の個別画像ファイルを生成し、これにOCR処理を施して得たテキストデータファイルを前記画像ファイルと共通の識別子と、文字座標情報を付与して保存し、検索要求を受けた際、検索文字と一致した文字情報を有するテキストファイルと共通する識別子を持つ画像ファイルを呼び出し、検索対象を強調して表示することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、紙文書を従来に比べて短時間で電子文書化するとともに、電子化された文書の検索、閲覧そしてダウンロードや編集といった資料の活用場面において優れた操作性を備えた画像検索システム、画像検索方法およびプログラムに関する。
【背景技術】
【0002】
企業にとって、過去から現在、そして将来に亘って膨大な資料を効率的に運用し、永続的に保存することは重要な課題の一つとなっている。そこで近年、紙資料を電子化する取り組みが進んでおり、2005年4月より施行された「e−文書法」によりその流れは一層顕著なものとなった。
【0003】
紙文書の電子化技術はもとより、電子化後の資料活用場面を見越して検索や閲覧そしてダウンロードに係る技術につき数々の取り組みが見られる。
【0004】
既に公開されている技術であって、スキャナで読み取った文書画像データに、OCR(Optical Character Recognition)処理を経て得た文字コードを合成し、PDF(Portable Document Format)を生成する技術が開示されている(例えば、特許文献1参照。)。
【0005】
当該発明は、文書にOCRコードと電子透かしを同時に埋め込む技術に関する発明であり、文字認識を、電子透かしを埋め込む前に行うことで精度の高い検索インデックスを生成可能とするものである。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2006−166091号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記文献に開示されたPDFを生成する技術によれば、検索時、所望のキーワードを含んだ特定のページを含むファイル全体をダウンロードする必要がある。例えば、当該ファイルが100枚から構成されている場合には、必要な一頁を閲覧等するために当該ファイル全体をダウンロードしなければならない。しかしこれはシステム全体に過分な負荷をかけるととともに、閲覧可能となるまでの待機時間も長くなり、改善の余地があるとされてきた。
【0008】
そこで、本発明は、スキャナにより読み込んだ文書画像を検索時に呼び出す場合等において、システムへの負荷を大幅に減らし、検索、閲覧そしてダウンロードや編集スピードを向上させることを課題とする。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明は次の構成とした。即ち、請求項1に記載の画像検索システムは、光学的読取手段により文書画像の画像データを入力する画像入力手段と、入力された画像データをタグ形式画像フォーマットへと変換し、かつ頁毎の個別画像ファイルαを生成する画像ファイル生成手段と、生成された画像ファイルαから文字画像を認識し、文字コードを取得する文字認識手段と、取得された文字コードに基づきテキストファイルへと変換するテキストファイル変換手段と、文字画像認識時に画像ファイルα上の座標軸に基づき文字位置を特定する座標情報を取得し、画像ファイルαの付加情報として付与する座標付与手段と、座標情報が付与された画像ファイルβおよび特定の画像ファイルβに対応するテキストファイルに夫々共通の識別子を付与する識別子付与手段と、画像ファイルβを格納する画像データ格納手段と、テキストファイルを格納するテキストフファイル格納手段とを有しており、ユーザ端末からの検索命令を受けて検索対象となる文字をテキストファイルに基づき照合し、これと一致した場合には、一致したテキストファイルと共通する識別子を持つ画像ファイルβを呼び出す検索手段と、呼び出された画像ファイルβに付与された座標情報に基づき、検索対象文字位置を認識し、これを強調して表示する文字強調表示手段とを備え、ユーザ端末からのアクセス要求に対して、閲覧許可・ダウンロード許可・データ配信のいずれかを行うユーザーアクセス許可手段とを備えたことを特徴とする。
【0010】
請求項2に記載の画像検索方法は、光学的読取手段により文書画像の画像データを入力するステップと、入力された画像データをタグ形式画像フォーマットへと変換し、かつ頁毎の個別画像ファイルαを生成するステップと、生成された画像ファイルαから文字画像を認識し、文字コードを取得するステップと、取得された文字コードに基づきテキストファイルへと変換するステップと、文字画像認識時に画像ファイルα上の座標軸に基づき文字位置を特定する座標情報を取得し、画像ファイルαの付加情報として付与するステップと、座標情報が付与された画像ファイルβおよび特定の画像ファイルβに対応するテキストファイルに夫々共通の識別子を付与するステップと、画像ファイルβを格納するステップと、テキストファイルを格納するステップと、ユーザ端末からの検索命令を受けて検索対象となる文字をテキストファイルに基づき照合し、これと一致した場合には、一致したテキストファイルと共通する識別子を持つ画像ファイルβを呼び出すステップと、呼び出された画像ファイルβに付与された座標情報に基づき、検索対象文字位置を認識し、これを強調して表示するステップとユーザー端末からのアクセス要求に対して、閲覧許可・ダウンロード許可・データ配信のいずれかを行うステップとからなることを特徴とする。
【0011】
請求項3に記載の画像検索プログラムは、ユーザ端末が通信網を介してアクセス可能な画像検索システムにおいて実行されるプログラムであって、当該システムを、光学的読取手段により文書画像の画像データを入力する画像入力手段と、入力された画像データをタグ形式画像フォーマットへと変換し、かつ頁毎の個別画像ファイルαを生成する画像ファイル生成手段と、生成された画像ファイルαから文字画像を認識し、文字コードを取得する文字認識手段と、取得された文字コードに基づきテキストファイルへと変換するテキストファイル変換手段と、文字画像認識時に画像ファイルα上の座標軸に基づき文字位置を特定する座標情報を取得し、画像ファイルαの付加情報として付与する座標付与手段と、座標情報が付与された画像ファイルβおよび特定の画像ファイルβに対応するテキストファイルに夫々共通の識別子を付与する識別子付与手段と、画像ファイルβを格納する画像データ格納手段と、テキストファイルを格納するテキストフファイル格納手段とを有しており、ユーザ端末からの検索命令を受けて検索対象となる文字をテキストファイルに基づき照合し、これと一致した場合には、一致したテキストファイルと共通する識別子を持つ画像ファイルβを呼び出す検索手段と、呼び出された画像ファイルβに付与された座標情報に基づき、検索対象文字位置を認識し、これを強調して表示する文字強調表示手段とを備え、ユーザ端末からのアクセス要求に対して、閲覧許可・ダウンロード許可・データ配信のいずれかを行うユーザーアクセス許可手段として機能させることを特徴とする。
【発明の効果】
【0012】
本発明によれば、タグ形式の画像フォーマット、即ちTIFF(Tagged Image File Format)へと変換し、すべて頁毎の個別画像ファイルとして生成することから、そして、公知の圧縮技術との併用、さらには独自の通信モジュールにより、検索時におけるシステムへの負荷を大幅に減らすことが可能となり、その結果、閲覧やダウンロード、そして編集時のアップロードのスピードを格段に向上させることが可能となった。
【図面の簡単な説明】
【0013】
【図1】本実施例における電子文書登録処理の流れを示す図
【図2】本発明の利用態様を示す図
【図3】本発明のシステム構成を示す図
【図4】検索時の操作画面を示す図
【図5】検索結果を表示した画面を示す図
【図6】本発明と従来技術との効果の相違を示す図
【図7】本発明と従来技術との効果の相違を示す図
【図8】本発明の異なる実施例のシステム構成を示す図
【図9】本発明の異なる実施例の検索画面を示す図
【発明を実施するための形態】
【0014】
本発明の第一の実施例を図面に基づいて説明する。
本実施例は、紙文書を電子化して登録するに至るまでのシステム内の処理に関するものである。
【0015】
図中、1はサーバ、2はユーザ端末、3は通信ネットワーク、10はバス、11は中央処理装置、12は記憶装置、13はスキャナ、14はOCR、15は通信回路である。
【0016】
本システムは、コンピュータシステム上で所望の処理プログラムを実行させるべく必要なハードウエア群から構成される。
サーバ1においては、中央処理装置12、記憶装置14(主記憶装置、補助記憶装置を含む概念である。)がバス10を介してデータ転送可能に接続され、ユーザ端末とのデータ通信に必要なモデムやTA(Terminal Adopter)その他これに類する通信装置15を備える。かかる構成により、ユーザ端末との間で必要なデータの送受信を行う。
【0017】
中央処理装置110は制御部と演算部とからなり(図示せず。)、該制御部は主記憶装置(図示せず。)内に格納された処理プログラムの各命令を取り出し、解読し、命令に従って実行の制御やデータの制御、入出力の制御などを行い、該演算部はすべての演算処理を行う。そして主記憶装置はプログラムやこれに関連するデータ、演算途中結果を記憶し、補助記憶装置(図示せず。)はハードディスクその他光磁気ディスク、USBメモリその他これに類する記憶処理を司るハードウエアであり、本システムの機能確保若しくは充実させるために適宜構成させることが可能である。
【0018】
その他、通常コンピュータシステムを利用する際に用いられる入出力装置(図示せず。)を当然に備え、入力装置はキーボードやマウスのほか、ペンタブレット、タッチパネル、音声入力装置その他コンピュータにデータを入力する機能を備えた装置であって、サーバ1の保守や管理、データの入力、変更を行う際に利用される。出力装置とはディスプレイ、プリンタ、スピーカーといったコンピュータ内で処理されたデータを情報として人間が認識できる形で出力する装置を指す。また、オペレータが諸データを認識すべく表示装置もまた当然に本システムを構成するものである。
【0019】
ユーザ端末2はパーソナルコンピュータのほか、PDA(Personal Digital Assistant)と呼ばれる携帯情報端末その他これに類するものであって、インターネット、イントラネット等の通信ネットワークを介してサーバ1とデータ通信可能な機能を有する端末装置をいう。なお、利用態様によっては、ユーザ端末2に代えて携帯電話を利用することとしても良い。
【0020】
上記システム構成により、後述する本発明の実施に必要な処理を実現する。
【0021】
画像入力手段とは、スキャナ等の光学的読取手段で走査することにより文書の画像データを取り込む機能をいう。
【0022】
画像ファイル生成手段とは、前記画像入力手段により取り込まれた画像データをTIFF(Tagged Image File Format)へと変換し、これを頁毎の個別画像ファイル(以下、画像ファイルαと称す。)を生成する機能をいう。
【0023】
文字認識手段とは、いわゆるOCR機能を指し、前記画像ファイル生成手段により生成された画像ファイルαから文字画像を認識して文字コードを取得する機能をいう。
【0024】
テキストファイル変換手段とは、前記文字認識手段により取得された文字コードに基づきテキストファイルへと変換する機能をいう。
【0025】
座標付与手段とは、前記文字認識手段により認識される文字画像の画像ファイルα上の座標軸に基づき文字位置を特定する座標情報を、画像ファイルαの付加情報として付与する機能をいう。
【0026】
識別子付与手段とは、前記画像ファイルαおよび当該画像ファイルαに対応するテキストファイルの夫々に、検索時に関連付けて読み出し可能とすべく共通の識別子を付与する機能をいう。
【0027】
画像ファイル変換手段とは、座標情報および識別子を付与された画像ファイルαを、画像ファイルβへと変換する機能をいう。
【0028】
画像ファイル格納手段とは、画像ファイルβを記憶装置に格納する機能をいう。
【0029】
テキストファイル格納手段とは、テキストファイルを記憶装置に格納する機能をいう。
【0030】
検索手段とは、ユーザ端末からの検索命令を受けて、検索対象となる文字をテキストファイルに基づき照合し、これと一致した場合には、一致したテキストファイルと共通する識別子を持つ画像ファイルβを呼び出す機能をいう。
【0031】
文字強調表示手段とは、前記検索手段により呼び出された画像ファイルβに付与された座標情報に基づき、検索対象文字位置を認識し、これにハイライトを付すなど強調して表示する機能をいう。
【0032】
ユーザアクセス許可手段とは、ユーザ端末からのアクセス要求に対して、パスワードやIDといった情報を照合の上、閲覧を許可したり、ダウンロードを許可したり、許可した端末へ向けてデータを配信したりする機能をいう。
【0033】
次に紙文書を電子化して登録するに至るまでのシステム処理の流れを説明する。
まず、電子化する文書をスキャナなどの光学的読取手段により走査し、画像データをキャッシュメモリ等へ一時的に保存する(S101)。
【0034】
前記一時的に保存された画像データは、画像ファイル生成手段により、TIFF(Tagged Image File Format)へと変換され、頁毎の個別画像ファイルαが生成される(S102)。
【0035】
前記生成された画像ファイルαから、文字認識手段により文字画像が認識され、対応する文字コードが取得される(S103)。そして、取得された文字コードに基づきテキストファイルへと変換される(S104)。
【0036】
前記文字認識時、座標付与手段により画像ファイルα上の座標軸に基づき文字位置を特定する座標情報が取得され、当該座標情報を画像ファイルαの付加情報として付与される(S105)。
【0037】
そして、識別子付与手段により座標情報が付与された画像ファイルαと、当該画像ファイルαに対応するテキストファイル、即ち当該画像ファイルαがOCR処理された結果得られたテキストファイルの夫々に、共通の識別子が付与される(S106)。
【0038】
座標情報および識別子が付与された画像ファイルαは、画像ファイル変換手段により、画像ファイルβへと変換される(S107)。
【0039】
画像ファイルβおよびこれに対応するテキストデータは、夫々記憶装置内に格納される(S108)。
【0040】
次に検索処理の流れについて説明する。サーバ1はネットワーク3を介してユーザ端末2から送られてくる検索要求を受け、以下の処理を経て検索結果を配信する。
【0041】
まず、図4に示すように、ユーザ端末の検索画面において、所望のキーワードを検索キーワード入力領域20へ入力する。ここでは、「文書法」および「電子化」の2つのキーワードを共に含む文書を検索するものとする。なお、「AND検索」「OR検索」の別は、検索キーワード入力領域20の右側のプルダウンメニューにおいて選択可能である。
【0042】
ユーザ端末2から検索要求を受けたサーバ1は、検索手段により「文書法」「電子化」の両語句を含むテキストファイルを、テキストファイル格納手段に格納されているテキストファイル群の中から抽出する。さらに条件を満たすテキストファイルの識別子を認識し、これと共通する識別子が付与された画像ファイルβを、画像ファイル格納手段に格納されている画像ファイルβ群の中から抽出する。
【0043】
そして、文字強調手段は、抽出された画像ファイルβに付加情報として付与された座標情報に基づき、当該検索語句に対応する座標領域をハイライト表示21すべく強調命令を伴って、ユーザ端末へ配信する(図5)。
【0044】
本発明によれば、極めて短時間に検索対象を抽出することが可能である。図6において、PDFを利用した従来技術と本発明とを比較した。本発明(図6(A))によれば、所望のキーワードを含む画像文書ファイル一頁のみダウンロード可能である。よって、PDFを利用した従来の検索システム(図6(B))と比較して、システムへの負荷が格段に少なくなることがわかる。したがって、所望のファイルの抽出、閲覧、ダウンロードに要する時間を大幅に短縮することができるようになった。
【0045】
また、本発明の発展的な利用によれば、極めて効率的に編集作業を行うことも可能である。図7において、PDFを利用した従来技術と本発明とを比較した。本発明(図7(A))によれば、所望のキーワードを含む画像文書ファイル一頁のみをダウンロードして編集可能である。よって、全ページをダウンロードする必要があるPDFを利用した従来の検索システム(図7(B))と比較して、システムへの負荷が格段に少なくなることがわかる。したがって、ファイルの編集作業についても極めて効率的に行うことができるようになるものである。
【産業上の利用可能性】
【0046】
本発明は、今後益々重要となる紙文書の電子化業務に際し、迅速な処理が求められる場面において極めて優れた産業上利用可能な発明であるといえる。
【符号の説明】
【0047】
1 サーバ
2 ユーザ端末
3 通信ネットワーク
10 バス
11 中央処理装置
12 記憶装置
13 スキャナ
14 OCR
15 通信回路
20 検索キーワード入力領域
21 ハイライト部


【特許請求の範囲】
【請求項1】
ユーザ端末が通信網を介してアクセス可能な画像検索システムであって、
当該システムは、
光学的読取手段により文書画像の画像データを入力する画像入力手段と、
入力された画像データをタグ形式画像フォーマットへと変換し、かつ頁毎の個別画像ファイルαを生成する画像ファイル生成手段と、
生成された画像ファイルαから文字画像を認識し、文字コードを取得する文字認識手段と、
取得された文字コードに基づきテキストファイルへと変換するテキストファイル変換手段と、
文字画像認識時に画像ファイルα上の座標軸に基づき文字位置を特定する座標情報を取得し、画像ファイルαの付加情報として付与する座標付与手段と、
座標情報が付与された画像ファイルαおよび当該画像ファイルαに対応するテキストファイルの夫々に共通の識別子を付与する識別子付与手段と、
座標情報および識別子が付与された画像ファイルαを画像ファイルβへと変換する画像ファイル変換手段と、
画像ファイルβを記憶装置に格納する画像ファイル格納手段と、
テキストファイルを記憶装置に格納するテキストフファイル格納手段とを有しており、
ユーザ端末からの検索命令を受けて
検索対象となる文字をテキストファイルに基づき照合し、これと一致した場合には、一致したテキストファイルと共通する識別子を持つ画像ファイルβを呼び出す検索手段と、
呼び出された画像ファイルβに付与された座標情報に基づき、検索対象文字位置を認識し、これを強調して表示する文字強調表示手段とを備え、
ユーザ端末からのアクセス要求に対して、閲覧許可・ダウンロード許可・データ配信のいずれかを行うユーザーアクセス許可手段とを備えたことを特徴とする画像検索システム。
【請求項2】
ユーザ端末が通信網を介してアクセス可能な画像検索方法であって、
光学的読取手段により文書画像の画像データを入力するステップと、
入力された画像データをタグ形式画像フォーマットへと変換し、かつ頁毎の個別画像ファイルαを生成するステップと、
生成された画像ファイルαから文字画像を認識し、文字コードを取得するステップと、
取得された文字コードに基づきテキストファイルへと変換するステップと、
文字画像認識時に画像ファイルα上の座標軸に基づき文字位置を特定する座標情報を取得し、画像ファイルαの付加情報として付与するステップと、
座標情報が付与された画像ファイルαおよび当該画像ファイルαに対応するテキストファイルの夫々に共通の識別子を付与するステップと、
座標情報および識別子が付与された画像ファイルαを画像ファイルβへと変換するステップと、
画像ファイルβを記憶装置に格納するステップと、
テキストファイルを記憶装置に格納するステップと、
ユーザ端末からの検索命令を受けて
検索対象となる文字をテキストファイルに基づき照合し、これと一致した場合には、一致したテキストファイルと共通する識別子を持つ画像ファイルβを呼び出すステップと、
呼び出された画像ファイルβに付与された座標情報に基づき、検索対象文字位置を認識し、これを強調して表示するステップと
ユーザ端末からのアクセス要求に対して、閲覧許可・ダウンロード許可・データ配信のいずれかを行うステップとからなる画像検索方法。
【請求項3】
ユーザ端末が通信網を介してアクセス可能な画像検索システムにおいて実行されるプログラムであって、当該システムを、
光学的読取手段により文書画像の画像データを入力する画像入力手段と、
入力された画像データをタグ形式画像フォーマットへと変換し、かつ頁毎の個別画像ファイルαを生成する画像ファイル生成手段と、
生成された画像ファイルαから文字画像を認識し、文字コードを取得する文字認識手段と、
取得された文字コードに基づきテキストファイルへと変換するテキストファイル変換手段と、
文字画像認識時に画像ファイルα上の座標軸に基づき文字位置を特定する座標情報を取得し、画像ファイルαの付加情報として付与する座標付与手段と、
座標情報が付与された画像ファイルαおよび当該画像ファイルαに対応するテキストファイルの夫々に共通の識別子を付与する識別子付与手段と、
座標情報および識別子が付与された画像ファイルαを画像ファイルβへと変換する画像ファイル変換手段と、
画像ファイルβを記憶装置に格納する画像ファイル格納手段と、
テキストファイルを記憶装置に格納するテキストフファイル格納手段とを有しており、
ユーザ端末からの検索命令を受けて
検索対象となる文字をテキストファイルに基づき照合し、これと一致した場合には、一致したテキストファイルと共通する識別子を持つ画像ファイルβを呼び出す検索手段と、
呼び出された画像ファイルβに付与された座標情報に基づき、検索対象文字位置を認識し、これを強調して表示する文字強調表示手段とを備え、
ユーザ端末からのアクセス要求に対して、閲覧許可・ダウンロード許可・データ配信のいずれかを行うユーザーアクセス許可手段として機能させることを特徴とする画像検索プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−170393(P2011−170393A)
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【出願番号】特願2010−10354(P2010−10354)
【出願日】平成22年1月20日(2010.1.20)
【出願人】(509328836)アイ・エヌ・ティ株式会社 (2)
【Fターム(参考)】