説明

原稿読取装置、情報処理装置及び情報処理装置用のプログラム

【課題】 原稿読取装置の製造コストを増大させることなく、イメージデータを自動的にOCR処理させることができる原稿読取装置を提供する。
【解決手段】 原稿を光学的に読み取り、読取画像を生成する光学読取部と、読取画像を保持する読取画像記憶部と、イメージデータに含まれる文字を認識することにより、複数の文字コードからなるコードデータを生成するOCR処理部を有する外部機器へ読取画像を送信する読取画像送信部と、外部機器が読取画像を文字認識して得たコードデータを受信するコードデータ受信部と、受信したコードデータ及び読取画像を関連付けることにより、コードデータを利用して文字検索可能な出力データを生成する出力データ生成部により構成される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、原稿読取装置、情報処理装置及び情報処理装置用のプログラムに係り、さらに詳しくは、原稿を光学的に読み取って読取画像を生成する原稿読取装置と、この原稿読取装置と通信する情報処理装置に関する。
【背景技術】
【0002】
一般に、スキャナなどの読取装置を用いて原稿から読み取ったイメージデータは、画面表示させなければデータ内容を確認することができない。このため、複数のイメージデータの中から所望の文字列を含むイメージデータを抽出することは容易ではなかった。そこで、イメージデータをOCR(Optical Character Recognition:光学文字認識)処理し、イメージデータに含まれる文字を認識することにより、一連の文字コードからなるコードデータが生成される。そして、そのコードデータとイメージデータとを関連付けて保持することが従来から行われていた。この様にすれば、コードデータを利用して文字検索することができるので、所望の文字列を含むイメージデータを容易に抽出することができる。
【0003】
従来の画像処理システムでは、読取装置により読み取られたイメージデータが、OCR機能を有するPC(パーソナルコンピュータ)などの情報処理装置に転送され、OCR処理してコードデータが作成される(例えば、特許文献1及び2)。その際、情報処理装置では、所定の操作により、OCR用のアプリケーションプログラムを起動させ、OCR対象とするイメージデータを指定し、さらに、作成されたコードデータの転送先としてイメージデータの送信元を指定しなければならなかった。このため、イメージデータをOCR処理させる際の使い勝手が良くないという問題があった。
【0004】
そこで、読取装置において、原稿から読み取ったイメージデータを自動的にOCR処理させることが考えられる。しかし、読取装置においてOCR処理させるには、高速かつ高機能なプロセッサを実装しなければならず、読取装置の製造コストが増大してしまうという問題があった。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−205515号公報
【特許文献2】特開2010−9130号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、上記事情に鑑みてなされたものであり、原稿から読み取られた読取画像から文字検索可能な出力データを作成する際の操作性を向上させた原稿読取装置、情報処理装置及び情報処理装置用のプログラムを提供することを目的とする。特に、原稿読取装置の製造コストを顕著に増大させることなく、読取画像を自動的にOCR処理させることができる原稿読取装置、情報処理装置及び情報処理装置用のプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
第1の本発明による原稿読取装置は、原稿を光学的に読み取り、読取画像を生成する光学読取部と、上記読取画像を保持する読取画像記憶部と、イメージデータに含まれる文字を認識することにより、2以上の文字コードからなるコードデータを生成するOCR処理部を有する外部機器へ、上記読取画像を送信する読取画像送信部と、上記外部機器が上記読取画像を文字認識して得たコードデータを受信するコードデータ受信部と、受信した上記コードデータ及び上記読取画像を関連付けることにより、上記コードデータを利用して文字検索可能な出力データを生成する出力データ生成部とを備えて構成される。
【0008】
この原稿読取装置では、原稿から読み取った読取画像を外部機器へ送信し、読取画像を文字認識して得られたコードデータを受信して文字検索可能な出力データが生成される。この様な構成によれば、原稿から読み取った読取画像を外部機器に転送してOCR処理させるので、原稿読取装置の製造コストを顕著に増大させることなく、読取画像を自動的にOCR処理させることができる。
【0009】
第2の本発明による原稿読取装置は、上記構成に加え、外部機器を識別するためのIDコードの転送要求を2以上の上記外部機器へ送信するID要求送信部と、上記外部機器が上記転送要求に基づいて発行したIDコードを受信するID受信部とを備え、上記読取画像送信部が、受信したIDコードの送信元の上記外部機器に対して、上記読取画像を送信するように構成される。
【0010】
この様な構成によれば、複数の外部機器が接続されている場合に、転送要求の送信後に受信したIDコードの送信元の外部機器に対して読取画像を送信するので、読取画像のOCR処理を確実に実行させることができる。
【0011】
第3の本発明による原稿読取装置は、上記構成に加え、上記読取画像送信部が、上記転送要求に対する応答信号に基づいて、上記読取画像の送信先を決定するように構成される。一般に、情報処理装置は、搭載されるOS(Operating System:オペレーティングシステム)のバージョンが新しいほど、CPUなどのハードウェアの処理能力が高い。また、搭載されるOSの種類、IDコードの転送要求を送信してから応答信号が受信するまでに要した時間などから外部機器の処理能力を判断することができる。そこで、転送要求に対する応答信号に基づいて外部機器の処理能力を判断して読取画像の送信先を決定することにより、処理能力の高い外部機器にOCR処理させることができる。
【0012】
第4の本発明による原稿読取装置は、上記構成に加え、上記読取画像送信部が、上記読取画像を分割して2以上の上記外部機器へそれぞれ送信するように構成される。この様な構成によれば、一連のイメージデータからなる読取画像の文字認識処理を複数の外部機器に分散させ、各外部機器における文字認識処理を並行して行わせることができる。特に、IDコードの転送要求に対する応答信号などから外部機器の処理能力を判断し、外部機器の処理能力に応じて送信しようとするイメージデータのデータ量を制御すれば、一連のイメージデータからなる読取画像の文字認識処理に要する時間を短縮することができる。
【0013】
第5の本発明による原稿読取装置は、上記構成に加え、操作部からの入力信号に基づいて、文字認識させる文字検出領域を指定する検出領域指定部を備え、上記読取画像送信部が、上記文字検出領域内の上記読取画像を上記外部機器へ送信するように構成される。この様な構成によれば、文字検出領域内の読取画像を外部機器へ送信するので、読取画像全体を送信する場合に比べ、OCR対象とするイメージデータの送信時間を短縮することができる。
【0014】
第6の本発明による情報処理装置は、原稿を光学的に読み取って読取画像を生成する原稿読取装置と通信する情報処理装置であって、上記読取画像を受信する読取画像受信部と、受信した上記読取画像に含まれる文字を認識することにより、2以上の文字コードからなるコードデータを生成するOCR処理部と、上記コードデータを上記読取画像の送信元へ送信するコードデータ送信部とを備えて構成される。
【0015】
第7の本発明による情報処理装置は、上記構成に加え、外部機器を識別するためのIDコードの転送要求を受信するID要求受信部と、上記転送要求に基づいて、IDコードを発行し、上記転送要求の送信元へ送信するID送信部とを備えて構成される。
【0016】
第8の本発明による情報処理装置用のプログラムは、原稿を光学的に読み取って読取画像を生成する原稿読取装置と通信する情報処理装置用のプログラムであって、上記読取画像を受信する読取画像受信手順と、受信した上記読取画像に含まれる文字を認識することにより、2以上の文字コードからなるコードデータを生成するOCR処理手順と、上記コードデータを上記読取画像の送信元へ送信するコードデータ送信手順とを実行させる。
【発明の効果】
【0017】
本発明による原稿読取装置、情報処理装置及び情報処理装置用のプログラムでは、原稿から読み取った読取画像を外部機器に転送してOCR処理させるので、原稿読取装置の製造コストを顕著に増大させることなく、読取画像を自動的にOCR処理させることができる。従って、原稿から読み取られた読取画像から文字検索可能な出力データを作成する際の操作性を向上させることができる。
【図面の簡単な説明】
【0018】
【図1】本発明の実施の形態による原稿読取装置及び情報処理装置を含む画像管理システムの一構成例を示したシステム図である。
【図2】図1の画像管理システムにおけるMFP1、PC3及び4の動作の一例を示したシーケンス図である。
【図3】図1の画像管理システムにおけるMFP1の構成例を示したブロック図であり、MFP1内の機能構成の一例が示されている。
【図4】図1の画像管理システムにおけるPC3の構成例を示したブロック図であり、PC3内の機能構成の一例が示されている。
【図5】図3のMFP1において指定可能な読取画像のOCR対象ブロックの一例を示した図である。
【図6】図3のMFP1におけるOCR条件の設定時の動作の一例を示したフローチャートである。
【図7】図3のMFP1における原稿読取時の動作の一例を示したフローチャートである。
【図8】図3のMFP1における原稿読取時の動作の一例を示したフローチャートである。
【図9】図4のPC3におけるOCR処理時の動作の一例を示したフローチャートである。
【図10】本発明の他の実施の形態による情報処理装置におけるOCR処理時の動作の一例を示した図であり、PC3において表示される編集画面60が示されている。
【発明を実施するための形態】
【0019】
<画像管理システム>
図1は、本発明の実施の形態による原稿読取装置及び情報処理装置を含む画像管理システムの一構成例を示したシステム図であり、原稿読取装置及び情報処理装置の一例としてそれぞれMFP1及びPC3が示されている。この画像管理システムは、複数のMFP1と複数のPC3,4とが、インターネット、LAN(ローカルエリアネットワーク)などの通信ネットワーク2を介して接続され、原稿から読み取ったイメージデータをOCR処理して管理するシステムである。
【0020】
MFP(Multifunction Peripheral:複合機)1は、スキャナ機能、プリンタ機能、FAX(ファクシミリ)機能、複写機能を有し、これらの機能を選択的に実行させることができる画像処理装置である。このMFP1は、原稿を光学的に読み取ってイメージデータを生成し、PC3へ送信する。
【0021】
PC3は、イメージデータを解析して、イメージデータに含まれる文字を認識することにより、複数の文字コードからなるコードデータを生成するOCR処理部を有し、通信ネットワーク2を介してMFP1と通信する情報処理装置である。このPC3は、MFP1からイメージデータを受信すれば、受信したイメージデータをOCR処理してコードデータを生成し、イメージデータの送信元のMFP1へ転送する。
【0022】
PC3は、例えば、PC3内の所定の共有フォルダを監視し、受信したイメージデータが共有フォルダに格納されれば、直ちに当該イメージデータを共有フォルダから読み出してOCR処理する。
【0023】
MFP1では、PC3からコードデータを受信すれば、受信したコードデータを対応するイメージデータと関連付けることにより、コードデータを利用して文字検索可能な出力データが作成される。コードデータ及びイメージデータの関連付けは、例えば、PC3が発行するIDコードに基づいて行われる。出力データは、所定のフォーマットのデータファイルからなり、例えば、通信ネットワーク2を介してPC4へ転送され、PC4内の所定の共有フォルダに格納される。
【0024】
<イメージデータのファイル化の流れ>
図2は、図1の画像管理システムにおけるMFP1、PC3及び4の動作の一例を示したシーケンス図である。MFP1は、まず、文字認識させる文字検出領域を指定する(ステップS101)。文字検出領域は、領域内のイメージデータを解析して文字認識させることにより、コードデータを抽出させるためのOCR対象領域である。具体的には、所定の操作により、読取画像内の一部のエリアが文字検出領域として指定される。或いは、1枚の原稿に相当するイメージデータのデータ量を1ページとして、複数ページのイメージデータからなる読取画像のうちの一部のページが文字検出領域として指定される。
【0025】
MFP1は、次に、所定のコマンドからなるID転送要求11を生成し、PC3へ送信する(ステップS102)。PC3は、ID転送要求11を受信すれば、当該ID転送要求11に基づいてIDコード12を発行し、ID転送要求11の送信元のMFP1へ転送する(ステップS111)。
【0026】
MFP1は、IDコード12を受信すれば、原稿の読み取りを開始し、読取画像を順次に生成するとともに、得られた読取画像をIDコード12に関連付けてMFP1内の記憶領域に格納する(ステップS103)。MFP1は、全ページの読み取りが完了すれば、IDコード12を含むOCR要求13を生成し、PC3へ送信する(ステップS104)。
【0027】
MFP1は、OCR要求13に対する許可応答14があったPC3に対し、ステップS101で指定された文字検出領域内の読取画像を含むイメージデータ15を送信する(ステップS105)。イメージデータ15は、対応するIDコード12及び文字検出領域を示す検出領域指定情報と共に送信される。
【0028】
PC3は、受信したイメージデータ15を検出領域指定情報に基づいてOCR処理することにより、一連の文字コードからなるコードデータ16を生成し、対応するIDコード12と共にイメージデータ15の送信元のMFP1へ転送する(ステップS112)。
【0029】
MFP1は、コードデータ16を受信すれば、受信したコードデータ16と、記憶領域内に格納した読取画像とをIDコード12に基づいて関連付けることにより、文字検索可能なデータファイルからなる出力データ17を生成し、PC4へ送信する(ステップS106)。PC4は、受信した出力データ17をPC4内の所定の共有フォルダに格納する(ステップS121)。
【0030】
<MFP>
図3は、図1の画像管理システムにおけるMFP1の構成例を示したブロック図であり、MFP1内の機能構成の一例が示されている。このMFP1は、操作部21、検出領域指定部22、光学読取部23、読取画像記憶部24、イメージデータ送信部25、ネットワークI/F26、コードデータ受信部27、出力データ生成部28、出力データ記憶部29、出力データ転送部30、ID要求送信部31、ID受信部32及びOCR要求送信部33により構成される。
【0031】
操作部21は、原稿の読み取りを開始させるためのスタートボタン、処理を停止又は中止させるためのストップボタン(キャンセルボタン)、数字入力キーなどの各種操作ボタン、各種入力キーからなるユーザインターフェースである。
【0032】
検出領域指定部22は、操作部21からの入力信号に基づいて、OCR用の文字検出領域を指定するための検出領域指定情報を生成し、イメージデータ送信部25へ出力する。文字検出領域は、OCR処理により文字を検出させるための文字認識対象範囲であり、原稿ごとの読取画像をページとして、ページ内の一部又は全部の画像領域が文字検出領域として指定され、或いは、複数のページが文字検出領域として指定される。
【0033】
ページ内の画像領域を文字検出領域として指定する場合、原稿ごとにユーザが任意の領域を指定するものであっても良いが、ここでは、ページ内を複数のOCR対象ブロックに区分し、これらのOCR対象ブロックのいずれかが文字検出領域として選択される。検出領域指定部22では、OCR処理により検出させる文字のフォントサイズが指定される。
【0034】
光学読取部23は、原稿を光学的に読み取り、読取画像を生成する。読取画像記憶部24には、光学読取部23により読み取られた読取画像が、所定の識別情報に関連付けて格納される。読取画像は、例えば、画素ごとの輝度を示すピクセルデータからなる。上記識別情報は、読取画像を識別するためのものであり、読取対象とする原稿単位で生成される。
【0035】
イメージデータ送信部25は、OCR処理させるために、読取画像記憶部24からイメージデータを読み出し、予め転送先として指定されたPC3へ送信する。このイメージデータは、少なくとも文字検出領域内の読取画像を含み、当該読取画像に対応する識別情報と、文字検出領域を示す検出領域指定情報と共にネットワークI/F26を介してPC3へ送信される。ネットワークI/F26は、通信ネットワーク2に接続された通信部である。
【0036】
コードデータ受信部27は、PC3が文字検出領域内の読取画像を文字認識して得たコードデータを識別情報と共にネットワークI/F26を介して受信する。出力データ生成部28は、受信したコードデータと、対応する読取画像とを識別情報に基づいて関連付けることにより、出力データを生成する。この出力データは、コードデータを利用して文字検索可能なデータファイルからなる。
【0037】
具体的には、まず、受信したコードデータを含むデータファイルとして、コードデータを構成する文字列をキーワードとして文書検索可能なXML(Extensible Markup Language)形式のメタデータファイルが生成される。そして、そのXMLファイルと、受信したコードデータに対応する読取画像とをパッケージ化することにより、出力データとしてZIP(ジップ)形式のデータファイルが作成される。
【0038】
或いは、受信したコードデータと対応する読取画像とから、コードデータを透明テキストとして含む透明テキスト付きPDF(Portable Document Format)形式のデータファイルが出力データとして作成される。出力データ記憶部29には、出力データ生成部28により生成された出力データが格納される。出力データ転送部30は、出力データ記憶部29から出力データを読み出し、予め転送先として指定されたPC4へネットワークI/F26を介して送信する。
【0039】
ID要求送信部31は、ネットワークI/F26を介して複数のPC3へ所定のID転送要求を送信する。ID転送要求は、通信ネットワーク2上のPC3を識別するためのIDコードの転送を要求するコマンドである。
【0040】
例えば、UDP/IPプロトコルに従って、MFP1からID転送要求が送信される。MFP1では、このID転送要求に対して、一定期間内に応答のあったPC3に対して、OCR対象とするイメージデータが送信される。OCR対象のイメージデータは、TCP/IPプロトコルに従って送信される。UDP/IPが、1対多の通信プロトコルであるのに対し、TCP/IPは、1対1の通信プロトコルである。
【0041】
ID受信部32は、PC3がID転送要求に基づいて発行したIDコードをネットワークI/F26を介して受信する。読取画像記憶部24には、受信したIDコードを含む識別情報に関連付けて、読取画像が保持される。また、イメージデータ送信部25では、受信したIDコードの送信元のPC3に対して、イメージデータが送信される。
【0042】
OCR要求送信部33は、OCR処理させるために、ネットワークI/F26を介してPC3へ所定のOCR要求を送信する。イメージデータ送信部25では、OCR要求に対する許可応答のあったPC3へ、イメージデータが送信される。
【0043】
<情報処理装置>
図4は、図1の画像管理システムにおけるPC3の構成例を示したブロック図であり、PC3内の機能構成の一例が示されている。このPC3は、ネットワークI/F41、イメージデータ受信部42、イメージデータ記憶部43、OCR処理部44、コードデータ送信部45、ID要求受信部46、ID送信部47及びOCR要求受信部48により構成される。
【0044】
ネットワークI/F41は、通信ネットワーク2に接続された通信部である。イメージデータ受信部42は、文字検出領域内の読取画像を含むイメージデータをネットワークI/F41を介して受信する。イメージデータ記憶部43には、受信したイメージデータが格納される。このイメージデータ記憶部43は、例えば、通信ネットワーク2上の複数のMFP1、PC4がアクセスすることができる共有フォルダである。
【0045】
OCR処理部44は、イメージデータ記憶部43からイメージデータを読み出して解析し、イメージデータに含まれる文字を認識することにより、複数の文字コードからなるコードデータを生成し、コードデータ送信部45へ出力する。イメージデータを解析して文字認識する方法としては、例えば、パターンマッチングによる方法が用いられる。具体的には、読取画像を所定の文字パターンと比較し、その比較結果に基づいて文字を特定することを繰り返すことにより、文字認識が行われる。
【0046】
OCR処理部44では、受信した検出領域指定情報を参照して文字検出領域内の読取画像を解析し、当該文字検出領域内のイメージデータについて、文字が識別される。また、OCR対象とする文字のフォントサイズが指定されていれば、指定されたフォントサイズ以上の文字が識別される。
【0047】
コードデータ送信部45は、OCR処理部44により生成されたコードデータを対応する識別情報と共に、イメージデータの送信元のMFP1へネットワークI/F41を介して送信する。
【0048】
ID要求受信部46は、ネットワークI/F41を介してID転送要求を受信する。ID送信部47は、受信したID転送要求に基づいて、IDコードを発行し、ID転送要求の送信元のMFP1へネットワークI/F41を介して送信する。
【0049】
OCR要求受信部48は、ネットワークI/F41を介してOCR要求を受信する。OCR処理部44では、OCR要求を受信した際に、OCR処理が実行可能であれば、MFP1へネットワークI/F41を介して許可応答が送信される。
【0050】
<OCR対象ブロック>
図5は、図3のMFP1において文字検出領域として指定可能な読取画像50のOCR対象ブロックの一例を示した図である。原稿から読み取られた読取画像50は、複数のOCR対象ブロックに区分される。この例では、縦長の矩形形状の画像領域が、横長の矩形形状からなる4つのOCR対象ブロックに等分割され、上から順に、第1ブロック、第2ブロック、第3ブロック及び第4ブロックと呼んでいる。
【0051】
ユーザは、この様なOCR対象ブロックのいずれかを選択することにより、第1〜第4ブロックのうちの一部のブロック又は全部のブロックについて、ブロック内の画像領域を文字検出領域として指定することができる。
【0052】
<OCR条件の設定>
図6のステップS201〜S208は、図3のMFP1におけるOCR条件の設定時の動作の一例を示したフローチャートである。このMFP1では、イメージデータを外部機器にOCR処理させる際のOCR条件の設定が予め行われ、初期設定データとして保持される。まず、文字検出領域として全ページが指定された場合、MFP1は、全ページを文字検出領域として指定する検出領域指定情報を生成し、初期設定データとして記憶してこの処理を終了する(ステップS201,S208)。
【0053】
一方、OCR対象ページの指定及びOCR対象ブロックの指定があれば、MFP1は、OCR対象ページの指定及びOCR対象ブロックの選択を受け付け、指定されたページ及び選択されたブロックを文字検出領域として指定する検出領域指定情報を生成し、初期設定データとして記憶する(ステップS202〜S204)。
【0054】
次に、OCR対象とする文字のフォントサイズの指定があれば、MFP1は、フォントサイズの選択を受け付け、選択されたフォントサイズを初期設定データとして記憶する(ステップS205〜S207)。
【0055】
ステップS203において、ユーザが、OCR対象ページを指定せず、或いは、OCR対象ブロックを選択しなければ、デフォルトの設定がそのまま初期設定データとして記憶される。例えば、デフォルト設定として第1ページの第1ブロックが指定されていれば、第1ページの第1ブロックが文字検出領域として指定される。
【0056】
また、ステップS206において、ユーザが、フォントサイズを選択しなければ、デフォルトの設定がそのまま初期設定データとして記憶される。例えば、デフォルト設定として12ポイントが選択されていれば、12ポイントがOCR対象の文字サイズとして指定される。ここで、フォントサイズは、8,9,10,10.5,11,12,14,16,18,20,22,24,26,28,36,48,72ポイントの中から任意に選択することができる。
【0057】
<読取画像のファイル化>
図7及び図8のステップS301〜S313,S321〜S333は、図3のMFP1における原稿読取時の動作の一例を示したフローチャートである。まず、OCR条件として初期設定データの使用が指定されている場合、MFP1は、予め作成された初期設定データを読み出してOCR条件として登録する(ステップS301)。
【0058】
一方、初期設定データを使用しない場合には、OCR条件の設定処理が、図6のステップS201からステップS208までの処理手順と同様に実行される(ステップS313)。
【0059】
次に、出力データの転送先が指定される(ステップS302)。MFP1は、転送先の指定後、キャンセルボタンが操作されれば、直ちにこの処理を終了する(ステップS303)。一方、スタートボタンが操作されれば(ステップS304)、原稿が給紙トレイ内に収容されているか否かを検知し、給紙トレイ内に原稿がセットされていれば、イメージデータのOCR処理が予め指定されているか否かが参照される(ステップS305,S306)。
【0060】
このとき、イメージデータのOCR処理が指定されていなければ、直ちに原稿の読み取りを開始し、原稿から読み取った読取画像が順次に記憶される(ステップS307,S308)。ステップS307,S308の処理手順は、全ページの読み取りが完了するまで繰り返され(ステップS309)、読み取りが完了すれば、蓄積された読取画像がファイル化され、読取画像を含むデータファイルからなる出力データが作成される(ステップS310)。
【0061】
作成された出力データは、ステップS302で転送先として指定されたPC4へ転送され(ステップS311)、その後、蓄積された読取画像及び出力データがMFP1から削除される(ステップS312)。
【0062】
一方、イメージデータのOCR処理が指定されている場合には、通信ネットワーク2上のPC3へIDコードの転送要求が送信される(ステップS321)。次に、MFP1は、IDコードを受信すれば、受信したIDコードの送信元をイメージデータの送信先として登録し、原稿の読み取りを開始する(ステップS322,S323)。転送要求の送信後、IDコードが受信しないまま、受信タイマーがタイムアップすれば、この処理は終了する(ステップS322,S332)。
【0063】
原稿から読み取った読取画像は、受信したIDコードに関連付けて順次に記憶される(ステップS324)。ステップS323,S324の処理手順は、全ページの読み取りが完了するまで繰り返され(ステップS325)、読み取りが完了すれば、OCR要求が受信したIDコードの送信元のPC3へ送信される(ステップS326)。
【0064】
MFP1は、OCR要求に対する許可応答があれば、OCR条件の登録情報、受信したIDコードに関連付けて記憶した読取画像を順次に送信する(ステップS327)。次に、MFP1は、コードデータを受信すれば、受信したコードデータと蓄積された読取画像とがファイル化され、コードデータを利用して文字検索可能な出力データが作成される(ステップS328,S329)。
【0065】
作成された出力データは、ステップS302で転送先として指定されたPC4へ転送され(ステップS330)、その後、蓄積された読取画像及び出力データがMFP1から削除される(ステップS331)。読取画像の送信後、コードデータが受信しないまま、受信タイマーがタイムアップすれば、蓄積された読取画像及び出力データを削除して、この処理は終了する(ステップS328,S333)。
【0066】
<OCR処理>
図9のステップS401〜S407は、図4のPC3におけるOCR処理時の動作の一例を示したフローチャートである。PC3は、IDコードの転送要求を受信すれば、受信した転送要求に基づいてIDコードを発行し、転送要求の送信元のMFP1へ送信する(ステップS401〜S403)。
【0067】
次に、PC3は、OCR要求を受信すれば、許可応答を送信してOCR用のアプリケーションプログラムを起動させる(ステップS404,S405)。そして、PC3は、イメージデータが受信すれば、受信したイメージデータをOCR条件に従ってOCR処理してコードデータを生成し、OCR要求の送信元のMFP1へ送信する(ステップS406,S407)。
【0068】
本実施の形態によれば、原稿から読み取った読取画像をPC3に転送してOCR処理させるので、MFP1の製造コストを顕著に増大させることなく、読取画像を自動的にOCR処理させることができる。また、複数のPC3が接続されている場合に、ID転送要求の送信後に受信したIDコードの送信元のPC3に対して読取画像を送信するので、読取画像のOCR処理を確実に実行させることができる。さらに、文字検出領域内の読取画像のみをPC3へ送信するので、読取画像全体を送信する場合に比べ、OCR対象とするイメージデータの送信時間を短縮することができる。
【0069】
なお、本実施の形態では、MFP1が受信したIDコードの送信元へ読取画像を送信する場合の例について説明したが、複数のPC3からIDコードを含む応答信号を受信した場合に、これらの応答信号に基づいてPC3の処理能力を判断し、この処理能力に基づいてPC3のいずれかを読取画像の送信先に決定しても良い。例えば、MFP1は、IDコードの転送要求として、OSのバージョンを示すバージョン情報の転送要求を含む転送要求をPC3へ送信する。そして、MFP1は、この転送要求に対する応答信号として、複数のPC3からIDコード及びバージョン情報を受信すれば、受信したバージョン情報に基づいてPC3の処理能力を判断し、処理能力が最も高いPC3を読取画像の送信先として決定する。具体的には、搭載されるOSのバージョンが最も新しいPC3が読取画像の送信先として指定される。
【0070】
PC3の処理能力は、PC3が搭載しているOSのバージョン以外に、OSの種類、OCR処理を実行するアプリケーションプログラムのバージョン、プロセッサの種類、プロセッサの動作速度、メモリ容量などから判断することも考えられる。或いは、IDコードの転送要求を送信してから応答信号が受信するまでに要した時間からPC3の処理能力を判断して読取画像の送信先を決定するような構成であっても良い。この様に構成すれば、OCR処理可能なPC3のうち、処理能力の最も高いPC3にOCR処理させることができる。
【0071】
また、本実施の形態では、文字検出領域内の読取画像を1つのPC3へ送信してOCR処理させる場合の例について説明したが、本発明はこれに限られるものではない。例えば、一連のイメージデータからなる読取画像をOCR処理させる場合に、通信ネットワーク2上の複数のPC3にOCR処理を分散処理させるような構成のものも本発明には含まれる。
【0072】
具体的には、読取画像を分割して複数のPC3へそれぞれ送信することにより、一連のイメージデータからなる読取画像の文字認識処理をこれらのPC3により分散処理させる。その際、MFP1は、IDコードの転送要求に対する応答信号などからPC3の処理能力を判断し、PC3の処理能力に応じて送信しようとするイメージデータのデータ量を制御することにより、読取画像の文字認識処理を効率的に行わせることができる。
【0073】
例えば、1枚の原稿に相当するイメージデータのデータ量を1ページとして、PC3の処理能力に応じて、各PC3へ送信するイメージデータのページ数を変更することが考えられる。具体的に説明すれば、処理能力の高いPC3ほど、より多くのページ数のイメージデータを送信する制御が行われる。さらに、各PC3におけるOCR処理を並行して行わせることにより、読取画像の文字認識処理に要する時間を短縮することができる。
【0074】
また、本実施の形態では、文字検出領域内の読取画像がOCR対象のイメージデータとしてPC3へ送信される場合の例について説明したが、原稿ごとの読取画像全体をOCR対象として送信するものも本発明には含まれる。
【0075】
また、本実施の形態では、コードデータ及び読取画像からなる出力データがPC4の共有フォルダ内に格納される場合の例について説明したが、メールアドレスを出力データの送信先に指定して出力データを電子メールとして送信するような構成であっても良い。
【0076】
また、本実施の形態では、PC3が自身を識別するためのIDコードを発行し、このIDコードに基づいて読取画像の送信先が指定される場合の例について説明したが、MFP1が自身を識別するための識別情報としてIDコードを発行するような構成であっても良い。
【0077】
また、本実施の形態では、MFP1がコードデータを受信して文字検索可能な出力データを生成する場合の例について説明したが、PC3が読取画像とその文字認識結果のコードデータとから出力データを生成するような構成のものも本発明には含まれる。具体的には、MFP1により原稿から読み取られた読取画像が、PC3内の所定フォルダ(共有フォルダ)に転送される。
【0078】
PC3は、このフォルダを監視し、読取画像がMFP1から転送され、フォルダ内に格納されれば、当該読取画像のOCR処理を実行し、コードデータを生成する。そして、PC3は、コードデータと元の読取画像とから文字検索可能な出力データを生成する。その際、出力データのファイル名、検索用のキーワード及びファイル形成を指定できるようにしても良い。
【0079】
<文書ファイルの編集画面>
図10は、本発明の他の実施の形態による情報処理装置におけるOCR処理時の動作の一例を示した図であり、PC3において表示される文書ファイルの編集画面60の一例が示されている。本実施の形態では、通信ネットワーク2上のPC3が、MFP1から転送された読取画像をOCR処理し、その文字認識結果のコードデータと元の読取画像とから文字検索可能な出力データを生成する。
【0080】
この編集画面60は、共有フォルダ内に格納されたイメージデータをOCR処理した際に、ディスプレイ上に表示される入力画面である。編集画面60には、読取画像の文字認識結果が表示される表示欄61、ファイル名の選択ボタン62、文書分類の選択ボタン63、ファイル名の編集エリア64、文書分類の編集エリア65、ファイル形式の選択ボタン66,67、データファイルの作成ボタン68が配置されている。
【0081】
表示欄61には、読取画像のOCR処理により得られた文字列の一部又は全部が選択可能に表示されるとともに、選択中の文字列が反転表示されている。選択ボタン62を操作すれば、選択中の文字列をデータファイルのファイル名として指定することができる。ファイル名は、編集エリア64において編集することができる。また、選択ボタン63を操作すれば、選択中の文字列を文書検索のキーワードとして指定することができる。キーワードは、編集エリア65において編集することができる。
【0082】
選択ボタン66を操作すれば、読取画像と、読取画像から得られるコードデータとからなるデータファイルのファイル形式として、PDF形式を選択することができる。一方、選択ボタン67を操作すれば、XML形式を選択することができる。作成ボタン68を操作すれば、選択ボタン66,67により指定されたファイル形式により出力データからなるデータファイルが作成される。
【0083】
PDF形式を選択した場合、イメージデータをPDFファイルに変換して、コードデータを透明テキストとして有する透明テキスト付きPDFファイルが作成される。XML形式を選択した場合には、キーワードとして指定された文字列のコードデータからなるXML形式のメタデータファイルを生成し、このメタデータファイルとイメージデータとをパッケージ化して、ZIP形式のデータファイルが作成される。
【符号の説明】
【0084】
1 MFP
2 通信ネットワーク
3,4 PC
21 操作部
22 検出領域指定部
23 光学読取部
24 読取画像記憶部
25 イメージデータ送信部
26 ネットワークI/F
27 コードデータ受信部
28 出力データ生成部
29 出力データ記憶部
30 出力データ転送部
31 ID要求送信部
32 ID受信部
33 OCR要求送信部
41 ネットワークI/F
42 イメージデータ受信部
43 イメージデータ記憶部
44 OCR処理部
45 コードデータ送信部
46 ID要求受信部
47 ID送信部
48 OCR要求受信部
50 読取画像
60 編集画面

【特許請求の範囲】
【請求項1】
原稿を光学的に読み取り、読取画像を生成する光学読取部と、
上記読取画像を保持する読取画像記憶部と、
イメージデータに含まれる文字を認識することにより、2以上の文字コードからなるコードデータを生成するOCR処理部を有する外部機器へ、上記読取画像を送信する読取画像送信部と、
上記外部機器が上記読取画像を文字認識して得たコードデータを受信するコードデータ受信部と、
受信した上記コードデータ及び上記読取画像を関連付けることにより、上記コードデータを利用して文字検索可能な出力データを生成する出力データ生成部とを備えたことを特徴とする原稿読取装置。
【請求項2】
外部機器を識別するためのIDコードの転送要求を2以上の上記外部機器へ送信するID要求送信部と、
上記外部機器が上記転送要求に基づいて発行したIDコードを受信するID受信部とを備え、
上記読取画像送信部は、受信したIDコードの送信元の上記外部機器に対して、上記読取画像を送信することを特徴とする請求項1に記載の原稿読取装置。
【請求項3】
上記読取画像送信部は、上記転送要求に対する応答信号に基づいて、上記読取画像の送信先を決定することを特徴とする請求項2に記載の原稿読取装置。
【請求項4】
上記読取画像送信部は、上記読取画像を分割して2以上の上記外部機器へそれぞれ送信することを特徴とする請求項1から3のいずれかに記載の原稿読取装置。
【請求項5】
操作部からの入力信号に基づいて、文字認識させる文字検出領域を指定する検出領域指定部を備え、
上記読取画像送信部は、上記文字検出領域内の上記読取画像を上記外部機器へ送信することを特徴とする請求項1から4のいずれかに記載の原稿読取装置。
【請求項6】
原稿を光学的に読み取って読取画像を生成する原稿読取装置と通信する情報処理装置において、
上記読取画像を受信する読取画像受信部と、
受信した上記読取画像に含まれる文字を認識することにより、2以上の文字コードからなるコードデータを生成するOCR処理部と、
上記コードデータを上記読取画像の送信元へ送信するコードデータ送信部とを備えたことを特徴とする情報処理装置。
【請求項7】
外部機器を識別するためのIDコードの転送要求を受信するID要求受信部と、
上記転送要求に基づいて、IDコードを発行し、上記転送要求の送信元へ送信するID送信部とを備えたことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
原稿を光学的に読み取って読取画像を生成する原稿読取装置と通信する情報処理装置用のプログラムにおいて、
上記読取画像を受信する読取画像受信手順と、
受信した上記読取画像に含まれる文字を認識することにより、2以上の文字コードからなるコードデータを生成するOCR処理手順と、
上記コードデータを上記読取画像の送信元へ送信するコードデータ送信手順とを実行させることを特徴とする情報処理装置用のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−49668(P2012−49668A)
【公開日】平成24年3月8日(2012.3.8)
【国際特許分類】
【出願番号】特願2010−187988(P2010−187988)
【出願日】平成22年8月25日(2010.8.25)
【出願人】(000006297)村田機械株式会社 (4,916)
【Fターム(参考)】