説明

画像管理装置および画像管理システム

【課題】ネットワークの負荷を高めることがなく、ネットワークに接続された装置にて画像データの文字情報を高識字率で取得できるシステムを安価に構成することができる、画像管理装置および画像管理システムを提供する。
【解決手段】文字認識部401は、画像読取部120が生成した画像データに対してOCR処理を実行し、文字列データを取得する。画像処理部402は、画像読取部120が生成した画像データに基づいて、外部装置への送信用画像データを生成する。識別情報生成部403は、画像処理部402が生成した送信用画像データに所定の変換アルゴリズムを適用し、当該送信用画像データを特定する識別情報を算出する。識別情報生成部403が生成した識別情報は、当該識別情報に対応する画像データから取得された文字列データと対応づけて記憶部404に記録される。送信部405は、送信用画像データを外部装置へ送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、送信機能を備える画像管理装置および画像管理システムに関する。
【背景技術】
【0002】
近年、複写機や複合機等の画像形成装置は、LAN(Local Area Network)等のネットワークを通じてパーソナルコンピュータ等の情報処理端末と接続された状況で使用されることが多い。このような画像形成装置は、情報処理端末から入力された画像データを用紙上に印刷する画像印刷装置として機能したり、情報処理端末において使用される画像データを取得する画像読取装置として機能したり、取得した画像データを蓄積する画像管理装置として機能したりする。
【0003】
また、近年、OCR(Optical Character Recognition)機能により、画像読取により取得した画像データに含まれる文字情報(文字列データ)を取得する画像管理システムも提案されている(例えば、特許文献1等参照。)。取得された文字列データは、例えば、画像形成装置内に格納された画像データの、内容に基づく検索に使用される。OCR機能は、取得した画像データに対する画像処理(エッジ検出)により文字領域を抽出するとともに、エッジ検出結果を解析することでその文字を特定する。そのため、OCR処理の精度は、画像データの品質に依存することになる。例えば、低解像度で不鮮明な画像データに対するOCR処理よりも、高解像度で鮮明な画像データに対するOCR処理の方が、文字の識字率(文字を正しく認識する確率)が高まる傾向にある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−350769号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
高解像度で鮮明な画像データはデータサイズが大きいため、上述のようなネットワークにより情報処理端末と接続された環境下においてこのような画像データを送受信するとネットワーク負荷が著しく増大することになる。そのため、ワークフローシステム等、ネットワークで接続された情報処理端末の間で画像データを順次転送するシステムでは、画像データの品質を目視に耐えうる最低限のレベルにまで下げる等、画像データサイズを可能な限り小さくすることが望ましい。
【0006】
このような目視に耐えうる最低限のレベルにまで下げた画像データについても、文字列データを抽出したいというニーズは存在する。しかしながら、低品質な画像に対してOCR処理を実行した場合には識字率が低くなるため、文字列データを正確に抽出することは難しい。
【0007】
また、優れた識字性能を有するOCRシステムは高価である上、OCR処理を実行するCPUにかかる負荷も高い。そのため、各ユーザが使用する情報処理端末において、優れた識字性能を有するOCR機能を簡単に利用することも難しい。すなわち、コストやハードウェア性能の観点から、各ユーザが使用する情報処理端末において実現し得るOCR機能は性能的にも識字率が低くなる。したがって、上述のような低品質な画像に対する文字認識により文字列データを正確に抽出することは極めて困難である。
【0008】
このような課題は、画像読取装置において取得された高品質な画像データにOCR処理を適用して高識字率で文字認識を実行するとともに、送信用に使用する画像データを別途生成することで解決するようにも思える。しかしながら、このような構成では、送信用画像データとともに抽出した文字列データを送信する、あるいは送信用画像データとともに画像読取装置に格納されている文字列データを特定するための識別子を送信することになる。このような構成では、情報処理端末において、画像データと文字列データとの紐づけ情報や、画像データと識別子との紐づけ情報を認識できる必要がある。紐付け情報を通知する構成としては、例えば、画像データ中のヘッダ情報に付加したり、画像データのファイル名に含ませたりする手法が考え得る。しかしながら、ヘッダ情報を使用する構成では、情報処理端末においてヘッダ情報中に紐付け情報を含む特別なデータフォーマットを認識できる仕様のワークフローシステム等を構築する必要がある。また、ファイル名を利用する構成では、ファイル名の変更により紐づけ情報が消失することになる。
【0009】
以上のように、ネットワーク負荷を高めることがなく、かつ、画像データの文字情報を高識字率で取得できる実用的なシステムを安価に構成することは難しい。
【0010】
本発明は、このような従来技術の課題を鑑みてなされたものであり、ネットワークの負荷を高めることがなく、かつ、任意のクライアント装置において、画像データの文字情報を高識字率で取得できるシステムを安価に構成することができる、画像管理装置および画像管理システムを提供することを目的とする。
【課題を解決するための手段】
【0011】
上述の目的を達成するために、本発明に係る画像管理装置は以下の技術的手段を採用している。すなわち、本発明に係る画像管理装置は、画像読取部、文字認識部、画像処理部、識別情報生成部、記憶部および送信部を備える。画像読取部は、原稿の画像を読み取り、画像データを生成する。文字認識部は、画像読取部により生成された画像データに対して文字認識処理(OCR処理)を実行し、文字列データを取得する。画像処理部は、画像読取部により生成された画像データに基づいて、外部の装置へ送信する送信用画像データを生成する。識別情報生成部は、画像処理部で生成された送信用画像データに対し、画像データから一意に変換結果が定まる所定の変換アルゴリズムを適用し、当該送信用画像データを特定する識別情報を算出する。識別情報生成部により生成された識別情報は、当該識別情報に対応する画像データから取得された文字列データと対応づけて記憶部に記録される。そして、送信部は、送信用画像データを外部の装置に送信する。
【0012】
この画像管理装置は、OCR処理の実行対象になる画像データとは別に、情報処理端末等の外部の装置へ送信する送信用画像データを生成する。また、OCR処理により取得された文字列データは、送信用画像データから一意に変換結果が定まる所定の変換アルゴリズムを適用して算出される識別情報と対応づけて記憶部に記憶される。したがって、送信用画像データを受信した情報処理端末等の外部の装置において、送信用画像データから識別情報を取得できれば、受信した送信用画像データに対応する文字列データを画像管理装置から取得することができる。この構成では、送信用画像データと識別情報との紐づけ情報を認識するための特別なデータフォーマットに対応するシステム構成を要することなく、送信用画像データ自体に上記変換アルゴリズムを適用することで識別情報を容易に算出することができる。その結果、送信用画像データのデータサイズを小さくできるためネットワークの負荷を高めることがなく、かつ、任意の情報処理端末等において、送信用画像データに対応する文字列データを高識字率で取得することが可能になる。この画像管理装置では、識別情報として、例えば、送信用画像データの全データにハッシュ関数を適用することにより算出されるハッシュ値を採用することができる。
【0013】
一方、他の観点では、本発明は、画像管理装置とクライアント装置とを含む、画像管理システムを提供することができる。この画像管理システムにおいて、画像管理装置は、画像読取部、文字認識部、画像処理部、識別情報生成部、記憶部および送信部を備える。画像読取部は、原稿の画像を読み取り、画像データを生成する。文字認識部は、画像読取部により生成された画像データに対してOCR処理を実行し、文字列データを取得する。画像処理部は、画像読取部により生成された画像データに基づいて、外部の装置に送信するための画像データを生成する。識別情報生成部は、画像処理部で生成された送信用画像データに対し、画像データから一意に変換結果が定まる所定の変換アルゴリズムを適用し、当該送信用画像データを特定する識別情報を算出する。識別情報生成部により生成された識別情報は、当該識別情報に対応する画像データから取得された文字列データと対応づけて記憶部に記録される。そして、送信部は、送信用画像データを外部の装置に送信する。また、クライアント装置は、受信部、識別情報特定部および文字情報取得部を備える。受信部は、画像管理装置から送信された送信用画像データを受信する。識別情報特定部は、受信した送信用画像データに対して上記変換アルゴリズムを適用し、当該送信用画像データに対応する識別情報を算出する。そして、文字情報取得部は、識別情報特定部により算出された識別情報に対応する文字列データを画像管理装置から取得する。
【0014】
この画像管理システムによれば、ネットワークの負荷を高めることがなく、かつ、任意のクライアントにおいて、画像データの文字情報を高識字率で取得するシステムを安価に構成することができる。
【発明の効果】
【0015】
本発明によれば、低解像度の画像データに基づいて、高解像度の画像データを対象としたOCR処理により高識字率で文字認識を実行して文字列データを取得できるため、ネットワークの負荷を高めることがない。また、情報処理端末等のクライアント装置では、送信用画像データに所定の変換アルゴリズムを適用することで識別情報を算出できるので、送信用画像データと識別情報との紐づけ情報を認識するための特別なデータフォーマットを採用したシステムを構成する必要がなく、送信用画像データのみから識別情報を容易に算出することができる。その結果、ネットワーク負荷を高めることがなく、かつ任意のクライアント装置において、送信用画像データの文字列データを高識字率で取得することができる。
【図面の簡単な説明】
【0016】
【図1】本発明の一実施形態における複合機の全体構成を示す概略構成図
【図2】本発明の一実施形態における複合機の操作パネルを示す模式図
【図3】本発明の一実施形態における複合機のハードウェア構成を示す図
【図4】本発明の一実施形態における複合機を示す機能ブロック図
【図5】本発明の一実施形態における複合機の画像送信処理手順を示すフロー図
【図6】本発明の一実施形態における複合機が表示する送信設定操作画面の一例を示す図
【図7】本発明の一実施形態における複合機が表示する画像読取操作画面の一例を示す図
【図8】本発明の一実施形態における複合機が表示する送信画像確認画面の一例を示す図
【図9】本発明の一実施形態における複合機の文字情報読出処理手順を示すフロー図
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について、図面を参照しながらより詳細に説明する。以下では、OCR機能および送信機能を有するデジタル複合機として本発明を具体化する。送信機能は、FTP、SMB等のデータ転送プロトコルを使用したデータ送信、および電子メールの添付ファイルとしたデータ送信等を含む。
【0018】
図1は本実施形態におけるデジタル複合機の全体構成の一例を示す概略構成図である。図1に示すように、複合機100は、画像読取部120および画像形成部140を含む本体101と、本体101の上方に取り付けられたプラテンカバー102とを備える。本体101の上面には原稿台103が設けられており、原稿台103はプラテンカバー102によって開閉されるようになっている。また、プラテンカバー102は、原稿搬送装置110と原稿トレイ111と排紙トレイ112を備えている。
【0019】
原稿台103の下方には、画像読取部120が設けられている。画像読取部120は、原稿の画像を読み取りその画像のデジタルデータを生成する。原稿は、原稿台103に載置することができる。原稿台103の下方には走査光学系121が配置されている。走査光学系121は、第1キャリッジ122や第2キャリッジ123、集光レンズ124を備える。第1キャリッジ122には線状の光源131およびミラー132が設けられ、第2キャリッジ123にはミラー133および134が設けられている。光源131は原稿を照明する。ミラー132、133、134は、原稿からの反射光を集光レンズ124に導き、集光レンズ124はその光像をラインイメージセンサ125の受光面に結像する。この走査光学系121において、第1キャリッジ122および第2キャリッジ123は、副走査方向135に往復動可能に設けられている。第1キャリッジ122および第2キャリッジ123を副走査方向135に移動することによって、原稿台103に載置された原稿の画像をイメージセンサ125で読み取ることができる。イメージセンサ125は、受光面に入射した光像から、原稿の画像データを生成する。
【0020】
また、原稿は、原稿トレイ111に載置することもできる。原稿搬送装置110は、ピックアップローラ113により原稿トレイ111にセットされた原稿を1枚ずつ搬送路116へ送り出す。その搬送路116上には画像読取位置Pがある。搬送ローラ114は画像読取位置Pへ原稿を搬送する。原稿トレイ111にセットされた原稿の画像を読み取る場合、画像読取部120は、第1キャリッジ122および第2キャリッジ123を画像読取位置Pに合わせて一時的に固定する。原稿が画像読取位置Pを通過するとき、光源131は原稿を照明する。光源131からの光は、原稿台103を透過して原稿読取位置Pを通過する原稿において反射し、ミラー132、133、134、集光レンズ124によってイメージセンサ125に導かれる。イメージセンサ125は、受光光に基づいて、例えば、R(レッド)、G(グリーン)、B(ブルー)の各色に対応する画像データを生成する。画像読取位置Pを通過した原稿は、排紙ローラ115により排紙トレイ112に排出される。
【0021】
なお、生成された画像データは、画像形成部140において用紙に印刷することができる。また、生成された画像データは、ネットワークアダプタ161等を介して、ネットワーク162を通じて他の機器へ送信することもできる。なお、図1では、他の機器として、後述のように、複合機100に対してデータを要求する情報処理端末171のみを例示している。
【0022】
画像形成部140は、画像読取部120で得た画像データや、ネットワーク162に接続された他の機器からネットワークアダプタ161を介して受信した画像データを用紙に印刷する。画像形成部140は、感光体ドラム141を備える。感光体ドラム141は一定速度で一方向に回転する。感光体ドラム141の周囲には、回転方向の上流側から順に、帯電器142、露光器143、現像器144、中間転写ベルト145が配置されている。帯電器142は、感光体ドラム141表面を一様に帯電させる。露光器143は、一様に帯電した感光体ドラム141の表面に、画像データに応じて光を照射し、感光体ドラム141上に静電潜像を形成する。現像器144は、その静電潜像にトナーを付着させ、感光体ドラム141上にトナー像を形成する。中間転写ベルト145は、感光体ドラム141上のトナー像を用紙に転写する。画像データがカラー画像である場合、中間転写ベルト145は、各色のトナー像を同一の用紙に転写する。なお、RGB形式のカラー画像は、C(シアン)、M(マゼンタ)、Y(イエロー)、K(ブラック)形式の画像データに変換され、各色の画像データが露光器143に入力される。
【0023】
画像形成部140は、手差しトレイ151、給紙カセット152、153、154等から、中間転写ベルト145と転写ローラ146との間の転写部に用紙を給送する。手差しトレイ151や各給紙カセット152、153、154には、様々なサイズの用紙を載置または収容することができる。画像形成部140は、ユーザの指定した用紙や、自動検知した原稿のサイズに応じた用紙を選択し、選択した用紙を給送ローラ155により手差しトレイ151やカセット152、153、154から引き出す。引き出した用紙は搬送ローラ156やレジストローラ157で転写部に送り込む。トナー像を転写した用紙は、搬送ベルト147により定着器148に搬送される。定着器148は、ヒータを内蔵した定着ローラ158および加圧ローラ159を有しており、熱と押圧力によってトナー像を用紙に定着する。画像形成部140は、定着器148を通過した用紙を排紙トレイ149へ排紙する。
【0024】
図2は複合機が備える操作パネルの外観の一例を示す図である。ユーザは、操作パネル200を用いて、上述のような複合機に複写開始やその他の指示を与えたり、複合機100の状態や設定を確認したりすることができる。操作パネル200には、タッチパネル付きディスプレイ201や操作ボタン203が配置されている。ユーザは、例えば、タッチペン202を使用して、ディスプレイ201を通じて入力を行うことができる。
【0025】
ディスプレイ201は、設定部204およびメッセージ表示部205を有する操作画面を表示する。設定部204には、複数のタブ206が用意されている。「基本」タブは、用紙のサイズや向き、複写倍率、濃度などの設定に使用される。「基本」タブは、その設定のためボタンなどの各種の要素を有している。例えば「濃度設定」ボタン207を押す操作をユーザが行うと、濃度の数値を指定するためのウィンドウがそのタブ上に重ねて表示される。図2の例では、「基本」タブのほか、「ユーザ機能」、「機能リスト」、「プログラム」タブも設けられている。ユーザは、タブボタン208を選択する(触れる)操作を行うことによって、これらのタブの表示を切り替えることができる。一つのタブが選択されている間、操作画面上で他のタブやその要素は隠れている。
【0026】
メッセージ表示部205は、複写が可能かどうかや用紙の補給が必要かどうかなどの複合機の状態や、複写部数などの設定をユーザに知らせるメッセージを表示する。この表示には、複合機100が備える各種のセンサの検知結果やユーザの操作結果が反映される。
【0027】
操作キー203は、主電源キー209、テンキー210やスタートキー211、クリアキー212等を含む。例えば、主電源キー209は、複合機100の主電源のON、OFFの切り替えに使用される。テンキー210は、複写部数の指定や複写倍率の設定に用いることができる。ユーザがそれらの設定をすると、複合機は、例えば「コピーできます(設定あり)」のようなメッセージを表示部205に表示し、ユーザによる設定が行われたことを通知する。スタートキー211は、複写や画像印刷の開始指示に使用される。ユーザは、自身でした設定を解除する場合、クリアキー212を操作する。ユーザによる設定を機械が受け付けているかどうかは上述のメッセージで判断することができるので、その設定が不要になれば、クリアキー212を操作すればよい。
【0028】
図3は、複合機における制御系のハードウェア構成図である。本実施形態の複合機100は、CPU(Central Processing Unit)301、RAM(Random Access Memory)302、ROM(Read Only Memory)303、HDD(Hard Disk Drive)304および原稿搬送装置110、画像読取部120、画像形成部140における各駆動部に対応するドライバ305が内部バス306を介して接続されている。ROM303やHDD304等はプログラムを格納しており、CPU301はその制御プログラムの指令にしたがって複合機100を制御する。例えば、CPU301はRAM302を作業領域として利用し、ドライバ305とデータや命令を授受することにより上記各駆動部の動作を制御する。また、HDD304は、画像読取部120により得られた画像データや、他の機器からネットワークアダプタ161を通じて受信した画像データの蓄積にも用いられる。
【0029】
内部バス306には、操作パネル200や各種のセンサ307も接続されている。操作パネル200は、ユーザの操作を受け付け、その操作に基づく信号をCPU301に供給する。また、ディスプレイ201は、CPU301からの制御信号にしたがって上述の操作画面を表示する。また、センサ307は、プラテンカバー102の開閉検知センサや原稿台103上の原稿検知センサ、定着器148の温度センサ、搬送される用紙または原稿の検知センサなど各種のセンサを含む。CPU301は、例えばROM303に格納されたプログラムを実行することで、以下の各手段を実現するとともに、これらセンサからの信号に応じて各手段の動作を制御する。
【0030】
図4は、複合機の機能ブロック図である。文字認識部401は、画像読取部120により生成された画像データに対してOCR処理(文字認識処理)を実行し、文字列データ(文字情報)を取得する。ここでは、文字認識部401は、画像形成部120が生成した画像データに対して、2値化処理、エッジ強調、エッジ検出等の画像処理を施して文字を抽出し、当該文字を文字列データ(例えば、テキストデータ)に変換する。特に限定されないが、本実施形態では、画像読取部120により生成された画像データが画像データ保持部406に保持され、当該画像データに対して文字認識部401がOCR処理を行う。
【0031】
画像処理部402は、画像データ保持部406に保持された画像データに基づいて外部の装置に送信する送信用画像データを生成する。ここでは、目視に耐えうる最低限のレベルの解像度まで画像データの品質を低下させて送信用画像データとする。例えば、画像処理部402が生成した解像度の異なる複数の低解像度画像データを操作部200のディスプレイ201に表示し、目視に耐えうる画像データを送信用画像データとしてユーザに選択させる構成を採用することができる。また、画像処理部402が生成した解像度の異なる複数の低解像度画像データを画像形成部140に出力させ、送信用画像データをユーザに選択させる構成を採用してもよい。
【0032】
識別情報生成部403は、画像処理部402において生成された送信用画像データに対して、画像データから一意に変換結果が定まる所定の変換アルゴリズムを適用し、当該送信用画像データを特定する識別情報を算出する。特に限定されないが、本実施形態では、識別情報生成部403は、変換アルゴリズムとしてハッシュ関数を使用する。公知のように、ハッシュ関数は、あるデータが与えられた場合にそのデータを代表する固定ビット長データ(以下、ハッシュ値という。)を得るための関数である。ここでは、ハッシュ関数に送信用画像データの全データを入力して得られるハッシュ値を識別情報として使用する。なお、ここでは、変換アルゴリズムを送信用画像データの全データに適用しているが、特定部分(バイナリデータにおける特定領域)のみに変換アルゴリズムを適用してもよい。また、変換アルゴリズムは、ハッシュ関数に限らず、送信用画像データから一意に変換結果が定まるものであればよい。
【0033】
識別情報生成部403が生成した識別情報および文字認識部401が抽出した文字列データは、対応づけられた状態で記憶部404に記録される。対応づけの方法は任意であり、例えば、記憶部404における文字列データの所在と識別情報とを1対1で対応づけるテーブルを使用することができる。なお、本実施形態では、記憶部404には、識別情報と文字列データのみが記憶される構成であるが、これらに加えて、画像読取部120が生成した画像データや画像処理部402が生成した送信用画像データが、識別情報と対応づけられた状態で記憶される構成であってもよい。
【0034】
送信部405は、送信用画像データを、ネットワークアダプタ161を介して外部の装置に送信する。
【0035】
また、本実施形態の複合機100は、問い合わせ部407をさらに備える。問い合わせ部407は、情報処理端末171からの識別情報の入力に応じて、入力された識別情報に対応する文字列データを記憶部404から検索し、検索結果を要求元へ通知する。ここで、検索結果とは、記憶部404から入力された識別情報に対応する文字列データが抽出できた場合はその文字列データであり、記憶部404から入力された識別情報に対応する文字列データが抽出できなかった場合はその旨の通知である。
【0036】
ここで、複合機100にネットワーク162を介して接続されている情報処理端末(クライアント装置)171について説明する。図4に示すように、情報処理端末171は、ネットワークアダプタ172、受信部173、識別情報特定部174および文字情報取得部175を備える。ネットワークアダプタ172は、ネットワーク162との入出力インターフェイスである。受信部173は、複合機100の送信部405が送信した送信用画像データを受信する。識別情報特定部174は、受信した送信用画像データに対して上述の変換アルゴリズムを適用し、当該送信用画像データに対応する識別情報を算出する。文字情報取得部175は、識別情報特定部174により算出された識別情報に対応する文字列データを、複合機100の問い合わせ部407を通じて取得する。なお、情報処理端末171は、複合機100と同様に、CPU、RAM、ROM、およびHDDを備える。CPUは、例えばROMに格納されたプログラムを実行することで、受信部173、識別情報特定部174および文字情報取得部175を実現する。
【0037】
図5は、本実施形態の複合機が実行する画像データ送信手順の一例を示す図である。当該手順は、ユーザから送信機能の起動指示が与えられたことをトリガとして進行する(ステップS501Yes)。
【0038】
送信機能は、操作キー203に含まれる「Send」ボタン(図2参照)を押下することで起動できる。送信機能が起動すると、操作パネル200のディスプレイ201に送信設定操作画面が表示される。図6は、送信設定操作画面の例を示す図である。
【0039】
図6に示すように、送信設定操作画面601は、あて先入力欄602、「あて先表」ボタン603、「送信方法選択」ボタン604、「文字認識選択」ボタン605、「原稿読込」ボタン606、「キャンセル」ボタン607、「画像選択」ボタン608を備える。あて先入力欄602は画像データの送信先の指定に使用される。あて先入力欄602には直接あて先を入力することができ、また、あて先表を用いてあて先を入力することもできる。「あて先表」ボタン603は、予め登録されているあて先一覧を表示する際に使用される。あて先一覧からユーザが選択したあて先が、あて先入力欄602に送信先として入力される。「送信方法選択」ボタン604は、電子メール、ftp、SMB等、画像データの送信方法の選択に使用される。「文字認識選択」ボタン605は一対のラジオボタンで構成され、送信用画像データを生成する元になる画像データ(以下、原画像データという。)に対してOCR処理を実行するか否かを指定する。「有」が選択された場合は原画像データに対してOCR処理が実行され、「無」が選択された場合は原画像データに対してOCR処理が実行されない。「原稿読込」ボタン606は、原画像データを画像読取部120で生成する場合に使用される。「キャンセル」ボタン607は、操作を中止して送信設定操作画面601を閉じるために使用される。なお、「画像選択」ボタン608については後述する。
【0040】
情報処理端末171において、低解像度の画像データに基づく当該画像データの文字列データの取得を実現する場合、ユーザは、まず、原画像データを画像読取部120において生成するとともに、原画像データに対してOCR処理を実施する(ステップS502、S503)。このとき、ユーザは、送信設定操作画面601において、「文字認識選択」ボタン605を「有」に設定した状態で「原稿読込」ボタン606を選択する。これにより、ディスプレイ201に原稿読込操作画面が表示される。
【0041】
図7は、画像読取操作画面の例を示す図である。図7に示すように、原稿読込操作画面701は、原稿読込が完了した際に選択される「読込完了」ボタン702、原稿読込を中止して送信設定操作画面601を表示させるために使用される「戻る」ボタン703を備える。画像読取部120において読み取られる原稿は、原稿トレイ111や原稿台103に載置され、操作パネル200のスタートキー211押下により原稿読取が開始する。原稿読込操作画面701が表示されてから、「読込完了」ボタン702が選択されるまでの間に画像読取部120において生成された画像データが原画像データとして画像データ保持部406(図4参照)に保持される。また、ここではOCR処理の実行が指定されているため、ユーザが「読込完了」ボタン702を選択すると、文字認識部401が画像データ保持部406に保持されている原画像データに対してOCR処理を実行し、文字列データを取得する。また、並行して、画像処理部402は画像データ保持部406に保持されている原画像データから送信用画像データを生成する(ステップS504)。
【0042】
また、原稿読込操作画面701において、ユーザが「読込完了」ボタン702を選択すると、ディスプレイ201に送信画像確認画面が表示される。図8は、送信画像確認画面の例を示す図である。この例では、送信画像確認画面801は、画像データ表示欄802、「送信」ボタン803、画像解像度選択部804、ページ選択ボタン805を備える。画像データ表示欄802には、画像処理部402が生成した送信用画像データが表示される。本実施形態では、画像処理部402は、画像データ保持部406に保持されている原画像データを予め指定されている解像度に変換することで送信用画像データを生成する。また、画像解像度選択部804を通じたユーザの指示により、予め指定されているステップで画像解像度を変更できるように構成されている。例えば、ユーザが画像データ表示欄802に表示された画像データを確認し、文字が目視できない等、解像度をもう少し高めた方がよいと判断した場合、ユーザは画像解像度選択部804の「高」ボタンを選択する。この場合、画像処理部402は、画像データ保持部406に保持されている原画像データから、先の画像解像度から所定のステップだけ画像解像度を高めた送信用画像データを生成し、画像解像度選択部804に表示する。同様に、ユーザが画像データ表示欄802に表示された画像データの解像度をもう少し低下させてもよいと判断した場合、ユーザは画像解像度選択部804の「低」ボタンを選択する。この場合、画像処理部402は、画像データ保持部406に保持されている原画像データから、先の画像解像度から所定のステップだけ画像解像度を低下させた送信用画像データを生成し、画像解像度選択部804に表示する。
【0043】
特に限定されないが、図8の例では、画像データ表示欄802の周囲に、画像データの表示範囲を上下左右の任意の方向に移動する移動ボタンが設けられている。また、図8では、全6頁の送信用画像データが生成されており、画像データ表示欄802に第4頁が表示されている例を示している。画像データ表示欄802に表示されるページは、ページ選択ボタン805の「前頁」ボタンまたは「次頁」ボタンを押下することで変更可能である。ユーザは、画像処理部402が生成した送信用画像データを画像データ表示欄802に順次表示して内容を確認する。
【0044】
また、図8の例では、送信画像確認画面801は「編集」ボタン806を備える。ユーザが、「編集」ボタン806を選択すると、ディスプレイ201に編集用画面が表示され、画像処理部402が保持している送信用画像データに対して、拡大、縮小、トリミング、エッジ強調、ボカシ、2in1等の任意の編集ができるように構成されている。なお、画像データの編集(画像処理)は、これらの例示に限らず、公知の手法を用いて実行することができる。本実施形態では、編集後の画像データが編集前の送信用画像データに代えて画像処理部402に保持される。また、編集用画面には、編集完了ボタンが設けられており、当該ボタンを選択することで、ディスプレイ201に送信画像確認画面801が表示されるようになっている。
【0045】
また、図8の例では、ユーザは、画像データ表示欄802の下方に設けられている再読込チェックボックス807をチェック状態(オン状態)にすることで、その画像データを原稿再読み取りする画像データとして指定することができる。再読み取りする画像データを指定した後、ユーザが「再読取」ボタン808を選択すると、再読み取り指定された原稿のページ数が送信画像確認画面801上に重ねて表示され、原稿トレイ111または原稿台103への当該原稿の載置が要求される。原稿載置後にユーザがスタートボタン211を押下すると当該原稿の画像が読み取られ、画像データ保持部406に保持されている先に取得された原画像データが、新たに取得された画像データに差し替えられる。また、、画像処理部402は、新たに取得された原画像データから送信用画像データを生成し、該当ページの送信用画像データを、新たな送信用画像データに差し替える。このような再読込機能は、原稿画像が斜めに取得された場合等に使用することができる。
【0046】
送信画像確認画面801においてユーザが「送信」ボタン803を選択すると、識別情報生成部403は、画像処理部402が保持している送信用画像データに対して上述の変換アルゴリズムを適用し、送信用画像データのハッシュ値を識別情報として算出する(ステップS505)。これと並行して、送信部405は、画像処理部402が保持している送信用画像データを、ネットワークアダプタ161を介して外部の装置(ここでは、情報処理端末171)に送信する(ステップS506)。
【0047】
識別情報生成部403は、識別情報の算出を完了すると、その旨を文字認識部401に通知するとともに、当該識別情報を記憶部404に記録する。当該通知を受けた、文字認識部401は、保持している文字列データを識別情報生成部403が記録した識別情報と対応づけて記憶部404に記録する(ステップS507)。また、送信部405による送信が完了すると手順が終了する。なお、このとき、画像データ保持部406に保持されている原画像データおよび画像処理部402に保持されている送信用画像データが削除される。
【0048】
なお、上記では、画像読取部120において新たに生成した原画像データを使用して送信用画像データを生成したが、既生成の画像データを原画像データとして使用してもよい。この場合、ユーザは、送信設定操作画面601において「画像選択」ボタン608を選択する。これにより、ディスプレイ201に、複合機100内に存在している画像データの中から原画像データを選択するための画像データ選択画面が表示され、ユーザが選択した画像データが原画像データとして画像データ保持部406に保持される。そして当該原画像データに対して、上述のOCR処理および送信用画像データ生成処理が実施される。この構成では、画像データ選択画面において、複合機100内に存在している画像データのうち、予め設定された所定の解像度以上の画像データのみを原画像データとして選択できる構成であることが好ましい。これにより、低解像度の画像データが原画像データに指定されることを防止できる。
【0049】
以上のように、この複合機100では、OCR処理の実行対象になる原画像データとは別に、情報処理端末等の外部の装置へ送信する送信用画像データが生成される。また、OCR処理により取得された文字列データは、送信用画像データから一意に変換結果が定まる変換アルゴリズムを適用して算出される識別情報と対応づけて記憶部404に記憶される。したがって、送信用画像データを受信した情報処理端末等の外部の装置において、送信用画像データから識別情報を取得できれば、受信した送信用画像データに対応する文字列データを画像管理装置から取得することができる。この構成では、送信用画像データ自体に上記変換アルゴリズムを適用して識別情報を算出する機能をソフトフェア等で実現するだけで情報処理端末等において識別情報を算出できるので、送信用画像データと識別情報との紐づけ情報を認識するための特別なデータフォーマットを認識するためのシステム構成は不要である。その結果、送信用画像データのデータサイズを小さくできるためネットワークの負荷を高めることがなく、かつ、任意の情報処理端末(クライアント装置)において、画像データの文字情報を高識字率で取得できるシステムを安価に構成することができる。
【0050】
続いて、文字列データの読出手順について説明する。ここでは、図4に示す情報処理端末171が、複合機100に対して文字列データを要求する事例を説明する。上述の画像データの送信手順において、送信用画像データのあて先に情報処理端末171が指定されていた場合、複合機100は、送信用画像データを情報処理端末171に送信する。この送信用画像データは、情報処理端末171において、ネットワークアダプタ172を介して受信部173に受信される。特に限定されないが、ここでは、受信部173は、受信した送信用画像データを保持する画像データ保持部としての機能も有している。
【0051】
以上の状況下において、情報処理端末171は、受信した送信用画像データに対応する文字列データを、以下のようにして、複合機100から取得する。受信した送信用画像データに対応する文字列データを取得する場合、まず、情報処理端末171の識別情報特定部174が、受信部173に保持されている送信用画像データに対して上述の変換アルゴリズムを適用し、識別情報であるハッシュ値を算出する。識別情報特定部173が使用する変換アルゴリズムは、複合機100の識別情報生成部403が使用する変換アルゴリズムと同一である。したがって、同一の送信用画像データに対して識別情報生成部403が算出するハッシュ値と識別情報特定部173が算出するハッシュ値とは同一の値になる。識別情報を算出した識別情報特定部173は、文字情報取得部175に当該識別情報を入力する。文字情報取得部175は、入力された識別情報を、ネットワークアダプタ172を介して複合機100へ送信する。なお、文字列データは複合機100に格納されているので、文字情報取得部175は、予め設定されている複合機100のアドレスをあて先として識別情報を送信すればよい。また、ネットワーク162に複数の複合機(画像管理装置)が接続されている場合には、予め設定されている全複合機のアドレスをあて先として識別情報を送信すればよい。
【0052】
図9は、複合機が実行する文字情報読出手順の一例を示す図である。当該手順は、ネットワーク162を介して複合機100と接続された任意の情報処理端末(図4では、情報処理端末171)から識別情報が与えられたことをトリガとして進行する(ステップS901Yes)。文字情報取得部175が送信した識別情報は、ネットワークアダプタ161を介して、複合機100の問い合わせ部407に入力される。
【0053】
識別情報が入力された問い合わせ部407は、当該入力に応じて、入力された識別情報に対応する文字列データを記憶部404から検索する(ステップS902)。これにより、その識別情報に対応づけて記録されている文字列データが抽出されることになる。上述のように、同一の送信用画像データに対して識別情報生成部403が算出するハッシュ値と識別情報特定部173が算出するハッシュ値とは同一の値になるので、抽出される文字列データは、送信用画像データ(低解像度画像データ)を生成する元にされた原画像データ(高解像度画像データ)に対するOCR処理により取得された文字列データである。
【0054】
入力された識別情報に対応する文字列データが抽出できた場合、問い合わせ部407は、ネットワークアダプタ161を介して、抽出した文字列データを要求元(情報処理端末171)へ送信する(ステップS903Yes、S904)。一方、入力された識別情報に対応する文字列データが抽出できなかった場合、問い合わせ部407は該当する文字列データが存在しない旨の通知を要求元へ送信する。図4に示す構成では、識別情報に対応する文字列データが記憶部404に格納されているはずであるが、ネットワーク162に複合機(画像管理装置)が複数台接続されている場合や、送信用画像データが複合機100から送信された後に加工された場合には、識別情報に対応する文字列データが抽出できない状況が発生しうる。なお、ftp、SMB、電子メール等による通信では、要求元のアドレスは、問い合わせ部407が識別情報を受信した際の送信元として容易に特定可能である。
【0055】
以上のようにして、複合機100から送信された検索結果(文字列データ、あるいは該当する文字列データがない旨の通知)は、ネットワークアダプタ172を介して、情報処理端末171の文字情報取得部175に取得される。これにより、情報処理端末171において、送信用画像データのみに基づいて、高識字率の文字列データを取得することができる。
【0056】
以上説明したように、本実施形態では、低解像度画像データのみを用いて、高解像度画像データに対するOCR処理により取得された高識字率の文字列データを取得することができる。したがって、ネットワークの負荷を高めることがない。また、情報処理端末等のクライアント装置では、送信用画像データに所定の変換アルゴリズムを適用することで識別情報を算出できるので、送信用画像データと識別情報との紐づけ情報を認識するための特別なデータフォーマットを使用する必要がなく、安価にシステムを構成することができる。
【0057】
なお、上述した各実施形態は本発明の技術的範囲を制限するものではなく、既に記載したもの以外でも、本発明の範囲内で種々の変形や応用が可能である。例えば、本発明では、OCR処理および送信用画像データ生成処理は、ともに原画像データに対して実施すればよいため、図5において、ステップS503とステップS504とは同時並行に実施されてもよく、順序が逆転していてもよい。また、本発明では、識別情報は、画像管理装置において生成された送信用画像データから生成されればよいため、図5において、ステップS505とステップS506とは、同時並行に実施されてもよく、順序が逆転していてもよい。また、ステップS507は、識別情報が生成された後に実施されればよく、ステップS506よりも前に実施されてもよい。
【0058】
また、上述の実施形態では、OCR機能および送信機能を有するデジタル複合機として本発明を具体化したが、デジタル複合機に限らず、画像読取機能、OCR機能、送信機能および画像管理機能を備える、スキャナ、複写機などの任意の画像管理装置、または当該装置を含む画像管理システムに本発明を適用することも可能である。
【産業上の利用可能性】
【0059】
本発明によれば、ネットワークの負荷を高めることがなく、かつ、任意のクライアント装置において、画像データの文字情報を高識字率で取得できるシステムを安価に構成することができ、画像管理装置および画像管理システムとして有用である。
【符号の説明】
【0060】
100 複合機
120 画像読取部
130 画像形成部
161 ネットワークアダプタ
171 クライアント装置(情報処理端末)
172 ネットワークアダプタ
173 受信部
174 識別情報特定部
175 文字情報取得部
200 操作パネル
401 文字認識部
402 画像処理部
403 識別情報生成部
404 記憶部
405 送信部
407 問い合わせ部

【特許請求の範囲】
【請求項1】
原稿の画像を読み取り、画像データを生成する画像読取部と、
前記画像読取部により生成された画像データに対して文字認識処理を実行し、文字列データを取得する文字認識部と、
前記画像読取部により生成された画像データに基づいて、外部の装置に送信するための画像データを生成する画像処理部と、
前記画像処理部で生成された送信用画像データに対し、画像データから一意に変換結果が定まる所定の変換アルゴリズムを適用し、当該送信用画像データを特定する識別情報を算出する識別情報生成部と、
前記識別情報生成部により生成された識別情報と、当該識別情報に対応する画像データから取得された文字列データとを対応づけて記憶する記憶部と、
前記送信用画像データを外部の装置に送信する送信部と、
を備える画像管理装置。
【請求項2】
前記識別情報が、送信用画像データの全データにハッシュ関数を適用することにより算出されるハッシュ値である請求項1記載の画像管理装置。
【請求項3】
原稿の画像を読み取り、画像データを生成する画像読取部と、
前記画像読取部により生成された画像データに対して文字認識処理を実行し、文字列データを取得する文字認識部と、
前記画像読取部により生成された画像データに基づいて、外部の装置に送信するための画像データを生成する画像処理部と、
前記画像処理部で生成された送信用画像データに対し、画像データから一意に変換結果が定まる所定の変換アルゴリズムを適用し、当該送信用画像データを特定する識別情報を算出する識別情報生成部と、
前記識別情報生成部により生成された識別情報と、当該識別情報に対応する画像データから取得された文字列データとを対応づけて記憶する記憶部と、
前記送信用画像データを外部の装置に送信する送信部と、
を有する画像管理装置と、
前記送信用画像データを受信する受信部と、
受信した送信用画像データに対して前記変換アルゴリズムを適用し、当該送信用画像データに対応する識別情報を算出する識別情報特定部と、
前記識別情報特定部により算出された識別情報に対応する文字列データを前記画像管理装置から取得する文字情報取得部と、
を有するクライアント装置と、
を備える画像管理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−109566(P2011−109566A)
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願番号】特願2009−264671(P2009−264671)
【出願日】平成21年11月20日(2009.11.20)
【出願人】(000006150)京セラミタ株式会社 (13,173)
【Fターム(参考)】