説明

画像処理装置およびこれを備えた原稿読取システム

【課題】画像処理装置において、ユーザが原稿を手で押さえて読み取り時の紙面を正常に保持しながら、特定の操作を必要とすることなく、所望のタイミングで撮影画像を記録可能とする。
【解決手段】撮影画像において特定領域A1、A2を設定する特定領域設定部33と、特定領域においてユーザの指先を認識する指認識部31と、指認識部にて認識された手指の動きを検出する動き検出部35と、動き検出部の検出結果に基づき、ユーザからの動作指令が与えられたと判定した場合に、撮影画像を記録する画像記録部36とを備えた構成とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、本などの原稿を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムに関する。
【背景技術】
【0002】
本のページを自然に開いた状態で上方から撮影してページの画像を読み取ることができるブックスキャナ(書画カメラ)が普及している(特許文献1参照)。このようなブックスキャナを用いると、ページをめくりながらページの画像を次々に読み取ることができるため、本を電子化する作業を効率良く行うことができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−103240号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、背に綴じ部を設けた一般的な本では、見開き状態において中央部がV字状に落ち込んだり、各ページの間に隙間が生じたりするため、紙面を両手で押さえるなどして読み取り(撮像)時の紙面を正常に保持する(すなわち、紙面の歪みに起因する画像のずれ等を防止する)必要がある。
【0005】
しかしながら、上記特許文献1に記載のような従来のブックスキャナでは、上述のように紙面を両手で押さえた状態で原稿を読み取るための特定の操作(例えば、シャッターボタンの押下や、マウスクリック等)を行うことが難しいという問題があった。これに対し、本を手で押さえる代わりに保持具を使用することが考えられるが、複数ページの読み取りを行う場合には、各ページを読み取る度にユーザが本を保持具にセットし直すという煩わしい操作が必要となる。また、所定の時間間隔で自動的に原稿読取を実施することも考えられるが、時間間隔の設定が長すぎる場合には、無駄な待ち時間が生じる一方、時間間隔の設定が短すぎる場合には、ページをめくる途中で読み取りが行われるなどして画像の読み取りミスが生じる。
【0006】
本発明は、このような従来技術の課題を鑑みて案出されたものであり、ユーザが原稿を手で押さえて読み取り時の紙面を正常に保持しながら、特定の操作を必要とすることなく、所望のタイミングで撮影画像を記録可能とする画像処理装置およびこれを備えた原稿読取システムを提供することを主目的とする。
【課題を解決するための手段】
【0007】
本発明は上記目的を達成するために為されたものであり、原稿の紙面を載置面とともに撮影した撮影画像を取得する撮影画像取得部と、前記撮影画像において特定領域を設定する特定領域設定部と、前記特定領域においてユーザの指先を認識する指認識部と、前記指認識部にて認識された前記指先の動きを検出する動き検出部と、前記動き検出部が、前記指先の動きが所定時間以上静止していることを検出したときに、前記撮影画像を記録する画像記録部とを備えたものである。
【発明の効果】
【0008】
このように本発明によれば、ユーザが原稿を手で押さえて読み取り時の紙面を正常に保持しながら、特定の操作を必要とすることなく、所望のタイミングで撮影画像を記録する
ことが可能となるという優れた効果を奏する。さらに、特定領域において、ユーザの指先が所定時間以上静止していることを検出したときに、撮影画像を記録するようにしているので、特定領域をコンテンツ領域外に設定すれば、ユーザの手指等がコンテンツとともに撮像画像として記録されてしまうことを防止することができる。
【図面の簡単な説明】
【0009】
【図1】本実施形態に係る原稿読取システムを示す全体構成図
【図2】ブックスキャナ1およびPC2の概略構成を示すブロック図
【図3】本原稿読取システムの基本撮影モードにおける原稿読取の手順を示すフロー図
【図4】図3に示した輪郭検出(ST103)の手順を示すフロー図
【図5】輪郭検出の要領を説明する模式図
【図6】図3に示したメッシュモデル生成(ST104)の手順を示すフロー図
【図7】メッシュモデル生成の要領を説明する模式図
【図8】メッシュモデルに基づいて画像を平面化した画像の模式図
【図9】本原稿読取システムの自動撮影モードにおける原稿読取の手順を示すフロー図
【図10】図9に示した特定領域設定(ST406)の手順を示すフロー図
【図11】(A)特定領域設定および(B)特定領域における指認識の要領を説明する模式図
【図12】特定領域の再設定の要領を説明する模式図((A)変更前、(B)変更後)
【図13】特定領域の再設定の要領を説明する模式図((A)変更前、(B)変更後)
【図14】図9に示した再撮影判定(ST417)の手順を示すフロー図
【図15】(A)動作解除領域の設定および(B)動作解除領域における指認識の要領を説明する模式図
【発明を実施するための形態】
【0010】
上記課題を解決するためになされた第1の発明は、原稿の紙面を載置面とともに撮影した撮影画像を取得する撮影画像取得部と、前記撮影画像において特定領域を設定する特定領域設定部と、前記特定領域においてユーザの指先を認識する指認識部と、前記指認識部にて認識された前記指先の動きを検出する動き検出部と、前記動き検出部が、前記指先の動きが所定時間以上静止していることを検出したときに、前記撮影画像を記録する画像記録部とを備えたものであり、これにより、ユーザが原稿を手で押さえて読み取り時の紙面を正常に保持しながら、特定の操作を必要とすることなく、所望のタイミングで撮影画像を記録することが可能となるという優れた効果を奏する。さらに、特定領域をコンテンツ領域外に設定すれば、ユーザの手指等がコンテンツとともに撮像画像として記録されてしまうことを防止することができる。
【0011】
また、第2の発明は、前記第1の発明において、前記特定領域設定部は、前記撮影画像に含まれるコンテンツの領域と重ならない位置に前記特定領域を配置する構成とする。
【0012】
これによると、コンテンツがユーザの手指で覆われる(すなわち、撮像画像においてコンテンツの一部が欠落する)ことを回避しつつ、所望のタイミングで撮影画像を記録することが可能となる。
【0013】
また、第3の発明は、前記第1または第2の発明において、前記特定領域設定部は、前記輪郭成分から算出された前記原稿のサイズに基づき、前記特定領域を設定する構成とする。
【0014】
これによると、サイズの異なる種々の原稿に対して、適切なサイズの特定領域を適切な位置に容易に配置することが可能となる。この場合、特定領域を原稿の四隅に重ならないように配置することにより、原稿の輪郭や位置が検出できなくなるという不都合を回避することができる。
【0015】
また、第4の発明は、前記第1から第3の発明のいずれかにおいて、前記特定領域は、前記ユーザの左右の手指に対応して前記撮像画像における原稿の左右にそれぞれ配置された2つの領域からなる構成とする。
【0016】
これによると、ユーザが原稿の左右を手で押さえることにより、読み取り時の紙面を確実に正常に保持することができる。この場合、原稿の一方側(例えば、下側)を手で押さえたときのように、原稿の他方側(例えば、上側)が浮き上がるなどの不都合を回避することができる。
【0017】
また、第5の発明は、前記第1から第4の発明のいずれかにおいて、前記特定領域設定部は、前記撮影画像に含まれるコンテンツの領域と、前記特定領域との最短距離が所定の閾値よりも大きい場合、当該最短距離が前記閾値以下となるように前記特定領域を拡大する構成とする。
【0018】
これによると、ユーザが原稿を手で押さえることが可能な領域(特定領域)を原稿の中心側に拡げて、原稿が厚い場合などでも、読み取り時の紙面を確実に正常に保持することができる。
【0019】
また、第6の発明は、前記第1から第5の発明のいずれかにおいて、前記特定領域設定部は、前記特定領域と重ならないように動作解除領域を設定し、前記指認識部は、前記動作解除領域においてユーザの手指を認識し、前記画像記録部は、前記動作解除領域における前記動き検出部の検出結果に基づき、前記ユーザからの動作解除指令が与えられたと判定した場合に、前記動作指令に拘わらず前記原稿画像を記録しない構成とする。
【0020】
これによると、記録する画像をユーザが確認して画像のずれ等を発見した場合には、特定の操作を必要とすることなく、撮影画像の記録を取り消すことができ、再び所望のタイミングで撮影画像を記録することが可能となる。
【0021】
また、第7の発明は、前記第1から第6の発明のいずれかに係る画像処理装置と、前記撮影画像を撮影するカメラ部を有する画像入力装置とを備えた原稿読取システムである。
【0022】
以下、本発明の実施の形態について図面を参照しながら説明する。
【0023】
図1は、本実施形態に係る原稿読取システムを示す全体構成図である。この原稿読取システムは、本(原稿)Bの紙面の画像を読み取って、紙面の画像データを取得するものであり、ブックスキャナ(画像入力装置)1とPC(画像処理装置)2とからなっている。
【0024】
ブックスキャナ1は、本Bの紙面を撮像するカメラ部3と、このカメラ部3を保持するスタンド部4とを備え、スタンド部4を机などの載置面5に据え付けるとともに、カメラ部3の真下の載置面5上に本Bを載置して、カメラ部3で本Bの紙面を撮像する。ブックスキャナ1の基本撮影モードでは、本Bは、自然に開いた状態で紙面の撮影が行われ、本Bの見開き2ページの撮影画像が得られる。そして、歪みのある紙面の画像を平面化する処理が行われて、見開き2ページ分の平面化された紙面の画像を取得することができる。
【0025】
また、本Bの紙面を撮像する際には、ユーザは本Bの紙面を手で押さえて紙面を正常に保持する必要が生じる場合がある。このような場合でも、ブックスキャナ1では、自動撮影モードにおいて、ユーザが本Bを押さえる手指の位置や動きを認識して、これをユーザからの動作指令とすることにより、ユーザが特定の操作(例えば、シャッターボタンの押下や、PC2のマウスクリック等)をする必要なしに所望のタイミングで撮像を行うことが可能である。これにより、紙面の歪みに起因する画像のずれ等を効果的に防止して、所望の画像を記録することができる。
【0026】
図2は、ブックスキャナ1およびPC2の概略構成を示すブロック図である。ブックスキャナ1は、カメラ部3を備えた撮像処理部11と、操作指示部12と、外部インタフェイス13とを有している。PC2は、外部インタフェイス21と、画像データ入力部(撮影画像取得部)22と、画像処理部23と、制御部24と、表示データ生成部25と、表示器26と、入力部27と、データ格納部28とを有している。なお、PC2の画像処理部23および表示データ生成部25は、画像処理アプリケーションなどのプログラムをCPUで実行するソフトウェア処理で実現される。
【0027】
PC2では、キーボードなどからなる入力部27の操作により、ブックスキャナ1で撮影される画像の解像度、フレームレート、シャッタスピードなどの撮像条件が入力され、この動作条件が制御部24からブックスキャナ1に送信され、ブックスキャナ1では、PC2から送信された動作条件に基づいて操作指示部12による指示にしたがって撮像処理部11が所要の動作を行う。
【0028】
PC2の画像データ入力部22では、ブックスキャナ1から送信される画像データをメモリに格納し、必要に応じてその画像データを画像処理部23に出力する。この画像データ入力部22では、原稿(ここでは本の紙面)Bが載置面5とともに写った撮影画像を取得する。
【0029】
画像処理部23は、自動撮影モードにおいてユーザの手指を認識する指認識部31と、撮影画像から本Bのページの輪郭を検出するページ輪郭検出部(輪郭成分抽出部)32と、撮影画像において指認識部31が手指を認識する所定の領域(以下、「特定領域」という。)を設定する特定領域設定部33と、撮影画像に含まれるコンテンツ(ここでは、文字、図形その他の人の知覚によって認識される情報)の領域を認識するコンテンツ領域認識部34と、指認識部31によって認識された手指(指先)の動きを検出する動き検出部35と、動き検出部の検出結果に基づきユーザからの動作指令が与えられたと判定した場合に、撮影画像データをデータ格納部28に格納すると共に、撮影画像データを表示データ生成部25に送出する画像記録部36とを有している。
【0030】
指認識部31は、肌色と指の形状情報に基づき、指先の位置と指の向きとを認識する。ここでは、指認識部31は、カメラ部3からのRGB画像(撮影画像)をHSV変換し、HSV変換された画像における肌色の色相(Hue)と彩度(Saturation)の範囲を肌色領域として抽出する。そして、抽出した肌色領域を2値化して手指の輪郭を算出し、この算出した輪郭について形状認識(予め準備された複数の手指の形状パターンと比較)して、指の本数と各指先の座標とを推定する。さらに、指先の位置と指の輪郭から指の方向を算出する。なお、指認識部31は、左右の手指の位置等をそれぞれ認識する第1指位置検出部41および第2指位置検出部42を有している。
【0031】
コンテンツ領域認識部34は、ページ輪郭検出部32が検出した輪郭情報(ここでは、図5(B)中の6つの特異点SLt、SLb、SRt、SRb、SCt、SCb等の輪郭成分)からコンテンツ領域を決定する。ここでは、複数の原稿のサイズと、それらに対応するコンテンツ領域の情報(座標)とが設定されたテーブル情報が予め準備されており、
コンテンツ領域認識部34は、そのテーブル情報に基づきコンテンツ領域C1、C2(図12参照)を決定することができる。この場合、輪郭情報に基づき算出された原稿のサイズと一致する原稿のサイズがテーブル情報に存在しない場合には、最も値の近い原稿サイズに基づきコンテンツ領域の座標が決定される。
【0032】
或いは、コンテンツ領域認識部34は、指認識部31においてHSV変換された画像において、原稿の背景色に相当する色相(Hue)、彩度(Saturation)、明度(Value)領域を抽出し、これにより、コンテンツ領域を推定することも可能である。さらに、コンテンツ領域を所定の関係式に基づき算出してもよい。なお、本実施形態では、左右のページにそれぞれ1つのコンテンツ領域を検出した例を示すが、ページ内により多くのコンテンツ領域が検出される構成も可能である。
【0033】
動き検出部35は、指認識部31によって認識された手指(指先)についてフレーム間の移動量を考慮することにより動き検出を行う。動き検出では、特定領域をROI(Region of Interest)領域に設定し、このROI領域において、指先位置が10フレームの間に規定値(例えば、100画素)以内の変動であれば、手指が静止していると判定する。
【0034】
なお、指認識、コンテンツ領域認識および動き検出の方法については、上述の方法に限らず周知の技術を適宜用いることができる。
【0035】
図3は、本原稿読取システムの基本撮影モードにおける原稿読取の手順を示すフロー図である。まず、ユーザがブックスキャナ1のカメラ部3の下に本(原稿)をセットする(ST101)。そして、ブックスキャナ1を起動させるとともに、PC2で所要のアプリケーションを起動させると、画像の入力、すなわちブックスキャナ1で撮像が開始されてその撮像データがPC2に送信され(ST102)、PC2の画像データ入力部22では、本Bの紙面を載置面5とともに撮影した撮影画像を取得する。
【0036】
そしてPC2では、ページ輪郭検出部32により、撮影画像から本Bのページの輪郭を検出する処理が行われ(ST103)、続いて、検出した輪郭情報から、本Bの全体を対象にしてメッシュモデルを生成する処理が行われる(ST104)。さらに、生成されたメッシュモデルに基づいて、画像記録部36によって画像を平面化する画像変換処理が行われる(ST105)。ここでは、射影変換(アフィン変換)により画像の平面化が行われ、フラットベッドスキャナで読み取ったものと同様の画像を取得することができる。
【0037】
このようにして平面化された画像のデータは表示データ生成部25に送られ、そこで生成された表示データに基づき表示器26に表示される(ST106)。これによりユーザは画像の記録が適切に行われたか否かを確認することができる。また、平面化された画像のデータはデータ格納部28に格納される(ST107)。
【0038】
図4は、図3に示した輪郭検出(ST103)の手順を示すフロー図であり、図5は、輪郭検出の要領を説明する模式図である。ここでは、本Bの紙面を載置面5とともに撮影した撮影画像から、本Bの輪郭情報として、本Bの載置状態を大まかに把握するための主要直線成分と、ページの上下左右およびセンタ(左右中央)における端点である複数の特異点を検出する。
【0039】
まず、本全体の外形の主要直線成分を検出する(ST201)。ここでは、図5(A)に示すように、撮影画像内で、本B全体の外形における左右の側縁(通常は表紙の側縁)を示す2本の直線と、左右のページの綴じ目(センタ)を示す1本の直線を検出する。この直線成分の検出は、ハフ(Hough)変換により行えばよい。
【0040】
また、撮影画像に対してエッジ検出を行う(ST202)。このエッジ検出は、キャニー(Canny)法を用いて行えばよい。ついで、取得したエッジ画像内の輪郭成分(原稿の
輪郭を構成する画素)を抽出する(ST203)。ついで、取得した輪郭成分に基づいて、ページの上下左右の端点である特異点を検出する(ST204)。ここでは、図5(B)に示すように、見開き2ページの撮影画像において、ページの上下左右の端点として6つの特異点SLt、SLb、SRt、SRb、SCt、SCbが検出される。
【0041】
そして、特異点検出(ST204)で取得した特異点の妥当性を判断する(ST205)。ここでは、取得した特異点と、直線成分検出(ST201)で取得した直線成分とを比較して、ページの上下左右の端点である特異点の妥当性を判断する。ここで、特異点が妥当であるものと判定されると、その特異点を確定する(ST206)。
【0042】
なお、エッジ検出(ST202)、輪郭成分抽出(ST203)、および特異点検出(ST204)の各処理は、直線成分検出(ST201)の処理と平行して行うようにしてもよい。
【0043】
図6は、図3に示したメッシュモデル生成(ST104)の手順を示すフロー図であり、図7は、メッシュモデル生成の要領を説明する模式図であり、図8は、メッシュモデルに基づいて画像を平面化した画像の模式図である。ここでは、本Bの紙面を載置面5とともに撮影した撮影画像から、本の紙面全体を対象にしたメッシュモデルを生成する。
【0044】
まず、本Bのページの歪曲した輪郭線を表す歪曲成分を抽出する(ST301)。図7(A)に示すように、ページの上縁および下縁の輪郭線は、外側に膨らんだ歪曲した状態で表示され、このページの上縁および下縁の歪曲した輪郭成分(輪郭を構成する画素)を、図4に示したエッジ検出(ST202)で取得したエッジ画像から抽出する。そして、歪曲成分の連続性に基づいて歪曲成分の妥当性を判断する(ST302)。ここで、歪曲成分が妥当でないものと判定されると、途切れた部分の補間処理を行う(ST303)。これにより、歪曲成分が途切れることなく連続した状態となる。
【0045】
ついで、歪曲成分を高さ成分に変換する演算を行う(ST304)。撮影画像上でページの上縁および下縁の輪郭線が歪曲した状態で表示されるのは、3次元的には紙面が上側に凸となるように湾曲していることによるものであり、ページの上縁および下縁の輪郭線を示す歪曲成分に基づいて、ページの上縁および下縁の3次元的な湾曲状態を示す高さ成分を求めることができる。具体的には載置面5に対してページの上縁および下縁の高さ(Z軸の座標)を一定間隔で求める。この高さ成分により、ページの上縁および下縁の実際の長さを推定することができる。
【0046】
ついで、縦横のメッシュラインを生成し(ST305)、その縦横のメッシュラインが交差するメッシュ交点の座標をメッシュテーブルに格納する(ST306)。ここでは、図7(B)に示すように、ページの上縁および下縁の高さ成分に基づいて、ページの上縁および下縁を示す曲線をメッシュ数に応じて等間隔に分割する基点の座標を求め、上縁および下縁の互いに対応する基点を結線して縦メッシュラインを求める。ついで、縦メッシュラインをメッシュ数に応じて等間隔に分割する点(メッシュ交点)の座標を求め、その点を結線して横メッシュラインを求める。
【0047】
なお、このように取得したメッシュモデルに基づく画像は、図8に示すように、画像記録部36により平面化されて格納される。
【0048】
図9は、本原稿読取システムの自動撮影モードにおける原稿読取の手順を示すフロー図である。この自動撮影モードにおいて、前述の基本撮影モードと同様の処理については詳細な説明を省略する。
【0049】
まず、ユーザは、ブックスキャナ1のカメラ部3の下に本をセットし(ST401)、ページをめくることにより、撮影を開始するページを開く(ST402)。このとき、ブックスキャナ1の動作モードとして自動撮影モードが選択される。
【0050】
この動作モードの選択は、ユーザがブックスキャナ1またはPC2に対して所定の操作(ボタンの押下等)を行うことにより実行可能である。或いは、ユーザの特別な操作なしに、撮影画像に基づき動作モードを選択することもできる。例えば、図1に示したブックスキャナ1の脚部に示されたガイドラインLに対し、本Bの外形輪郭における上辺の位置がガイドラインL上にある場合にのみ自動撮影モードを選択する構成としてもよい。
【0051】
その後、ブックスキャナ1で撮影が開始されてその撮影画像のデータがPC2に所定のフレームレートにて順次に送信される(ST403)。ここでの撮影画像は、比較的低解像度(例えば、VGA、30fps)のものであり、PC2の表示器26の画面における第1の画像表示枠にリアルタイム画像として表示される(ST404)。
【0052】
続いて、ページ輪郭検出部32により、撮影画像から本Bのページの輪郭を検出する処理が行われ、輪郭情報として6つの特異点SLt、SLb、SRt、SRb、SCt、SCbの座標データがそれぞれ取得される(ST405)。そして、特定領域設定部33により、それら特異点の座標データに基づき、指認識部31による手指の認識に用いるための特定領域を設定する処理が行われる(ST406)。ここでは、左右の手指にそれぞれ対応する2つの特定領域(第1特定領域、第2特定領域)が設定される。
【0053】
詳細は後述するが、図11(A)に示すように、第1および第2特定領域A1、A2は、矩形状をなし、撮影画像における原稿の左右にそれぞれ配置される。第1および第2特定領域A1、A2は、その少なくとも一部が原稿の紙面と重なり、ここでは、紙面外の領域も含む。これにより、特定領域(指認識を行う領域)にページの左右端が確実に含まれるようにして、指先がページ上に位置しているにも拘わらず指認識できないという不都合を回避することができる。
【0054】
次に、指認識部31は、算出された第1および第2特定領域A1、A2において、それぞれ手指の認識処理を行い(ST407)、左右の手指(指先)がそれぞれ第1および第2特定領域A1、A2内に位置しているか否かを判定する(ST408、ST409)。ここでは、左右の手指がともに特定領域内に位置すると判定された場合(ST408;Yes、ST409;Yes)にのみ、各手指の動き検出を行う(ST410)。この動き検出において、第1および第2特定領域A1、A2におけるユーザの左右の手指が、それぞれ規定時間以上静止している(すなわち、ユーザが撮影画像を記録するための動作指令を与えた)と判定されると(ST411;Yes)、制御部24は、カメラ部3における撮影画像の解像度の設定を変更し(ST412)、比較的高解像度の画像データがPC2に入力されるようにする(ST413)。
【0055】
次に、画像記録部36は、その高解像度の画像のデータを、表示データ生成部25を介して表示器26に表示させると共に、データ格納部28に格納する(ST414)。このとき、高解像度の画像は、表示器26において、上述のリアルタイム撮影画像が表示される第1の画像表示枠とは別に、第2の画像表示枠に表示される。なお、ST414において画像が格納される際には、ユーザに報知するためにブックスキャナ1またはPC2においてシャッタ音を出すようにするとよい。また、ST414における画像の表示は、表示
器の画面サイズが小さく第2の画像表示枠を設け難い場合や、ユーザが表示を必要としない場合には省略することができる。その後、制御部24は、カメラ部3における撮影画像の解像度の設定を変更し(ST415)、再び比較的低解像度の画像データがPC2に入力されるようにする(ST416)。
【0056】
その後、データ格納部28に格納された高解像度の画像について、ユーザが再撮影を必要とするか否かを判断する再撮影判定の処理が実施される(ST417)。これにより、ユーザは、自動撮影された画像に不満がある場合には、再撮影を実行することができる。
【0057】
上記ST402〜ST417のステップは、撮影が必要な各ページに対して繰り返し実行され、最終的に全てのページの撮影が完了したと判定されると(ST418;Yes)、自動撮影モードが終了する。この終了の判定は、例えば、ブックスキャナ1またはPC2に対するユーザの所定の操作(自動撮影モード終了の指令)に基づき行われる。なお、特定領域中の手指は、原稿と共に撮影されるが、画像記録部36は、画像中の手指を消去する処理を行うことができる。また、画像記録部36は、基本撮影モードの場合と同様に、撮像画像を格納する前に平面化等の画像処理を適宜行うことが可能である。
【0058】
図10は、図9に示した特定領域設定(ST406)の手順を示すフロー図であり、図11は、(A)特定領域設定および(B)特定領域における指認識の要領を説明する模式図であり、図12および図13は、設定された特定領域の再設定の要領を説明する模式図((A)変更前、(B)変更後)である。
【0059】
まず、特定領域設定部33は、ページ輪郭検出部32から取得した特異点に基づき、原稿のサイズ(本実施形態では、見開き状態のページのサイズ)を算出する(ST501)。続いて、画像記録部36は、周知の処理に基づき撮像画像のデスキュー(傾き補正)を実施し(ST502)、デスキュー画像を表示器26の第2の画像表示枠に表示させる(ST503)。続いて、特定領域設定部33は、ページサイズから第1および第2特定領域A1、A2をそれぞれ撮像画像に配置する(ST504)。
【0060】
ここでは、複数のページサイズと、それらに対応する第1および第2特定領域A1、A2の情報(座標)とが設定されたテーブル情報が予め準備されており、特定領域設定部33は、そのテーブル情報に基づき第1および第2特定領域A1、A2を設定することができる。この場合、算出されたページサイズと一致するページサイズがテーブル情報に存在しない場合には、最も値の近いページサイズに基づき、特定領域の座標が決定される。また、別法として、特定領域を所定の関係式に基づき算出してもよい。
【0061】
ページサイズは、図11(A)に示すように、ページの上下左右の端点の4つの特異点SLt、SLb、SRt、SRbの座標データ(Xa,Ya)、(Xa,Yb)、(Xb,Ya)、(Xb,Yb)に基づき決定される。ここで、第1および第2特定領域A1、A2において、矩形の左右辺はそれぞれY軸方向に平行であり、矩形の上下辺はそれぞれX軸方向に平行である。また、第1特定領域A1において、左右辺の位置の座標X1、X2と上下辺の位置の座標Y2、Y1とは以下の式1、式2の関係を満たす。
【0062】
X1<Xa<X2・・・(式1)
Ya<Y1<Y2<Yb・・・(式2)
つまり、第1特定領域A1は、左ページの左辺(座標Xa)を左右に跨ぎ、且つ左ページの上下の中間に配置される。特に、ページの上下方向の中心位置と、第1特定領域A1の上下方向の中心位置とを一致させることが好ましい。
【0063】
同様に、第2特定領域A2において、左右辺の位置の座標X3、X4と上下辺の位置の
座標Y2、Y1とは以下の式3、式4の関係を満たす。
【0064】
X3<Xb<X4・・・(式3)
Ya<Y1<Y2<Yb・・・(式4)
つまり、第2特定領域A2は、右ページの右辺(座標Xb)を左右に跨ぎ、且つ右ページの上下の中間に配置される。ここで、第2特定領域A2のサイズおよび上下方向の位置は第1特定領域A1と同一に設定されることが好ましいが、必ずしもこれに限定される必要はない。
【0065】
なお、図11(B)に示すように、左の手指の動き検出は、指認識部31によって検出された指先(ここでは、2本)の座標(X5,Y5)、(X6,Y6)が第1特定領域A1内にある場合に行われる。同様に、右の手指の動き検出は、2本の指先の座標(X7,Y7)、(X8,Y8)が第2特定領域A2内にある場合に行われる。
【0066】
このように、2つの特定領域A1、A2が配置された後には、再び図10に示すように、特定領域設定部33は、コンテンツの領域の抽出を行う(ST505)。ここでは、図12(A)に示すように、左右のページにそれぞれ1つのコンテンツ領域C1およびコンテンツ領域C2が抽出される。続いて、特定領域設定部33は、コンテンツ領域とこれに対応する特定領域との最短距離(例えば、コンテンツ領域C1の左辺と、特定領域A1の右辺との距離)を算出し(ST506)、この最短距離に基づき両領域の重なりを判定する(ST507)。そして、図12(A)に示すように、両領域に重なりが生じている場合(Yes)には、図12(B)に示すように、該当特定領域(図12(B)中では、第1特定領域A1)をコンテンツ領域から離間させる外方(ここでは、左方向)に予め設定された距離だけ移動させる(ST508)。その後、再びST506に戻り、最終的に全ての特定領域について対応するコンテンツ領域との重なりが解消されるまでST506〜ST508を繰り返す。これにより、画像中のコンテンツがユーザの手指で覆われる(すなわち、撮像画像においてコンテンツの一部が欠落する)ことを回避することが可能となる。
【0067】
一方、特定領域とコンテンツ領域とが重なっていない場合(ST507;No)、ST506で算出された最短距離が規定値を越えているか否かを判定する(ST509)。そこで、図13(A)に示すように、最短距離Wが規定値(所定の閾値)を超えている場合(すなわち、コンテンツ領域と特定領域とが過度に離間されている場合)、図13(B)に示すように、その最短距離Wが規定値以下となるまで、特定領域の内側(図12(B)中では、第1特定領域A1の右辺側)を延長するように所定の長さだけ拡大する(ST510)。この特定領域の拡大は、最終的に最短距離Wが規定値以下となるまで繰り返される。これにより、原稿が厚い場合などでも、読み取り時の紙面を確実に正常に保持することができる。なお、ここでは、特定領域を拡大したが、特定領域のサイズを変えずに、最短距離Wが規定値以下となるまで、特定領域を内側に移動させる構成も可能である。
【0068】
その後、全ての特定領域に対してコンテンツ領域との重なりが解消されたか否かが判定され(ST507)、最終的に全ての特定領域に対する処理が完了すると(ST511)(Yes)、特定領域の設定処理が終了する。
【0069】
なお、上記ST505〜ST510における特定領域とコンテンツ領域との重なりを回避する処理は、必要に応じて省略してもよい。
【0070】
図14は、図9に示した再撮影判定(ST417)の手順を示すフロー図であり、図15は、(A)動作解除領域の設定および(B)動作解除領域における指認識の要領を説明する模式図である。
【0071】
まず、特定領域設定部33は、上述の第1および第2特定領域A1、A2と同様に、図15(A)に示す矩形の動作解除領域A3を設定する(ST601)。この動作解除領域A3の位置およびサイズは、6つの特異点SLt、SLb、SRt、SRb、SCt、SCbに基づき決定される。ここで、動作解除領域A3において、矩形の左右辺はそれぞれY軸方向に平行である。また、矩形の上下辺は、それぞれX軸方向に平行であり、第1および第2特定領域A1、A2と同じ位置にある。動作解除領域A3において、左右辺の座標X10、X11は以下の式5の関係を満たす。
【0072】
x10<xc<x11・・・(式5)
つまり、動作解除領域A3は、両ページのセンタ(座Xc)を左右に跨ぎ、且つ両ページの上下の中間に配置される。なお、動作解除領域の上下辺の座標は、必ずしも第1および第2特定領域と同じ位置にある必要はないが、同じ位置とすることによりユーザの操作性が高まる。
【0073】
このように、動作解除領域A3が配置された後には、再び図14に示すように、指認識部31は、動作解除領域A3において手指の認識処理を行い(ST602)、手指が動作解除領域A3に位置しているか否かを判定する(ST603)。ここでは、図15(B)に示すように、ユーザの右の手指が特定領域内に位置すると判定された場合(Yes)、手指の動き検出を行う(ST604)。この動き検出において、動作解除領域A3におけるユーザの手指が、規定時間以上静止している(すなわち、ユーザが動作解除指令を与えた)と判定されると(ST605;Yes)、画像記録部は、ST411(Yes)におけるユーザの動作指令に拘わらず、図9のST414の動作を取り消して、そこで保存した画像を消去する(ST606)。一方、動作解除領域A3において手指が認識されないか、或いは、ユーザの手指が規定時間以上静止しない場合には(ST605;No)、最終的に撮影が終了するまで(ST607;Yes)、図9のST402に戻って次ページに対して同様のステップを実行する。
【0074】
このように、ユーザは、記録する画像を確認して画像のずれ等を発見した場合には、一方の手指を特定領域から動作解除領域に移動させてそのまま所定時間静止させることにより、特定の操作を必要とすることなく、撮影画像の記録を取り消すことができる。
【0075】
本発明を特定の実施形態に基づいて説明したが、これらの実施形態はあくまでも例示であって、本発明はこれらの実施形態によって限定されるものではない。例えば、上記実施形態における手指の認識は、ユーザの両手を対象としたが、片手を対象としてもよい。その場合、特定領域も片手に対応する一方側のみに設定される(すなわち、特定領域は少なくとも1つ以上設定すればよい。)。また、上記実施形態では、特定領域または動作解除領域において、ユーザの手指が一定時間静止したことをもって、ユーザの動作指令または動作解除指令が与えられたものとしたが、必ずしも手指の静止に限らず、領域内における手指の所定の動きが検出されたことをもって動作指令または動作解除指令が与えられたものとしてもよい。なお、上記実施形態に示した本発明に係る画像処理装置およびこれを備えた原稿読取システムの各構成要素は、必ずしも全てが必須ではなく、少なくとも本発明の範囲を逸脱しない限りにおいて適宜取捨選択することが可能である。
【産業上の利用可能性】
【0076】
本発明に係る画像処理装置およびこれを備えた原稿読取システムは、ユーザが原稿を手で押さえて読み取り時の紙面を正常に保持しながら、所望のタイミングで撮影画像を記録することを可能とし、本などの原稿を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムなどとして有用である。
【符号の説明】
【0077】
1 ブックスキャナ(画像入力装置)
2 PC(画像処理装置)
3 カメラ部
22 画像データ入力部(撮影画像取得部)
24 制御部
26 表示器
28 データ格納部
31 指認識部
32 ページ輪郭検出部(輪郭成分抽出部)
33 特定領域設定部
34 コンテンツ領域認識部
35 動き検出部
36 画像記録部
A1、A2 特定領域
A3 動作解除領域
C1、C2 コンテンツ領域
SLt、SLb、SRt、SRb、SCt、SCb 特異点

【特許請求の範囲】
【請求項1】
原稿の紙面を載置面とともに撮影した撮影画像を取得する撮影画像取得部と、
前記撮影画像において特定領域を設定する特定領域設定部と、
前記特定領域においてユーザの指先を認識する指認識部と、
前記指認識部にて認識された前記指先の動きを検出する動き検出部と、
前記動き検出部が、前記指先の動きが所定時間以上静止していることを検出したときに、前記撮影画像を記録する画像記録部と、を備えたことを特徴とする画像処理装置。
【請求項2】
前記特定領域設定部は、前記撮影画像に含まれるコンテンツの領域と重ならない位置に前記特定領域を配置することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記撮像画像から原稿の輪郭成分を抽出する輪郭成分抽出部とを備え、前記特定領域設定部は、前記輪郭成分から算出された前記原稿のサイズに基づき、前記特定領域を設定することを特徴とする請求項1または請求項2に記載の画像処理装置。
【請求項4】
前記特定領域は、前記ユーザの左右の手指に対応して前記撮像画像における原稿の左右にそれぞれ配置された2つの領域からなることを特徴とする請求項1から請求項3のいずれかに記載の画像処理装置。
【請求項5】
前記特定領域設定部は、前記撮影画像に含まれるコンテンツの領域と、前記特定領域との最短距離が所定の閾値よりも大きい場合、当該最短距離が前記閾値以下となるように前記特定領域を拡大することを特徴とする請求項1から請求項4のいずれかに記載の画像処理装置。
【請求項6】
前記特定領域設定部は、前記特定領域と重ならないように動作解除領域を設定し、
前記指認識部は、前記動作解除領域においてユーザの手指を認識し、
前記画像記録部は、前記動作解除領域における前記動き検出部の検出結果に基づき、前記ユーザからの動作解除指令が与えられたと判定した場合に、前記動作指令に拘わらず前記原稿画像を記録しないことを特徴とする請求項1から請求項5のいずれかに記載の画像処理装置。
【請求項7】
請求項1から請求項6のいずれかに記載の画像処理装置と、前記撮影画像を撮影するカメラ部を有する画像入力装置とを備えた原稿読取システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2013−27032(P2013−27032A)
【公開日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願番号】特願2011−284918(P2011−284918)
【出願日】平成23年12月27日(2011.12.27)
【分割の表示】特願2011−159873(P2011−159873)の分割
【原出願日】平成23年7月21日(2011.7.21)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】