画像処理装置およびこれを備えた原稿読取システム
【課題】原稿の紙面上で指などの指示物で領域を直接指定する動作で切出し画像を取得することができるようにする。
【解決手段】指などの指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得し、切出し領域取得部33にて、第2の撮影画像から指示物が指し示す点を検出して切出し領域を求め、切出し領域取得部33は指示物が指し示す1点の軌跡で表される指定領域に基づいて切出し領域を求める。
【解決手段】指などの指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得し、切出し領域取得部33にて、第2の撮影画像から指示物が指し示す点を検出して切出し領域を求め、切出し領域取得部33は指示物が指し示す1点の軌跡で表される指定領域に基づいて切出し領域を求める。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、本などの原稿の紙面を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムに関するものである。
【背景技術】
【0002】
本のページを自然に開いた状態で上方から撮像してページの画像を読み取ることができるブックスキャナ(書画カメラ)が普及している(特許文献1参照)。このようなブックスキャナを用いると、ページをめくりながらページの画像を次々に読み取ることができるため、本を電子化する作業を効率良く行うことができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−103240号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
さて、本の紙面の一部のみの画像が必要な場合にも、ブックスキャナを用いることができるが、この場合、本のページ全体を撮像し、あるいはページ内の必要な領域を含むように撮像した後、画像データをPCに取り込んで、PCの画面を見ながら必要な領域の画像を切り抜く作業が必要になり、面倒であった。
【0005】
本発明は、このような従来技術の問題点を解消するべく案出されたものであり、その主な目的は、原稿の紙面上で指などの指示物で領域を直接指定する動作で切出し画像を取得することができるように構成された画像処理装置およびこれを備えた原稿読取システムを提供することにある。
【課題を解決するための手段】
【0006】
上記目的を達成するために本発明の画像処理装置は、指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得する撮影画像取得部と、前記第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める切出し領域取得部と、前記第1の撮影画像内の少なくとも前記切出し領域取得部で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する切出し画像生成部とを備え、前記切出し領域取得部は、前記指示物が指し示す1点の軌跡で表される指定領域に基づいて前記切出し領域を求めることを特徴とするものである。
【発明の効果】
【0007】
本発明によれば、原稿の紙面上で指やペンなどの指示物で領域を直接指定する動作で、様々な領域を切出し画像として指定することができる。また、平面化された切出し画像を取得することができるため、ユーザの利便性を高めることができる。特に切出し領域に対応する画像部分のみを平面化する構成とすると、平面化に要する演算負担を軽減して処理の高速化を図ることができる。
【図面の簡単な説明】
【0008】
【図1】本実施形態にかかる原稿読取システムを示す全体構成図
【図2】ブックスキャナ1およびPC2の概略構成を示すブロック図
【図3】本原稿読取システムにおける画像切出しの手順を示すフロー図
【図4】図3に示した輪郭取得(ST103)の手順を示すフロー図
【図5】輪郭取得の要領を説明する模式図
【図6】図3に示した1次メッシュモデル生成(ST104)の手順を示すフロー図
【図7】メッシュモデル生成の要領を説明する模式図
【図8】図3に示した切出し領域取得(ST105)の手順を示すフロー図
【図9】図3に示した切出し領域取得(ST105)の手順を示すフロー図
【図10】切出し領域取得の要領を説明する模式図
【図11】図3に示した2次メッシュモデル生成・画像変換(ST106)の手順を示すフロー図
【図12】2次メッシュモデル生成・画像変換の要領を説明する模式図
【図13】指示物Fで切り出す領域を指定した際の本の紙面の状態を示す模式図
【図14】指示物Fが指し示す点を結んで得られる指定領域と、実際に画像を切り出す切出し領域とを示す模式図
【図15】図3に示した切出し画像補正(ST107)の手順を示すフロー図
【図16】切出し画像補正で行われる各処理の状況を示す模式図
【図17】切出し画像補正で行われる各処理の状況を示す模式図
【図18】切出し画像補正で行われる各処理の状況を示す模式図
【図19】切出し画像補正で行われる処理の別の例を示す模式図
【発明を実施するための形態】
【0009】
前記課題を解決するためになされた第1の発明は、指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得する撮影画像取得部と、前記第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める切出し領域取得部と、前記第1の撮影画像内の少なくとも前記切出し領域取得部で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する切出し画像生成部とを備え、前記切出し領域取得部は、前記指示物が指し示す1点の軌跡で表される指定領域に基づいて前記切出し領域を求めるようにしたものである。
【0010】
また、第2の発明は、前記切出し領域取得部は、前記指示物の動作後、前記指示物が所定時間停止し、さらに動作を開始する場合において、前記指示物が所定期間停止した位置を示す位置データを複数記憶し、前記位置データに基づいて切出し領域を求めるようにしたものである。これら第1及び第2の発明により、原稿の紙面上で指やペンなどの指示物で領域を直接指定する動作で、様々な領域を切出し画像として指定することができる。また、平面化された切出し画像を取得することができるため、ユーザの利便性を高めることができる。特に切出し領域に対応する画像部分のみを平面化する構成とすると、平面化に要する演算負担を軽減して処理の高速化を図ることができる。
【0011】
また、第3の発明は、前記第1あるいは第2の発明において、前記第1の撮影画像に基づいて1次メッシュモデルを生成する1次メッシュモデル生成部と、前記1次メッシュモデルに基づいてこれよりメッシュ間隔が小さい2次メッシュモデルを生成する2次メッシュモデル生成部と、をさらに有し、前記切出し領域取得部は、前記1次メッシュモデルを用いて前記切出し領域を求め、前記切出し画像生成部は、前記2次メッシュモデルを用いて画像の平面化を行う構成とする。
【0012】
これによると、1次メッシュモデルのメッシュ間隔を大きくすることで、切出し領域を求める処理の演算負担を軽減することができる。また、メッシュ間隔が小さい2次メッシュモデルを用いて画像の平面化を行うため、平面化の変換精度を向上させることができ、歪みの小さな高画質な切出し画像を取得することができる。この場合、1次メッシュモデルの交点間を等分割して2次メッシュモデルを生成すればよい。
【0013】
また、第4の発明は、前記第3の発明において、前記2次メッシュモデル生成部は、前記切出し領域についてのみ前記2次メッシュモデルを生成し、前記切出し画像生成部は、前記2次メッシュモデルを用いて前記切出し領域に対応する画像部分のみを平面化する構成とする。
【0014】
これによると、2次メッシュモデル生成と平面化の各処理の演算負担を軽減することができる。
【0015】
また、第5の発明は、前記第3若しくは第4の発明において、前記切出し領域取得部は、前記1次メッシュモデルにおいて前記指定領域を取り囲むメッシュラインを境界線して前記切出し領域を求める構成とする。
【0016】
これによると、1次メッシュモデルのメッシュ間隔を適切に設定することで、必要なマージンが確保されるため、指示物による領域指定時に指示物に押圧されて紙が変位することによる画像のずれに関係なく、指示物で指定された領域の画像を確実に切り出すことができる。この場合、メッシュ間隔は、指示物に押圧されて紙面が変位する際の画像のずれ量に基づいて設定すればよい。
また、第6の発明は、原稿読取システムに関するものであり、前記第1乃至第5の発明にかかる画像処理装置と、撮像画像を撮影するカメラ部を有する画像入力装置とを備えたものである。
【0017】
これによると、原稿の紙面上で指やペンなどの指示物で領域を直接指定する動作で、指定された領域の画像が切り出されて、平面化された切出し画像を取得することができるため、ユーザの利便性を高めることができる。
【0018】
以下、本発明の実施の形態を、図面を参照しながら説明する。
【0019】
図1は、本実施形態にかかる原稿読取システムを示す全体構成図である。この原稿読取システムは、本(原稿)Bの紙面の画像を読み取って、紙面の画像データを取得するものであり、ブックスキャナ(画像入力装置)1とPC(画像処理装置)2とからなっている。
【0020】
ブックスキャナ1は、本Bの紙面を撮像するカメラ部3と、このカメラ部3を保持するスタンド部4とを備え、スタンド部4を机などの載置面5に据え付けるとともに、カメラ部3の真下の載置面5上に本Bを載置して、カメラ部3で本Bの紙面を撮像する。本Bは、自然に開いた状態で紙面の撮像が行われ、本Bの見開き2ページの撮影画像が得られる。そして、歪みのある紙面の画像を平面化する処理が行われて、見開き2ページ分の平面化された紙面の画像を取得することができる。
【0021】
さらにここでは、指やペンなどの指示物Fを用いて本Bの紙面上で領域を直接指定する動作で、指定された領域の画像が切り出されて、平面化された切出し画像を取得することができる。このとき、ブックスキャナ1では、指示物Fのない状態で本Bの紙面を載置面5とともに撮影し、その撮影画像に基づいてPC2において紙面の画像が生成される。また、ブックスキャナ1では、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影し、その撮影画像に基づいてPC2において切出し領域が認識される。
【0022】
図2は、ブックスキャナ1およびPC2の概略構成を示すブロック図である。ブックスキャナ1は、カメラ部3を備えた撮像処理部11と、操作指示部12と、外部インタフェ
イス13と、を有している。PC2は、外部I/F21と、画像データ入力部(撮影画像取得部)22と、画像処理部23と、操作系制御部24と、表示データ生成部25と、表示器26と、入力部27を有している。なお、PC2の画像処理部23および表示データ生成部25は、画像処理アプリケーションなどのプログラムをCPUで実行するソフトウェア処理で実現される。
【0023】
PC2では、キーボードなどからなる入力部27の操作により、ブックスキャナ1で撮影される画像の解像度やフレームレートなどの動作条件が入力され、この動作条件が操作系制御部24からブックスキャナ1に送信され、ブックスキャナ1では、PC2から送信された動作条件に基づいて操作指示部12による指示にしたがって撮像処理部11が所要の動作を行う。
【0024】
PC2の画像データ入力部22では、ブックスキャナ1から送信される画像データをメモリに格納し、必要に応じてその画像データを画像処理部23に出力する。この画像データ入力部22では、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像と、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影した第2の撮影画像とを取得する。
【0025】
画像処理部23は、輪郭取得部31と、1次メッシュモデル生成部32と、切出し領域取得部33と、2次メッシュモデル生成部34と、切出し画像生成部35と、画像補正部36と、を有している。
【0026】
輪郭取得部31は、第1の撮影画像から本Bの輪郭を取得する。1次メッシュモデル生成部32は、第1の撮影画像に基づいて輪郭取得部31で取得した輪郭情報から1次メッシュモデルを生成する。切出し領域取得部33は、第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める。2次メッシュモデル生成部34は、1次メッシュモデル生成部32で生成した1次メッシュモデルに基づいてこれよりメッシュ間隔が小さい2次メッシュモデルを生成する。
【0027】
切出し画像生成部35では、第1の撮影画像において切出し領域取得部33で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する。この切出し画像生成部35は、歪みのある紙面の画像を歪みのない画像に変換する画像変換部37を備え、この画像変換部37では、射影変換(アフィン変換)により画像の平面化が行われ、フラットベッドスキャナで読み取ったものと同様の画像を取得することができる。画像補正部36では、切出し画像生成部35により取得した切出し画像の外周部に現れる不要な画像部分を削除する画像補正を行う。
【0028】
切出し領域取得部33は、1次メッシュモデルを用いて切出し領域を決定し、切出し画像生成部35は、2次メッシュモデルを用いて画像の平面化を行う。これについては後に詳しく説明する。
【0029】
図3は、本原稿読取システムにおける画像切出しの手順を示すフロー図である。まず、ブックスキャナ1を起動させるとともに、PC2で所要のアプリケーションを起動させると、画像の入力、すなわちブックスキャナ1で撮像が開始されてその撮像データがPC2に送信される(ST101)。ついで、ユーザがブックスキャナ1のカメラ部3の下に本をセットすると(ST102)、本Bの紙面が撮像されてその撮像データがPC2に送信され、PC2の画像データ入力部22では、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像を取得する。
【0030】
そしてPC2では、第1の撮影画像から本Bの輪郭を取得する処理が輪郭取得部31に
て行われ(ST103)、ついで、輪郭取得部31で取得した輪郭情報から、本Bの全体を対象にしてメッシュの粗い1次メッシュモデルを生成する処理が1次メッシュモデル生成部32にて行われる(ST104)。
【0031】
また、指やペンなどの指示物Fを用いて本Bの紙面上で切り出すべき領域を指し示す動作をユーザに行わせて、指示物Fを本Bの紙面とともに撮影した第2の撮影画像を取得し、この第2の撮影画像から指示物Fが指し示す点を検出して切出し領域を決定する処理が切出し領域取得部33にて行われる(ST105)。
【0032】
そして、切出し領域取得部33にて取得した切出し領域を対象にして、1次メッシュモデル生成部32で生成した1次メッシュモデルに基づいて、1次メッシュモデルよりメッシュの細かい2次メッシュモデルを生成する処理が2次メッシュモデル生成部32にて行われ、さらにその2次メッシュモデルに基づいて画像を平面化する画像変換処理が切出し画像生成部34にて行われる(ST106)。
【0033】
ついで、切出し画像生成部35により取得した切出し画像の外周部に現れる不要な画像部分を削除する画像補正が画像補正部35にて行われ(ST107)、これにより得られた切出し画像を表示器26に表示させる(ST108)。これによりユーザは画像の切り出しが適切に行われたか否かを確認することができる。
【0034】
図4は、図3に示した輪郭取得(ST103)の手順を示すフロー図である。図5は、輪郭取得の要領を説明する模式図である。ここでは、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像から、本Bの輪郭情報として、本Bの載置状態を大まかに把握するための主要直線成分と、ページの上下左右の端点である特異点を検出する。
【0035】
まず、本全体の外形の主要直線成分を検出する(ST201)。ここでは、図5(A)に示すように、撮影画像内で、本B全体の外形における左右の側縁(通常は表紙の側縁)を示す2本の直線と、左右のページの綴じ目を示す1本の直線を検出する。この直線成分の検出は、ハフ(Hough)変換により行えばよい。
【0036】
また、撮影画像に対してエッジ検出を行う(ST202)。このエッジ検出は、キャニー(Canny)法を用いて行えばよい。ついで、取得したエッジ画像内の輪郭成分(原稿の
輪郭を構成する画素)を抽出する(ST203)。ついで、取得した輪郭成分に基づいて、ページの上下左右の端点である特異点を検出する(ST204)。ここでは、図5(B)に示すように、見開き2ページの撮影画像において、ページの上下左右の端点として6つの特異点が検出される。
【0037】
そして、特異点検出(ST204)で取得した特異点の妥当性を判断する(ST205)。ここでは、取得した特異点と、直線成分検出(ST201)で取得した直線成分とを比較して、ページの上下左右の端点である特異点の妥当性を判断する。ここで、特異点が妥当であるものと判定されると、その特異点を確定する(ST206)。
【0038】
なお、エッジ検出(ST202)、輪郭成分抽出(ST203)、および特異点検出(ST204)の各処理は、直線成分検出(ST201)の処理と平行して行うようにしてもよい。
【0039】
図6は、図3に示した1次メッシュモデル生成(ST104)の手順を示すフロー図である。図7は、1次メッシュモデル生成の要領を説明する模式図である。ここでは、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像から、本の紙面
全体を対象にした1次メッシュモデルを生成する。
【0040】
まず、本Bのページの歪曲した輪郭線を表す歪曲成分を抽出する(ST301)。図7(A)に示すように、ページの上縁および下縁の輪郭線は、外側に膨らんだ歪曲した状態で表示され、このページの上縁および下縁の歪曲した輪郭成分(輪郭を構成する画素)を、図4に示したエッジ検出(ST202)で取得したエッジ画像から抽出する。そして、歪曲成分の連続性に基づいて歪曲成分の妥当性を判断する(ST302)。ここで、歪曲成分が妥当でないものと判定されると、途切れた部分の補間処理を行う(ST303)。これにより、歪曲成分が途切れることなく連続した状態となる。
【0041】
ついで、歪曲成分を高さ成分に変換する演算を行う(ST304)。撮影画像上でページの上縁および下縁の輪郭線が歪曲した状態で表示されるのは、3次元的には紙面が上側に凸となるように湾曲していることによるものであり、ページの上縁および下縁の輪郭線を示す歪曲成分に基づいて、ページの上縁および下縁の3次元的な湾曲状態を示す高さ成分を求めることができる。具体的には載置面5に対してページの上縁および下縁の高さ(Z軸の座標)を一定間隔で求める。この高さ成分により、ページの上縁および下縁の実際の長さを推定することができる。
【0042】
ついで、縦横のメッシュラインを生成し(ST305)、その縦横のメッシュラインが交差するメッシュ交点の座標をメッシュテーブルに格納する(ST306)。ここでは、図7(B)に示すように、ページの上縁および下縁の高さ成分に基づいて、ページの上縁および下縁を示す曲線をメッシュ数に応じて等間隔に分割する基点の座標を求め、上縁および下縁の互いに対応する基点を結線して縦メッシュラインを求める。ついで、縦メッシュラインをメッシュ数に応じて等間隔に分割する点(メッシュ交点)の座標を求め、その点を結線して横メッシュラインを求める。
【0043】
図8、図9は、図3に示した切出し領域取得(ST105)の手順を示すフロー図であり、図8に一筆書き指定モード(第1の領域指定モード)の場合を、図9に2本指指定モード(第2の領域指定モード)の場合を、それぞれ示す。図10は、切出し領域取得の要領を説明する模式図であり、(A)に一筆書き指定モードの場合を、(B)に2本指指定モードの場合を、それぞれ示す。
【0044】
本実施形態では、図10(A)に示す一筆書き指定モード(第1の領域指定モード)と、図10(B)に示す2本指指定モード(第2の領域指定モード)とを有し、ユーザがいずれかを選択することができる。
【0045】
図10(A)に示すように、一筆書き指定モードでは、指やペンなどの指示物Fを一筆書きの要領で動かし、指示物Fが指し示す1点の軌跡で表される指定領域に基づいて切出し領域を求める。特にここでは、指示物Fを左右方向(ページの継ぎ目となる中心線に直交する方向)および上下方向(中心線に平行となる方向)に動かし、左右方向の線分と上下方向の線分とで構成された多角形の領域を指定する。これにより、余分な画像が含まれないように領域を指定することができる。
【0046】
この一筆書き指定モードでは、切出し領域取得部33において、図8に示すように、まず、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影した第2の撮影画像から、本Bの紙面上に存在する指示物Fを検出する(ST401)。ここでは、形状認識処理により指示物Fを識別し、指示物Fの形態に応じて指示物Fが指し示す指示点を決定する。例えば指示物が指であれば指先が指示点となる。
【0047】
ついで、指示物Fが所定時間(例えば1秒間)動きを停止したか否かを判定し(ST4
02)、指示物Fが動きを停止した場合には、次に指示物Fが規定の動作を開始したか否かを判定し(ST403)、指示物Fが規定の動作を開始した場合には、指示物Fが最初に停止した位置を開始点として軌跡の追跡処理を開始し、取得した軌跡の座標をメモリに格納する(ST404)。
【0048】
ここでは、指示物Fを停止させた後に左右いずれかの方向、すなわちページの継ぎ目となる中心線に対して略直交する方向に動かした場合に、領域指定を開始したものと判断して、軌跡の追跡処理を開始する。この指示物の軌跡は、表示器26に表示された撮影画像の画面上に描画される。
【0049】
そして、規定の指定動作が終了したか否か、すなわち開始点の近傍で指示物が動きを停止したか否かを判定し(ST405)、規定の指定動作が終了した場合には、軌跡の追跡処理を終了し、領域指定の主要点を抽出する(ST406)。ここでは、指示物の移動方向が略90度変化する折曲点を頂点とした多角形の領域を指定するようにしており、この折曲点と開始点が領域指定の主要点として抽出され、抽出された複数の折曲点を、指示物の軌跡が示す右回りおよび左回りの順に直線で結ぶことで多角形の指定領域が求められる。
【0050】
なお、領域を指定する指示物Fが、ユーザの指や、筆記に用いられる通常のペンでは、形状認識処理により指示物Fを識別する処理が必要になるが、これに代えて、赤外ライトを先端部に設けた指示具を用いることも可能である。この場合、指示具が発する赤外光が撮影画像に現れるため、その赤外光を検出すればよい。
【0051】
一方、図10(B)に示すように、2本指指定モードでは、指示物Fが指し示す2点を対角方向の頂点とした矩形の指定領域に基づいて切出し領域を求める。これにより、指示物Fによる領域指定を簡単に行うことができる。特にここでは、左右2本の人差し指を用いて領域を指定する。左右2本の人差し指が指し示す2点を対角方向の頂点として、ページの継ぎ目を示す中心線に対して上下の辺が直交するとともに中心線に対して左右の辺が平行となる矩形の領域を指定する。
【0052】
この2本指指定モードでは、切出し領域取得部33において、図9に示すように、まず、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影した第2の撮影画像から、本Bの紙面上に存在する指示物Fを検出する(ST501)。そして、検出された指示物Fが左右2本の人差し指か否かを判定し(ST502)、左右2本の人差し指であれば、その左右2本の人差し指が所定時間(例えば1秒間)動きを停止したか否かを判定し(ST503)、所定時間動きを停止していれば、その左右2本の人差し指が指し示す指示点の座標を求める(ST504)。
【0053】
ついで、左右2本の人差し指がそれぞれ指し示す2つの指示点から、ページの継ぎ目を示す中心線に対して平行となる直線と中心線に対して垂直となる直線を延ばしてそれらの交点を求める。これにより得られた2つの交点と、人差し指が指し示す2つの指示点とが、領域指定の主要点として抽出され、4つの主要点を結んだ矩形の領域が指定領域となる。
【0054】
図11は、図3に示した2次メッシュモデル生成・画像変換(ST106)の手順を示すフロー図である。図12は、2次メッシュモデル生成・画像変換の要領を説明する模式図である。ここでは、切出し領域を対象にして2次メッシュモデルを生成し、その2次メッシュモデルに基づいて切出し領域の画像を射影変換により平面化する。
【0055】
まず、2次メッシュモデル生成部34において、前記の図8、図9の切出し領域取得で
取得した指定領域の主要点の座標を、1次メッシュモデルの座標に合成する(ST601)。そして、指定領域に基づいて実際に画像を切り出す切出し領域を規定するメッシュ交点を抽出する(ST602)。ここでは、図12(A)に示すように、指定領域を取り囲むように指定領域の外側のメッシュ交点を結んだ領域を切出し領域に設定する。そして、図12(B)に示すように、指定領域を含む切出し領域を対象にして、1次メッシュモデルよりメッシュ間隔を細かくした2次メッシュモデルを生成する(ST603)。
【0056】
2次メッシュモデルは、1次メッシュモデルの各メッシュ交点の間を等分割するメッシュ交点を求めることで生成することができる。平均的な文字の大きさは10ポイント(幅3.5mm)程度となり、例えば1次メッシュモデルのメッシュ間隔を、平均的な10ポイントの文字の3文字分に相当する10.5mmとすると、2次メッシュモデルのメッシュ間隔を、10ポイントの文字の1文字分、すなわち1次メッシュモデルのメッシュ間隔の1/3の3.5mmとする。
【0057】
ついで、2次メッシュモデルが生成された切出し領域に対応する画像部分のみを対象にして射影変換による平面化が切出し画像生成部35にて実施される(ST604)。これにより、図12(C)に示すように、切出し領域のみ平面化された切出し画像を取得することができる。
【0058】
このようにメッシュ間隔が小さい2次メッシュモデルを用いて画像の平面化を行うため、平面化の変換精度を向上させることができ、歪みの小さな高画質な切出し画像を取得することができる。さらに、必要となる切出し領域に対応する画像部分のみを平面化するため、平面化に要する演算負担を軽減して処理の高速化を図ることができる。
【0059】
ここで、指やペンなどの指示物Fによる領域指定時に生じる画像ずれについて説明する。図13は、指示物Fで切り出す領域を指定した際の本の紙面の状態を示す模式図である。図14は、指示物Fが指し示す点を結んで得られる指定領域と、実際に画像を切り出す切出し領域とを示す模式図である。なお、図14は、紙面に文字列が記載された画像の例を示している。
【0060】
図13に示すように、本のページを自然に開いた状態では、紙の間に隙間があるため、領域指定の際に、指やペンなどの指示物Fで本の紙面を押さえると、指示物Fに押されて本Bの紙が撓み、この紙の撓みに応じて紙面の画像が左右にずれる。そこでここでは、切出し領域取得部33にて、指示物Fが指し示す点を結んだ指定領域の周囲に所定のマージンが確保されるように切出し領域を設定する。これにより、指示物Fによる指定領域よりマージン分だけ大きな領域を切り出すため、指示物Fによる領域指定時に指示物Fに押圧されて紙が変位することによる画像のずれに関係なく、指示物Fで指定された領域の画像を確実に切り出すことができる。
【0061】
切出し領域を設定する際に指定領域の周囲に確保するマージン幅は、指やペンなどの指示物Fに押されて紙が撓むことに伴う画像のずれ量に基づいて定めればよい。画像のずれ量は、本の種類(雑誌やハードカバー本など)や紙質により異なるが、最大で5mm程度と推定され、これは、平均的な10ポイント(幅3.5mm)の文字では約2文字分に相当し、少なくともこの10ポイント文字の2文字分のマージンを確保するとよい。
【0062】
特にここでは、図14に示すように、1次メッシュモデルにおいて指定領域を取り囲むメッシュラインを境界線して切出し領域を求めるようにしている。図示する例では、指定領域の外側直近のメッシュラインより1本外側のメッシュラインを切出し領域の境界線としている。これにより、常にメッシュ間隔以上のマージンを確保することができ、1次メッシュモデルのメッシュ間隔を適切に設定することで、必要なマージンが確保されるため
、指示物による領域指定時の画像のずれに関係なく、指示物で指定された領域の画像を欠落なく確実に切り出すことができる。
【0063】
この場合、1つの網目内に少なくとも3文字入るように1次メッシュモデルのメッシュ間隔を設定するとよい。平均的な文字の大きさは10ポイント(幅3.5mm)程度となるため、10ポイントの文字の3文字分とすると、3.5×3=10.5mm角以上のメッシュとなる。
【0064】
図15は、図3に示した切出し画像補正(ST702)の手順を示すフロー図である。図16、図17、図18は、切出し画像補正で行われる各処理の状況を示す模式図である。なお、図16、図17、図18は、紙面に文字列が記載された画像の例を示している。
【0065】
前記のように、切出し領域は、指示物で実際に指定された領域より大きな領域となるため、前記の処理で取得した切出し画像の外周部には不要の画像が含まれる。そこで、切出し画像から不要部分を切り取って最終的な切出し画像を取得する。
【0066】
まず、図15および図16に示すように、切出し領域の境界線上に跨った画像があるか否かを判定し(ST701)、該当する画像がある場合には、その画像の内側に境界線を設定して、その新たな境界線(切出し線)に沿って該当する画像部分を切り取る(ST702)。紙面の画像を切り出す場合、通常、画像が途中で分断されないように切り出す。そこで、切出し領域の境界線上に跨った画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。
【0067】
ついで、図15および図17に示すように、切出し画像内に枠取りがあるか否かを判定し(ST703)、枠取りがある場合には、枠で囲まれた領域の外側にある画像の内側に境界線を設定して、その新たな境界線(切出し線)に沿って該当する画像部分を切り取る(ST704)。枠で囲まれた領域を切り出す場合、通常、その枠で囲まれた領域のみを切り出すことが多い。そこで、枠で囲まれた領域の外側にある画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。
【0068】
一方、切出し画像内に枠取りがない場合には、文字群の周囲に文字間隔および行間隔より大きな空白が存在するか否かを判定し(ST705)、該当する空白が存在しない場合には、空白がない辺を抽出する(ST706)。
【0069】
以降、図15および図18に示すように、句読点の位置から文節を判断して、切出し画像の外周部に存在する句読点がある文字列より外側の文字群の画像を削除する。文章を部分的に切り出す場合、通常、句読点で区切られた範囲を切り出すことが多く、文節の途中で切り出すことはしないため、切出し画像の外周部に存在する句読点の外側の文字群の画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。また、句読点を基準にして削除可能な部分は、書字方向(横書きと縦書き)によって異なり、横書きであれば、残すべき文節の上下にある文字群の画像を、縦書きであれば、残すべき文節の左右にある文字群の画像を削除すればよい。
【0070】
ここではまず、切出し画像内の文字列に対して簡易OCRを実施し(ST707)、その簡易OCRの結果に基づいて書字方向、すなわち縦書きと横書きのいずれかを判定する(ST708)。ここでは、句読点の位置関係に基づいて判定し、句読点の位置が直前の文字の下方の右側にある場合には縦書き、句読点の位置が直前の文字の右方の下側にある場合には横書きと判定する。そして、縦書きの場合には、以降の処理を左右2辺の空白がない辺に限定し(ST709)、横書きの場合には、以降の処理を上下2辺の空白がない辺に限定する(ST710)。
【0071】
ついで、1行目の文字列の終わりに句読点があるか否かを判定し(ST711)、1行目の文字列の終わりに句読点がある場合には、1行目の文字列の内側に境界線を設定して、その新たな境界線(切出し線)に沿って1行目の文字列の画像部分を切り取る(ST712)。ついで、最終行から2行目の文字列の終わりに句読点があるか否かを判定し(ST713)、最終行の文字列の終わりに句読点がある場合には、最終行目の文字列の内側に境界線を設定して、その新たな境界線(切出し線)に沿って最終行目の文字列の画像部分を切り取る(ST714)。
【0072】
図19は、切出し画像補正で行われる処理の別の例を示す模式図である。ここでは、切出し画像内に文字間隔および行間隔より大きな空白の外側にある画像を削除する。文章において文字間隔および行間隔より大きな空白が存在する場合には、通常、その空白の位置を境界にして文字群を切り出すため、空白より外側にある画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。この場合、前記のような文節判断を行うことなく不要な文字列を削除することができる。
【0073】
なお、前記の例では、図2に示したように、ブックスキャナから撮影画像データをPCに送ってPCで画像切出しの処理を行うようにしたが、このような画像処理をブックスキャナで行う、すなわちブックスキャナが画像処理装置を含む構成も可能である。この場合、テレビジョン受像機などの表示デバイスに画像を表示させればよい。
【0074】
また、前記の例では、指やペンなどの指示物を用いて指定された領域を含む切出し領域のみを平面化して切出し画像を取得する構成としたが、本の紙面の全体を平面化した後に、切出し領域に対応する画像部分を切り出す構成としてもよい。
【産業上の利用可能性】
【0075】
本発明にかかる画像処理装置は、本などの原稿の紙面上で指などの指示物で領域を直接指定する動作で切出し画像を取得することができる効果を有し、本などの原稿の紙面を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムなどとして有用である。
【符号の説明】
【0076】
1 ブックスキャナ(画像入力装置)
2 PC(画像処理装置)
3 カメラ部
22 画像データ入力部(撮影画像取得部)
31 輪郭取得部
32 1次メッシュモデル生成部
33 切出し領域取得部
34 2次メッシュモデル生成部
35 切出し画像生成部
36 画像補正部
37 画像変換部
【技術分野】
【0001】
本発明は、本などの原稿の紙面を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムに関するものである。
【背景技術】
【0002】
本のページを自然に開いた状態で上方から撮像してページの画像を読み取ることができるブックスキャナ(書画カメラ)が普及している(特許文献1参照)。このようなブックスキャナを用いると、ページをめくりながらページの画像を次々に読み取ることができるため、本を電子化する作業を効率良く行うことができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−103240号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
さて、本の紙面の一部のみの画像が必要な場合にも、ブックスキャナを用いることができるが、この場合、本のページ全体を撮像し、あるいはページ内の必要な領域を含むように撮像した後、画像データをPCに取り込んで、PCの画面を見ながら必要な領域の画像を切り抜く作業が必要になり、面倒であった。
【0005】
本発明は、このような従来技術の問題点を解消するべく案出されたものであり、その主な目的は、原稿の紙面上で指などの指示物で領域を直接指定する動作で切出し画像を取得することができるように構成された画像処理装置およびこれを備えた原稿読取システムを提供することにある。
【課題を解決するための手段】
【0006】
上記目的を達成するために本発明の画像処理装置は、指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得する撮影画像取得部と、前記第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める切出し領域取得部と、前記第1の撮影画像内の少なくとも前記切出し領域取得部で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する切出し画像生成部とを備え、前記切出し領域取得部は、前記指示物が指し示す1点の軌跡で表される指定領域に基づいて前記切出し領域を求めることを特徴とするものである。
【発明の効果】
【0007】
本発明によれば、原稿の紙面上で指やペンなどの指示物で領域を直接指定する動作で、様々な領域を切出し画像として指定することができる。また、平面化された切出し画像を取得することができるため、ユーザの利便性を高めることができる。特に切出し領域に対応する画像部分のみを平面化する構成とすると、平面化に要する演算負担を軽減して処理の高速化を図ることができる。
【図面の簡単な説明】
【0008】
【図1】本実施形態にかかる原稿読取システムを示す全体構成図
【図2】ブックスキャナ1およびPC2の概略構成を示すブロック図
【図3】本原稿読取システムにおける画像切出しの手順を示すフロー図
【図4】図3に示した輪郭取得(ST103)の手順を示すフロー図
【図5】輪郭取得の要領を説明する模式図
【図6】図3に示した1次メッシュモデル生成(ST104)の手順を示すフロー図
【図7】メッシュモデル生成の要領を説明する模式図
【図8】図3に示した切出し領域取得(ST105)の手順を示すフロー図
【図9】図3に示した切出し領域取得(ST105)の手順を示すフロー図
【図10】切出し領域取得の要領を説明する模式図
【図11】図3に示した2次メッシュモデル生成・画像変換(ST106)の手順を示すフロー図
【図12】2次メッシュモデル生成・画像変換の要領を説明する模式図
【図13】指示物Fで切り出す領域を指定した際の本の紙面の状態を示す模式図
【図14】指示物Fが指し示す点を結んで得られる指定領域と、実際に画像を切り出す切出し領域とを示す模式図
【図15】図3に示した切出し画像補正(ST107)の手順を示すフロー図
【図16】切出し画像補正で行われる各処理の状況を示す模式図
【図17】切出し画像補正で行われる各処理の状況を示す模式図
【図18】切出し画像補正で行われる各処理の状況を示す模式図
【図19】切出し画像補正で行われる処理の別の例を示す模式図
【発明を実施するための形態】
【0009】
前記課題を解決するためになされた第1の発明は、指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得する撮影画像取得部と、前記第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める切出し領域取得部と、前記第1の撮影画像内の少なくとも前記切出し領域取得部で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する切出し画像生成部とを備え、前記切出し領域取得部は、前記指示物が指し示す1点の軌跡で表される指定領域に基づいて前記切出し領域を求めるようにしたものである。
【0010】
また、第2の発明は、前記切出し領域取得部は、前記指示物の動作後、前記指示物が所定時間停止し、さらに動作を開始する場合において、前記指示物が所定期間停止した位置を示す位置データを複数記憶し、前記位置データに基づいて切出し領域を求めるようにしたものである。これら第1及び第2の発明により、原稿の紙面上で指やペンなどの指示物で領域を直接指定する動作で、様々な領域を切出し画像として指定することができる。また、平面化された切出し画像を取得することができるため、ユーザの利便性を高めることができる。特に切出し領域に対応する画像部分のみを平面化する構成とすると、平面化に要する演算負担を軽減して処理の高速化を図ることができる。
【0011】
また、第3の発明は、前記第1あるいは第2の発明において、前記第1の撮影画像に基づいて1次メッシュモデルを生成する1次メッシュモデル生成部と、前記1次メッシュモデルに基づいてこれよりメッシュ間隔が小さい2次メッシュモデルを生成する2次メッシュモデル生成部と、をさらに有し、前記切出し領域取得部は、前記1次メッシュモデルを用いて前記切出し領域を求め、前記切出し画像生成部は、前記2次メッシュモデルを用いて画像の平面化を行う構成とする。
【0012】
これによると、1次メッシュモデルのメッシュ間隔を大きくすることで、切出し領域を求める処理の演算負担を軽減することができる。また、メッシュ間隔が小さい2次メッシュモデルを用いて画像の平面化を行うため、平面化の変換精度を向上させることができ、歪みの小さな高画質な切出し画像を取得することができる。この場合、1次メッシュモデルの交点間を等分割して2次メッシュモデルを生成すればよい。
【0013】
また、第4の発明は、前記第3の発明において、前記2次メッシュモデル生成部は、前記切出し領域についてのみ前記2次メッシュモデルを生成し、前記切出し画像生成部は、前記2次メッシュモデルを用いて前記切出し領域に対応する画像部分のみを平面化する構成とする。
【0014】
これによると、2次メッシュモデル生成と平面化の各処理の演算負担を軽減することができる。
【0015】
また、第5の発明は、前記第3若しくは第4の発明において、前記切出し領域取得部は、前記1次メッシュモデルにおいて前記指定領域を取り囲むメッシュラインを境界線して前記切出し領域を求める構成とする。
【0016】
これによると、1次メッシュモデルのメッシュ間隔を適切に設定することで、必要なマージンが確保されるため、指示物による領域指定時に指示物に押圧されて紙が変位することによる画像のずれに関係なく、指示物で指定された領域の画像を確実に切り出すことができる。この場合、メッシュ間隔は、指示物に押圧されて紙面が変位する際の画像のずれ量に基づいて設定すればよい。
また、第6の発明は、原稿読取システムに関するものであり、前記第1乃至第5の発明にかかる画像処理装置と、撮像画像を撮影するカメラ部を有する画像入力装置とを備えたものである。
【0017】
これによると、原稿の紙面上で指やペンなどの指示物で領域を直接指定する動作で、指定された領域の画像が切り出されて、平面化された切出し画像を取得することができるため、ユーザの利便性を高めることができる。
【0018】
以下、本発明の実施の形態を、図面を参照しながら説明する。
【0019】
図1は、本実施形態にかかる原稿読取システムを示す全体構成図である。この原稿読取システムは、本(原稿)Bの紙面の画像を読み取って、紙面の画像データを取得するものであり、ブックスキャナ(画像入力装置)1とPC(画像処理装置)2とからなっている。
【0020】
ブックスキャナ1は、本Bの紙面を撮像するカメラ部3と、このカメラ部3を保持するスタンド部4とを備え、スタンド部4を机などの載置面5に据え付けるとともに、カメラ部3の真下の載置面5上に本Bを載置して、カメラ部3で本Bの紙面を撮像する。本Bは、自然に開いた状態で紙面の撮像が行われ、本Bの見開き2ページの撮影画像が得られる。そして、歪みのある紙面の画像を平面化する処理が行われて、見開き2ページ分の平面化された紙面の画像を取得することができる。
【0021】
さらにここでは、指やペンなどの指示物Fを用いて本Bの紙面上で領域を直接指定する動作で、指定された領域の画像が切り出されて、平面化された切出し画像を取得することができる。このとき、ブックスキャナ1では、指示物Fのない状態で本Bの紙面を載置面5とともに撮影し、その撮影画像に基づいてPC2において紙面の画像が生成される。また、ブックスキャナ1では、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影し、その撮影画像に基づいてPC2において切出し領域が認識される。
【0022】
図2は、ブックスキャナ1およびPC2の概略構成を示すブロック図である。ブックスキャナ1は、カメラ部3を備えた撮像処理部11と、操作指示部12と、外部インタフェ
イス13と、を有している。PC2は、外部I/F21と、画像データ入力部(撮影画像取得部)22と、画像処理部23と、操作系制御部24と、表示データ生成部25と、表示器26と、入力部27を有している。なお、PC2の画像処理部23および表示データ生成部25は、画像処理アプリケーションなどのプログラムをCPUで実行するソフトウェア処理で実現される。
【0023】
PC2では、キーボードなどからなる入力部27の操作により、ブックスキャナ1で撮影される画像の解像度やフレームレートなどの動作条件が入力され、この動作条件が操作系制御部24からブックスキャナ1に送信され、ブックスキャナ1では、PC2から送信された動作条件に基づいて操作指示部12による指示にしたがって撮像処理部11が所要の動作を行う。
【0024】
PC2の画像データ入力部22では、ブックスキャナ1から送信される画像データをメモリに格納し、必要に応じてその画像データを画像処理部23に出力する。この画像データ入力部22では、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像と、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影した第2の撮影画像とを取得する。
【0025】
画像処理部23は、輪郭取得部31と、1次メッシュモデル生成部32と、切出し領域取得部33と、2次メッシュモデル生成部34と、切出し画像生成部35と、画像補正部36と、を有している。
【0026】
輪郭取得部31は、第1の撮影画像から本Bの輪郭を取得する。1次メッシュモデル生成部32は、第1の撮影画像に基づいて輪郭取得部31で取得した輪郭情報から1次メッシュモデルを生成する。切出し領域取得部33は、第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める。2次メッシュモデル生成部34は、1次メッシュモデル生成部32で生成した1次メッシュモデルに基づいてこれよりメッシュ間隔が小さい2次メッシュモデルを生成する。
【0027】
切出し画像生成部35では、第1の撮影画像において切出し領域取得部33で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する。この切出し画像生成部35は、歪みのある紙面の画像を歪みのない画像に変換する画像変換部37を備え、この画像変換部37では、射影変換(アフィン変換)により画像の平面化が行われ、フラットベッドスキャナで読み取ったものと同様の画像を取得することができる。画像補正部36では、切出し画像生成部35により取得した切出し画像の外周部に現れる不要な画像部分を削除する画像補正を行う。
【0028】
切出し領域取得部33は、1次メッシュモデルを用いて切出し領域を決定し、切出し画像生成部35は、2次メッシュモデルを用いて画像の平面化を行う。これについては後に詳しく説明する。
【0029】
図3は、本原稿読取システムにおける画像切出しの手順を示すフロー図である。まず、ブックスキャナ1を起動させるとともに、PC2で所要のアプリケーションを起動させると、画像の入力、すなわちブックスキャナ1で撮像が開始されてその撮像データがPC2に送信される(ST101)。ついで、ユーザがブックスキャナ1のカメラ部3の下に本をセットすると(ST102)、本Bの紙面が撮像されてその撮像データがPC2に送信され、PC2の画像データ入力部22では、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像を取得する。
【0030】
そしてPC2では、第1の撮影画像から本Bの輪郭を取得する処理が輪郭取得部31に
て行われ(ST103)、ついで、輪郭取得部31で取得した輪郭情報から、本Bの全体を対象にしてメッシュの粗い1次メッシュモデルを生成する処理が1次メッシュモデル生成部32にて行われる(ST104)。
【0031】
また、指やペンなどの指示物Fを用いて本Bの紙面上で切り出すべき領域を指し示す動作をユーザに行わせて、指示物Fを本Bの紙面とともに撮影した第2の撮影画像を取得し、この第2の撮影画像から指示物Fが指し示す点を検出して切出し領域を決定する処理が切出し領域取得部33にて行われる(ST105)。
【0032】
そして、切出し領域取得部33にて取得した切出し領域を対象にして、1次メッシュモデル生成部32で生成した1次メッシュモデルに基づいて、1次メッシュモデルよりメッシュの細かい2次メッシュモデルを生成する処理が2次メッシュモデル生成部32にて行われ、さらにその2次メッシュモデルに基づいて画像を平面化する画像変換処理が切出し画像生成部34にて行われる(ST106)。
【0033】
ついで、切出し画像生成部35により取得した切出し画像の外周部に現れる不要な画像部分を削除する画像補正が画像補正部35にて行われ(ST107)、これにより得られた切出し画像を表示器26に表示させる(ST108)。これによりユーザは画像の切り出しが適切に行われたか否かを確認することができる。
【0034】
図4は、図3に示した輪郭取得(ST103)の手順を示すフロー図である。図5は、輪郭取得の要領を説明する模式図である。ここでは、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像から、本Bの輪郭情報として、本Bの載置状態を大まかに把握するための主要直線成分と、ページの上下左右の端点である特異点を検出する。
【0035】
まず、本全体の外形の主要直線成分を検出する(ST201)。ここでは、図5(A)に示すように、撮影画像内で、本B全体の外形における左右の側縁(通常は表紙の側縁)を示す2本の直線と、左右のページの綴じ目を示す1本の直線を検出する。この直線成分の検出は、ハフ(Hough)変換により行えばよい。
【0036】
また、撮影画像に対してエッジ検出を行う(ST202)。このエッジ検出は、キャニー(Canny)法を用いて行えばよい。ついで、取得したエッジ画像内の輪郭成分(原稿の
輪郭を構成する画素)を抽出する(ST203)。ついで、取得した輪郭成分に基づいて、ページの上下左右の端点である特異点を検出する(ST204)。ここでは、図5(B)に示すように、見開き2ページの撮影画像において、ページの上下左右の端点として6つの特異点が検出される。
【0037】
そして、特異点検出(ST204)で取得した特異点の妥当性を判断する(ST205)。ここでは、取得した特異点と、直線成分検出(ST201)で取得した直線成分とを比較して、ページの上下左右の端点である特異点の妥当性を判断する。ここで、特異点が妥当であるものと判定されると、その特異点を確定する(ST206)。
【0038】
なお、エッジ検出(ST202)、輪郭成分抽出(ST203)、および特異点検出(ST204)の各処理は、直線成分検出(ST201)の処理と平行して行うようにしてもよい。
【0039】
図6は、図3に示した1次メッシュモデル生成(ST104)の手順を示すフロー図である。図7は、1次メッシュモデル生成の要領を説明する模式図である。ここでは、指示物Fのない状態で本Bの紙面を載置面5とともに撮影した第1の撮影画像から、本の紙面
全体を対象にした1次メッシュモデルを生成する。
【0040】
まず、本Bのページの歪曲した輪郭線を表す歪曲成分を抽出する(ST301)。図7(A)に示すように、ページの上縁および下縁の輪郭線は、外側に膨らんだ歪曲した状態で表示され、このページの上縁および下縁の歪曲した輪郭成分(輪郭を構成する画素)を、図4に示したエッジ検出(ST202)で取得したエッジ画像から抽出する。そして、歪曲成分の連続性に基づいて歪曲成分の妥当性を判断する(ST302)。ここで、歪曲成分が妥当でないものと判定されると、途切れた部分の補間処理を行う(ST303)。これにより、歪曲成分が途切れることなく連続した状態となる。
【0041】
ついで、歪曲成分を高さ成分に変換する演算を行う(ST304)。撮影画像上でページの上縁および下縁の輪郭線が歪曲した状態で表示されるのは、3次元的には紙面が上側に凸となるように湾曲していることによるものであり、ページの上縁および下縁の輪郭線を示す歪曲成分に基づいて、ページの上縁および下縁の3次元的な湾曲状態を示す高さ成分を求めることができる。具体的には載置面5に対してページの上縁および下縁の高さ(Z軸の座標)を一定間隔で求める。この高さ成分により、ページの上縁および下縁の実際の長さを推定することができる。
【0042】
ついで、縦横のメッシュラインを生成し(ST305)、その縦横のメッシュラインが交差するメッシュ交点の座標をメッシュテーブルに格納する(ST306)。ここでは、図7(B)に示すように、ページの上縁および下縁の高さ成分に基づいて、ページの上縁および下縁を示す曲線をメッシュ数に応じて等間隔に分割する基点の座標を求め、上縁および下縁の互いに対応する基点を結線して縦メッシュラインを求める。ついで、縦メッシュラインをメッシュ数に応じて等間隔に分割する点(メッシュ交点)の座標を求め、その点を結線して横メッシュラインを求める。
【0043】
図8、図9は、図3に示した切出し領域取得(ST105)の手順を示すフロー図であり、図8に一筆書き指定モード(第1の領域指定モード)の場合を、図9に2本指指定モード(第2の領域指定モード)の場合を、それぞれ示す。図10は、切出し領域取得の要領を説明する模式図であり、(A)に一筆書き指定モードの場合を、(B)に2本指指定モードの場合を、それぞれ示す。
【0044】
本実施形態では、図10(A)に示す一筆書き指定モード(第1の領域指定モード)と、図10(B)に示す2本指指定モード(第2の領域指定モード)とを有し、ユーザがいずれかを選択することができる。
【0045】
図10(A)に示すように、一筆書き指定モードでは、指やペンなどの指示物Fを一筆書きの要領で動かし、指示物Fが指し示す1点の軌跡で表される指定領域に基づいて切出し領域を求める。特にここでは、指示物Fを左右方向(ページの継ぎ目となる中心線に直交する方向)および上下方向(中心線に平行となる方向)に動かし、左右方向の線分と上下方向の線分とで構成された多角形の領域を指定する。これにより、余分な画像が含まれないように領域を指定することができる。
【0046】
この一筆書き指定モードでは、切出し領域取得部33において、図8に示すように、まず、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影した第2の撮影画像から、本Bの紙面上に存在する指示物Fを検出する(ST401)。ここでは、形状認識処理により指示物Fを識別し、指示物Fの形態に応じて指示物Fが指し示す指示点を決定する。例えば指示物が指であれば指先が指示点となる。
【0047】
ついで、指示物Fが所定時間(例えば1秒間)動きを停止したか否かを判定し(ST4
02)、指示物Fが動きを停止した場合には、次に指示物Fが規定の動作を開始したか否かを判定し(ST403)、指示物Fが規定の動作を開始した場合には、指示物Fが最初に停止した位置を開始点として軌跡の追跡処理を開始し、取得した軌跡の座標をメモリに格納する(ST404)。
【0048】
ここでは、指示物Fを停止させた後に左右いずれかの方向、すなわちページの継ぎ目となる中心線に対して略直交する方向に動かした場合に、領域指定を開始したものと判断して、軌跡の追跡処理を開始する。この指示物の軌跡は、表示器26に表示された撮影画像の画面上に描画される。
【0049】
そして、規定の指定動作が終了したか否か、すなわち開始点の近傍で指示物が動きを停止したか否かを判定し(ST405)、規定の指定動作が終了した場合には、軌跡の追跡処理を終了し、領域指定の主要点を抽出する(ST406)。ここでは、指示物の移動方向が略90度変化する折曲点を頂点とした多角形の領域を指定するようにしており、この折曲点と開始点が領域指定の主要点として抽出され、抽出された複数の折曲点を、指示物の軌跡が示す右回りおよび左回りの順に直線で結ぶことで多角形の指定領域が求められる。
【0050】
なお、領域を指定する指示物Fが、ユーザの指や、筆記に用いられる通常のペンでは、形状認識処理により指示物Fを識別する処理が必要になるが、これに代えて、赤外ライトを先端部に設けた指示具を用いることも可能である。この場合、指示具が発する赤外光が撮影画像に現れるため、その赤外光を検出すればよい。
【0051】
一方、図10(B)に示すように、2本指指定モードでは、指示物Fが指し示す2点を対角方向の頂点とした矩形の指定領域に基づいて切出し領域を求める。これにより、指示物Fによる領域指定を簡単に行うことができる。特にここでは、左右2本の人差し指を用いて領域を指定する。左右2本の人差し指が指し示す2点を対角方向の頂点として、ページの継ぎ目を示す中心線に対して上下の辺が直交するとともに中心線に対して左右の辺が平行となる矩形の領域を指定する。
【0052】
この2本指指定モードでは、切出し領域取得部33において、図9に示すように、まず、本Bの紙面上で切り出すべき領域を指し示す指示物Fを本Bの紙面とともに撮影した第2の撮影画像から、本Bの紙面上に存在する指示物Fを検出する(ST501)。そして、検出された指示物Fが左右2本の人差し指か否かを判定し(ST502)、左右2本の人差し指であれば、その左右2本の人差し指が所定時間(例えば1秒間)動きを停止したか否かを判定し(ST503)、所定時間動きを停止していれば、その左右2本の人差し指が指し示す指示点の座標を求める(ST504)。
【0053】
ついで、左右2本の人差し指がそれぞれ指し示す2つの指示点から、ページの継ぎ目を示す中心線に対して平行となる直線と中心線に対して垂直となる直線を延ばしてそれらの交点を求める。これにより得られた2つの交点と、人差し指が指し示す2つの指示点とが、領域指定の主要点として抽出され、4つの主要点を結んだ矩形の領域が指定領域となる。
【0054】
図11は、図3に示した2次メッシュモデル生成・画像変換(ST106)の手順を示すフロー図である。図12は、2次メッシュモデル生成・画像変換の要領を説明する模式図である。ここでは、切出し領域を対象にして2次メッシュモデルを生成し、その2次メッシュモデルに基づいて切出し領域の画像を射影変換により平面化する。
【0055】
まず、2次メッシュモデル生成部34において、前記の図8、図9の切出し領域取得で
取得した指定領域の主要点の座標を、1次メッシュモデルの座標に合成する(ST601)。そして、指定領域に基づいて実際に画像を切り出す切出し領域を規定するメッシュ交点を抽出する(ST602)。ここでは、図12(A)に示すように、指定領域を取り囲むように指定領域の外側のメッシュ交点を結んだ領域を切出し領域に設定する。そして、図12(B)に示すように、指定領域を含む切出し領域を対象にして、1次メッシュモデルよりメッシュ間隔を細かくした2次メッシュモデルを生成する(ST603)。
【0056】
2次メッシュモデルは、1次メッシュモデルの各メッシュ交点の間を等分割するメッシュ交点を求めることで生成することができる。平均的な文字の大きさは10ポイント(幅3.5mm)程度となり、例えば1次メッシュモデルのメッシュ間隔を、平均的な10ポイントの文字の3文字分に相当する10.5mmとすると、2次メッシュモデルのメッシュ間隔を、10ポイントの文字の1文字分、すなわち1次メッシュモデルのメッシュ間隔の1/3の3.5mmとする。
【0057】
ついで、2次メッシュモデルが生成された切出し領域に対応する画像部分のみを対象にして射影変換による平面化が切出し画像生成部35にて実施される(ST604)。これにより、図12(C)に示すように、切出し領域のみ平面化された切出し画像を取得することができる。
【0058】
このようにメッシュ間隔が小さい2次メッシュモデルを用いて画像の平面化を行うため、平面化の変換精度を向上させることができ、歪みの小さな高画質な切出し画像を取得することができる。さらに、必要となる切出し領域に対応する画像部分のみを平面化するため、平面化に要する演算負担を軽減して処理の高速化を図ることができる。
【0059】
ここで、指やペンなどの指示物Fによる領域指定時に生じる画像ずれについて説明する。図13は、指示物Fで切り出す領域を指定した際の本の紙面の状態を示す模式図である。図14は、指示物Fが指し示す点を結んで得られる指定領域と、実際に画像を切り出す切出し領域とを示す模式図である。なお、図14は、紙面に文字列が記載された画像の例を示している。
【0060】
図13に示すように、本のページを自然に開いた状態では、紙の間に隙間があるため、領域指定の際に、指やペンなどの指示物Fで本の紙面を押さえると、指示物Fに押されて本Bの紙が撓み、この紙の撓みに応じて紙面の画像が左右にずれる。そこでここでは、切出し領域取得部33にて、指示物Fが指し示す点を結んだ指定領域の周囲に所定のマージンが確保されるように切出し領域を設定する。これにより、指示物Fによる指定領域よりマージン分だけ大きな領域を切り出すため、指示物Fによる領域指定時に指示物Fに押圧されて紙が変位することによる画像のずれに関係なく、指示物Fで指定された領域の画像を確実に切り出すことができる。
【0061】
切出し領域を設定する際に指定領域の周囲に確保するマージン幅は、指やペンなどの指示物Fに押されて紙が撓むことに伴う画像のずれ量に基づいて定めればよい。画像のずれ量は、本の種類(雑誌やハードカバー本など)や紙質により異なるが、最大で5mm程度と推定され、これは、平均的な10ポイント(幅3.5mm)の文字では約2文字分に相当し、少なくともこの10ポイント文字の2文字分のマージンを確保するとよい。
【0062】
特にここでは、図14に示すように、1次メッシュモデルにおいて指定領域を取り囲むメッシュラインを境界線して切出し領域を求めるようにしている。図示する例では、指定領域の外側直近のメッシュラインより1本外側のメッシュラインを切出し領域の境界線としている。これにより、常にメッシュ間隔以上のマージンを確保することができ、1次メッシュモデルのメッシュ間隔を適切に設定することで、必要なマージンが確保されるため
、指示物による領域指定時の画像のずれに関係なく、指示物で指定された領域の画像を欠落なく確実に切り出すことができる。
【0063】
この場合、1つの網目内に少なくとも3文字入るように1次メッシュモデルのメッシュ間隔を設定するとよい。平均的な文字の大きさは10ポイント(幅3.5mm)程度となるため、10ポイントの文字の3文字分とすると、3.5×3=10.5mm角以上のメッシュとなる。
【0064】
図15は、図3に示した切出し画像補正(ST702)の手順を示すフロー図である。図16、図17、図18は、切出し画像補正で行われる各処理の状況を示す模式図である。なお、図16、図17、図18は、紙面に文字列が記載された画像の例を示している。
【0065】
前記のように、切出し領域は、指示物で実際に指定された領域より大きな領域となるため、前記の処理で取得した切出し画像の外周部には不要の画像が含まれる。そこで、切出し画像から不要部分を切り取って最終的な切出し画像を取得する。
【0066】
まず、図15および図16に示すように、切出し領域の境界線上に跨った画像があるか否かを判定し(ST701)、該当する画像がある場合には、その画像の内側に境界線を設定して、その新たな境界線(切出し線)に沿って該当する画像部分を切り取る(ST702)。紙面の画像を切り出す場合、通常、画像が途中で分断されないように切り出す。そこで、切出し領域の境界線上に跨った画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。
【0067】
ついで、図15および図17に示すように、切出し画像内に枠取りがあるか否かを判定し(ST703)、枠取りがある場合には、枠で囲まれた領域の外側にある画像の内側に境界線を設定して、その新たな境界線(切出し線)に沿って該当する画像部分を切り取る(ST704)。枠で囲まれた領域を切り出す場合、通常、その枠で囲まれた領域のみを切り出すことが多い。そこで、枠で囲まれた領域の外側にある画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。
【0068】
一方、切出し画像内に枠取りがない場合には、文字群の周囲に文字間隔および行間隔より大きな空白が存在するか否かを判定し(ST705)、該当する空白が存在しない場合には、空白がない辺を抽出する(ST706)。
【0069】
以降、図15および図18に示すように、句読点の位置から文節を判断して、切出し画像の外周部に存在する句読点がある文字列より外側の文字群の画像を削除する。文章を部分的に切り出す場合、通常、句読点で区切られた範囲を切り出すことが多く、文節の途中で切り出すことはしないため、切出し画像の外周部に存在する句読点の外側の文字群の画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。また、句読点を基準にして削除可能な部分は、書字方向(横書きと縦書き)によって異なり、横書きであれば、残すべき文節の上下にある文字群の画像を、縦書きであれば、残すべき文節の左右にある文字群の画像を削除すればよい。
【0070】
ここではまず、切出し画像内の文字列に対して簡易OCRを実施し(ST707)、その簡易OCRの結果に基づいて書字方向、すなわち縦書きと横書きのいずれかを判定する(ST708)。ここでは、句読点の位置関係に基づいて判定し、句読点の位置が直前の文字の下方の右側にある場合には縦書き、句読点の位置が直前の文字の右方の下側にある場合には横書きと判定する。そして、縦書きの場合には、以降の処理を左右2辺の空白がない辺に限定し(ST709)、横書きの場合には、以降の処理を上下2辺の空白がない辺に限定する(ST710)。
【0071】
ついで、1行目の文字列の終わりに句読点があるか否かを判定し(ST711)、1行目の文字列の終わりに句読点がある場合には、1行目の文字列の内側に境界線を設定して、その新たな境界線(切出し線)に沿って1行目の文字列の画像部分を切り取る(ST712)。ついで、最終行から2行目の文字列の終わりに句読点があるか否かを判定し(ST713)、最終行の文字列の終わりに句読点がある場合には、最終行目の文字列の内側に境界線を設定して、その新たな境界線(切出し線)に沿って最終行目の文字列の画像部分を切り取る(ST714)。
【0072】
図19は、切出し画像補正で行われる処理の別の例を示す模式図である。ここでは、切出し画像内に文字間隔および行間隔より大きな空白の外側にある画像を削除する。文章において文字間隔および行間隔より大きな空白が存在する場合には、通常、その空白の位置を境界にして文字群を切り出すため、空白より外側にある画像は、余分に確保したマージン上に存在する不要部分と考えられ、削除することができる。この場合、前記のような文節判断を行うことなく不要な文字列を削除することができる。
【0073】
なお、前記の例では、図2に示したように、ブックスキャナから撮影画像データをPCに送ってPCで画像切出しの処理を行うようにしたが、このような画像処理をブックスキャナで行う、すなわちブックスキャナが画像処理装置を含む構成も可能である。この場合、テレビジョン受像機などの表示デバイスに画像を表示させればよい。
【0074】
また、前記の例では、指やペンなどの指示物を用いて指定された領域を含む切出し領域のみを平面化して切出し画像を取得する構成としたが、本の紙面の全体を平面化した後に、切出し領域に対応する画像部分を切り出す構成としてもよい。
【産業上の利用可能性】
【0075】
本発明にかかる画像処理装置は、本などの原稿の紙面上で指などの指示物で領域を直接指定する動作で切出し画像を取得することができる効果を有し、本などの原稿の紙面を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムなどとして有用である。
【符号の説明】
【0076】
1 ブックスキャナ(画像入力装置)
2 PC(画像処理装置)
3 カメラ部
22 画像データ入力部(撮影画像取得部)
31 輪郭取得部
32 1次メッシュモデル生成部
33 切出し領域取得部
34 2次メッシュモデル生成部
35 切出し画像生成部
36 画像補正部
37 画像変換部
【特許請求の範囲】
【請求項1】
指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得する撮影画像取得部と、
前記第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める切出し領域取得部と、
前記第1の撮影画像内の少なくとも前記切出し領域取得部で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する切出し画像生成部とを備え、
前記切出し領域取得部は、前記指示物が指し示す1点の軌跡で表される指定領域に基づいて前記切出し領域を求めることを特徴とする画像処理装置。
【請求項2】
前記切出し領域取得部は、前記指示物の動作後、前記指示物が所定時間停止し、さらに動作を開始する場合において、前記指示物が所定期間停止した位置を示す位置データを複数記憶し、前記位置データに基づいて切出し領域を求めることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記第1の撮影画像に基づいて1次メッシュモデルを生成する1次メッシュモデル生成部と、前記1次メッシュモデルに基づいてこれよりメッシュ間隔が小さい2次メッシュモデルを生成する2次メッシュモデル生成部と、をさらに有し、
前記切出し領域取得部は、前記1次メッシュモデルを用いて前記切出し領域を求め、
前記切出し画像生成部は、前記2次メッシュモデルを用いて画像の平面化を行うことを特徴とする請求項1及び請求項2いずれかに記載の画像処理装置。
【請求項4】
前記2次メッシュモデル生成部は、前記切出し領域についてのみ前記2次メッシュモデルを生成し、
前記切出し画像生成部は、前記2次メッシュモデルを用いて前記切出し領域に対応する画像部分のみを平面化することを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記切出し領域取得部は、前記1次メッシュモデルにおいて前記指定領域を取り囲むメッシュラインを境界線して前記切出し領域を求めることを特徴とする請求項3及び請求項4いずれかに記載の画像処理装置。
【請求項6】
請求項1乃至請求項5のいずれかに記載の画像処理装置と、前記撮像画像を撮影するカメラ部を有する画像入力装置とを備えた原稿読取システム。
【請求項1】
指示物のない状態で原稿の紙面を載置面とともに撮影した第1の撮影画像と、原稿の紙面上で切り出すべき領域を指し示す指示物を原稿の紙面とともに撮影した第2の撮影画像とを取得する撮影画像取得部と、
前記第2の撮影画像から指示物が指し示す点を検出して切出し領域を求める切出し領域取得部と、
前記第1の撮影画像内の少なくとも前記切出し領域取得部で得られた切出し領域に対応する画像部分を平面化して切出し画像を取得する切出し画像生成部とを備え、
前記切出し領域取得部は、前記指示物が指し示す1点の軌跡で表される指定領域に基づいて前記切出し領域を求めることを特徴とする画像処理装置。
【請求項2】
前記切出し領域取得部は、前記指示物の動作後、前記指示物が所定時間停止し、さらに動作を開始する場合において、前記指示物が所定期間停止した位置を示す位置データを複数記憶し、前記位置データに基づいて切出し領域を求めることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記第1の撮影画像に基づいて1次メッシュモデルを生成する1次メッシュモデル生成部と、前記1次メッシュモデルに基づいてこれよりメッシュ間隔が小さい2次メッシュモデルを生成する2次メッシュモデル生成部と、をさらに有し、
前記切出し領域取得部は、前記1次メッシュモデルを用いて前記切出し領域を求め、
前記切出し画像生成部は、前記2次メッシュモデルを用いて画像の平面化を行うことを特徴とする請求項1及び請求項2いずれかに記載の画像処理装置。
【請求項4】
前記2次メッシュモデル生成部は、前記切出し領域についてのみ前記2次メッシュモデルを生成し、
前記切出し画像生成部は、前記2次メッシュモデルを用いて前記切出し領域に対応する画像部分のみを平面化することを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記切出し領域取得部は、前記1次メッシュモデルにおいて前記指定領域を取り囲むメッシュラインを境界線して前記切出し領域を求めることを特徴とする請求項3及び請求項4いずれかに記載の画像処理装置。
【請求項6】
請求項1乃至請求項5のいずれかに記載の画像処理装置と、前記撮像画像を撮影するカメラ部を有する画像入力装置とを備えた原稿読取システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公開番号】特開2012−170049(P2012−170049A)
【公開日】平成24年9月6日(2012.9.6)
【国際特許分類】
【出願番号】特願2011−284916(P2011−284916)
【出願日】平成23年12月27日(2011.12.27)
【分割の表示】特願2011−30966(P2011−30966)の分割
【原出願日】平成23年2月16日(2011.2.16)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】
【公開日】平成24年9月6日(2012.9.6)
【国際特許分類】
【出願日】平成23年12月27日(2011.12.27)
【分割の表示】特願2011−30966(P2011−30966)の分割
【原出願日】平成23年2月16日(2011.2.16)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】
[ Back to top ]