説明

情報処理装置、情報処理方法、及び情報処理プログラム

【課題】適切な画像データを取得する情報処理装置、情報処理方法及び情報処理プログラムを提供することである。
【解決手段】実施形態の情報処理装置は、書類を撮影する撮影部と、撮影部が撮影した書類の画像データを取得する画像取得部と、第1の判定部と、第2の判定部と、画像登録部とを備える。第1の判定部は、所定の領域である外側枠領域の画像データの色が所定割合以上書類自体の色または書類の背景色であるかを判定する。第2の判定部は、外側枠領域の内側の所定の領域である内側枠領域の画像データの色が所定割合以上書類自体の色でなく、かつ書類の背景色でもないことを判定する。画像登録部は、第1の判定部の判定結果と第2の判定部の判定結果とに基づいて画像データを記憶装置に記憶する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
カメラを搭載した携帯端末を用いて書類などの画像を取得する技術がある。このようなカメラを搭載した携帯端末を応用する分野として、例えば保険の営業職員が契約者と社外などで契約手続を行う際の業務が上げられる。契約手続の際に、保険の営業職員は上述のようなカメラを搭載した携帯端末を持参し、保険の契約者との面会場所にて、手続きに必用な領収書等の書類を携帯端末のカメラで撮影して画像を取得する。
【0003】
例えば、営業担当者が携行したノートパソコンによって顧客が記入した申込書などの書類を撮影して電子データ化し、エビデンスデータとして保管する場合が考えられる。ここで、書類を撮影した電子データを保管する際、エビデンスデータとして保管することに対して顧客の同意を得るため、顧客の前で電子データ化して保管することが好ましい。また、文字の可読性などのエビデンスデータとしての画質を備えていることが、リアルタイムに確認できることが好ましい。
【0004】
文字の可読性など、エビデンスデータに求められる条件を備えていることを、営業担当者がリアルタイムに確認するためには、客先で画像を取り込む必要がある。また、文字のそのように取得した画像の可読性を担保するために、常に一定のレベル以上の画質で撮影可能な仕組みが必要になる。
【0005】
これに対し、撮影した書類画像が一定のレベル以上の可読な画質であるか否かを判定する為に、書類画像が十分な大きさであるかを判定する方法がある。この方法では、画像に含まれる書類の縁を検出し、縁の大きさで書類画像の大きさを判定する。しかしながら、上述のような保険の営業職員と保険契約者の面会場所は一般家庭や事務所の他、喫茶店など、不特定のさまざまな場所であり、書類を載せる机の表面の色も様々であるため、この方法では撮影する書類自体の色と机などの書類の背景色が同色であった場合には書類の縁を検出できないため、大きさを判定することができないという問題がある。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−267415号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明が解決しようとする課題は、適切な画像データを取得する情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
実施形態の情報処理装置は、書類を撮影する撮影部と、撮影部が撮影した書類の画像データを取得する画像取得部と、第1の判定部と、第2の判定部と、画像登録部とを備える。第1の判定部は、所定の領域である外側枠領域の画像データの色が所定割合以上書類自体の色または書類の背景色であるかを判定する。第2の判定部は、外側枠領域の内側の所定の領域である内側枠領域の画像データの色が所定割合以上書類自体の色でなく、かつ書類の背景色でもないことを判定する。画像登録部は、第1の判定部の判定結果と第2の判定部の判定結果とに基づいて画像データを記憶装置に記憶する。
【図面の簡単な説明】
【0009】
【図1】第1の実施の形態に係る情報処理装置の外観の一例を示す図。
【図2】第1の実施の形態に係る情報処理装置による書類の撮影の様子のイメージ図。
【図3】第1の実施の形態に係る情報処理装置ハードウェア構成の一例を示す図。
【図4】第1の実施の形態に係る情報処理装置の機能ブロック図。
【図5】第1の実施の形態に係る理想枠領域のイメージ図。
【図6】第1の実施の形態に係る表示部の画面の一例を示す図。
【図7】第1の実施の形態に係る情報処理装置の処理の一例を示すフローチャート。
【図8】第1の実施の形態に係るエッジ推定処理の一例を示すフローチャート。
【図9】第1の実施の形態に係る外側枠領域と内側枠領域の一例を示すイメージ図。
【図10】第1の実施の形態に係る外側枠領域と内側枠領域と取得された画像データの関係を示すイメージ図。
【図11】第2の実施の形態に係る情報処理装置の機能ブロック図。
【図12】第2の実施の形態に係る情報処理装置の処理の一例を示すフローチャート。
【図13】第2の実施の形態に係る可読性判定処理の一例を示すフローチャート。
【発明を実施するための形態】
【0010】
(第1の実施形態)
以下、第1の実施形態の情報処理装置1について図面を参照して説明する。
【0011】
第1の実施形態に係る情報処理装置1は、書類を撮影した画像データを処理する。情報処理装置1は、例えば図1のようにタブレット形コンピュータ(スレートPC)である。第1の実施形態に係る情報処理装置1の表面は、図1に示すように表示部105を備える。また表示部105を備えた面と対向する裏面は、図1に示すように、撮影部121を備える。情報処理装置1の表示部105は、タッチパネルを備える。情報処理装置1で実行されるソフトウェアによって、表示部105にキーボードやボタンなどが表示される。ユーザは、表示されたキーボードやボタンをタッチすることにより、情報処理装置1に指示を入力することができる。また、情報処理装置1にキーボードやマウスが接続されてもよいし、情報処理装置1の筐体に、指示を入力するボタンが設けられてもよい。
【0012】
情報処理装置1で書類を撮影する場合を説明する。図2に示すように、書類は、机などの台の上に設置される。例えばユーザは情報処理装置1を両手で把持し、情報処理装置1の撮影部121を書類に向け、書類の上部から撮影する。ここで、情報処理装置1の表示部105には、撮影部121によって撮影された書類の画像データが逐次プレビュー表示される。情報処理装置1の表示部105は、ユーザ側に位置するので、ユーザは表示部105で撮影される様子を確認しながら、書類と情報処理装置1の位置関係を調節することができる。なお、表示部105に表示された画像データには、書類の画像データ801と書類の背景(ここでは机)の画像データ802とが含まれる。
【0013】
図3に示すように、第1の実施形態に係る情報処理装置1は、中央処理制御装置101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、入出力インタフェース109および画像データ生成部123が、バス110を介して接続されている。入出力インタフェース109には、入力装置104、表示部105、通信制御装置106、記憶装置107およびリムーバブルディスク108が接続されている。画像データ生成部122には、撮影部121が接続されている。
【0014】
撮影部121は、例えばCCD(Charge Coupled Device)であって、書類から受けた光を電気信号に変換する。撮影部121は、電気信号を、画像データ生成部122に入力する。撮影部121は、例えば、情報処理装置1に固定され、かつ内蔵されたCCDである。
【0015】
撮影部121は、例えば、情報処理装置1に固定可能であって、USBポート等を介して接続可能なカメラであってもよい。ここで、「固定可能」とは、情報処理装置1と撮影部121が別のハードウェアで構成されており、撮影部121が、フックなどの接続部材によって取り外し可能な状態で情報処理装置1に固定できることを言う。この場合、撮影部121は、USBポートなどの外部インタフェースを介して、中央処理制御装置101に画像データを入力する。
【0016】
画像データ生成部122は、撮影部121から受信した電気信号を画像データに変換して、バス110に送出する回路である。第1の実施形態に係る画像データ生成部122は、回路基盤により実装されてもよいし、ソフトウェアプログラムによって実装されてもよい。
【0017】
中央処理制御装置101は、入力装置104からの入力信号に基づいてROM102から情報処理装置1を起動するためのブートプログラムを読み出して実行し、さらに記憶装置107に記憶されたオペレーティングシステムを読み出す。さらに中央処理制御装置101は、入力装置104や通信制御装置106などの入力信号に基づいて、各種装置の制御を行う、またはRAM103や記憶装置107などに記憶されたプログラムおよびデータを読み出してRAM103にロードするとともに、RAM103から読み出されたプログラムのコマンドに基づいて、データの計算または加工などの後述する一連の処理を実現する処理装置である。
【0018】
入力装置104は、操作者が各種の操作を入力するキーボード104a、マウス104bなどの入力デバイスにより構成されており、操作者の操作に基づいて入力信号を作成し、入出力インタフェース109およびバス110を介して中央処理制御装置101に送信される。
【0019】
表示部105は、例えば液晶ディスプレイである。表示部105は、中央処理制御装置101からバス110および入出力インタフェース109を介して表示部105において表示させる出力信号を受信し、例えば中央処理制御装置101の処理結果などを表示する。第1の実施形態に係る情報処理装置1の表示部105には、タッチパネルが施されており、ユーザが表示部105の画面をタッチすることにより、入力信号を中央処理制御装置101に送信することができる。
【0020】
通信制御装置106は、LANカード、モデム、アンテナなどの装置であり、情報処理装置1をインターネット、LAN、携帯電話網などの通信ネットワークに接続する装置である。通信制御装置106を介して通信ネットワークと送受信したデータは入力信号または出力信号として、入出力インタフェース109およびバス110を介して中央処理制御装置101に送受信される。
【0021】
記憶装置107は半導体記憶装置や磁気ディスク装置であって、中央処理制御装置101で実行されるプログラムやデータが記憶されている。リムーバブルディスク108は、光ディスクやフレキシブルディスクのことであり、ディスクドライブによって読み書きされた信号は、入出力インタフェース109およびバス110を介して中央処理制御装置101に送受信される。
【0022】
第1の実施形態に係る情報処理装置1の記憶装置107は、情報処理プログラムが記憶されるとともに、図4に示すように、記憶装置107は、画像データ記憶部40、理想枠領域記憶部41、保存画像データ記憶部42、およびエッジ推定データ記憶部43を備える。また、情報処理プログラムが情報処理装置1の中央処理制御装置101に読み込まれ実行されることによって、画像データ取得部19、プレビュー部20、エッジ検出部22、タイマー部23、エッジ推定部24、および画像登録部25が情報処理装置1に実装される。
【0023】
画像データ記憶部40は、記憶装置107のうち、撮影部121および画像データ生成部122によって生成された画像データが記憶される記憶領域である。画像データは、撮影部121および画像データ取得部19により逐次入力される。
理想枠領域記憶部41は、記憶装置107のうち、図5に示すような理想枠領域411を示す理想枠領域データが記憶された記憶領域である。理想枠領域データは、例えば理想枠領域411の内周の左上角のx座標、y座標および内周の右下角のx座標、y座標と、所定の幅を含む。すなわち、理想枠領域411は内周から外側に所定の幅を持つ領域である。または理想枠領域情報は、理想枠領域411の外周の左上角のx座標、y座標および外周の右下角のx座標、y座標を含んでもよい。または表示部105に表示する画像データのサイズと所定の幅を含む情報でもよい。この場合表示部105に表示する画像サイズから所定幅の領域が理想枠領域411となる。
【0024】
すなわち、理想枠領域411は、撮影部121および画像データ生成部122によって生成された画像データが適切な画像データであるかを判定するための領域である。
【0025】
「適切な画像データ」とは、書類の画像データをエビデンスデータとして保存する場合、書類に記載された文字や画像をその書類の画像データから正しく認識・可読する必要があるため、例えば、画像データに含まれる文字や画像が可読な画像データいう。本実施形態では理想枠領域411に書類の縁(以下、エッジという)が含まれるサイズの画像データは可読であり、適切な画像データであるとする。
【0026】
本実施形態では撮影部121が撮影可能な画像サイズの範囲内に理想枠領域411をあらかじめ設定し、撮影部121が撮影した画像データの中の書類のエッジが、理想枠領域411に含まれる場合の画像データを保存画像データとして保存する。なお、文字や画像が可読とは、人間や文字認識装置などが文字や画像を認識できるということである。
【0027】
本実施形態では理想枠領域411は、図5に示すように撮影部121および画像データ生成部122によって生成可能な画像データの最大サイズから所定の幅の領域(ドットの領域)とする。すなわち、表示部15に表示される画像データの外周から所定の幅の領域を理想枠領域とする。図5に示すように、理想枠領域411は、所定の領域を囲う、一定幅の形状である。理想枠211の形状は上述の形状に限られず、例えば、「L」字上のマーカーを施す形状なども考えられる。または縦の領域幅と横の領域幅が異なっても良い。
【0028】
理想枠領域411は、後述の理想枠領域表示部21が表示部105に理想枠領域411を表示する場合や、保存画像選択部26において画像データ中のエッジの位置と比較する場合に、参照される。
【0029】
保存画像データ記憶部42は、記憶装置107のうち保存画像データが記憶される記憶領域である。保存画像データは、画像データ記憶部11に記憶された複数の画像データのいずれかの画像データであって、後述する保存画像登録部25によって保存画像データ記憶部42に格納される画像データである。具体的には、保存画像選択部26が、画像データのエッジが理想枠領域411に含まれているか否かを判定し、エッジが理想枠領域411に含まれていることを検出すると、画像登録部25がその時点の画像データを保存画像データとして保存画像データ記憶部42に格納する。
【0030】
エッジ推定データ記憶部43は、記憶装置107のうち、外側枠領域431を示す外側枠領域データと内側枠領域432を示す内側枠領域データとを含むエッジ推定データが記憶される記憶領域である。外側枠領域データおよび内側枠領域データは各領域の内周の左上角のx座標、y座標および内周の右下角のx座標、y座標と、所定の幅を含む。または外側枠領域データおよび内側枠領域データは、各領域の外周の左上角のx座標、y座標および外周の右下角のx座標、y座標を含んでもよい。または本実施形態の情報処理装置1が取得可能なデータの最大サイズから所定の幅をもつ領域を外側枠領域431としても良い。この場合表示部105に表示する画像サイズから所定幅の領域が外側枠領域431となる。
【0031】
画像データ取得部19は、撮影部121が書類を撮影して生成された画像データを取得して、記憶装置107に記憶する。画像データ取得部19は、撮影部121によって撮影された電気信号に基づいて、画像データ生成部122で生成された画像データを取得して、取得した画像データを画像データ記憶部11に記憶する。画像データ取得部19は、撮影部121から入力される画像データを逐次画像データ記憶部11に記憶し、プレビュー部20がプレビューすることにより、表示部105に動画の様に表示される。
【0032】
プレビュー部20は、画像データ取得部19によって取得された画像データを表示するとともに、理想枠領域411を表示する。ここで理想枠領域411は、表示部105において画像データ取得部19によって取得された画像データの適切なサイズを示すガイドである。プレビュー部20は理想枠領域表示部21を備える。
【0033】
理想枠領域表示部21は、理想枠領域411を表示部30に表示する。理想枠領域表示部21は、例えば、画像データを表示するレイヤーに、理想枠領域411を表示するレイヤーを重ねて表示部105に表示しても良い。ユーザは、表示部105に表示された理想枠領域411の中に、書類のエッジが収まるように、書類と情報処理装置1の位置や角度を調整する。
【0034】
エッジ検出部22は、表示部105に表示された画像データ中の書類のエッジを検出する。タイマー部23は、あらかじめ設定した時間内にエッジ検出部22が画像データのエッジを検出したか否かを判定する。あらかじめ設定される時間は例えば20秒である。
【0035】
エッジ推定部24は、エッジ検出部22がタイマー部23に設定された時間内にエッジを検出しない場合に、撮影部121が書類を撮影して生成された画像データ中の書類のエッジを推定する。このエッジ推定部24による書類のエッジ推定処理については後述する。
【0036】
保存画像登録部25は、保存画像データを保存画像データ記憶部42に格納する。保存画像登録部25は、保存画像選択部26を備える。
【0037】
保存画像選択部26は、撮影部121が書類を撮影して生成された画像データ中の書類のエッジが理想枠領域411の範囲に含まれているかを判定し、書類のエッジが理想枠領域411の範囲に含まれている画像データを保存画像データとする。
【0038】
すなわち、エッジ検出部22またはエッジ推定部24によって決定された書類のエッジが上述の理想枠領域411の範囲に含まれる場合、保存画像登録部25は保存画像データ記憶部42に保存画像データを登録する。
【0039】
ここで、図6乃至図11を参照して、本実施形態の情報処理装置1による処理の手順の一例について説明する。
【0040】
図6は本実施形態の表示部105が表示する画面の一例である。図6の表示部105には撮影部121によって書類を撮影して生成された画像データが表示されているが、書類地の色と背景色が同一であり、エッジは不鮮明である。
【0041】
図7は本実施形態の情報処理装置1の処理の一例を示すフローチャートである。
【0042】
まず画像データ取得部19が、撮影部121が撮影した書類の画像データを取得し、画像データ記憶部40に登録する(ステップS10)。ここでは例えば保険の営業員が撮影対象の書類に撮影部121であるカメラのレンズを向けて書類を撮影し、画像データを取得する。
【0043】
プレビュー部20は、画像データを画像データ記憶部40から読み出し、表示部105にプレビュー表示する(ステップS20)。
【0044】
続いて、エッジ検出部22が表示部105に表示された画像データのエッジの検出を行う(ステップS30)。なお、エッジの検出は例えば輝度勾配を用いて行うことができる。
【0045】
エッジ検出部22が、タイマー部23によってあらかじめ設定された時間内に画像データのエッジを検出した場合(ステップS30がNo)、エッジ検出部22は、検出したエッジを画像データのエッジであると特定し、ステップS50の処理を行う。
【0046】
タイマー部23によってあらかじめ設定された時間が経過してもエッジ検出部22が画像データに含まれるエッジを検出できない場合(ステップS30がYes)、エッジ推定部24が、画像データのエッジを推定するエッジ推定処理を行う(ステップS40)。このエッジ推定処理については後述する。なお、タイマー部23によってあらかじめ設定された時間が経過してもエッジ検出部22が画像データのエッジを検出できない場合は、例えば撮影対象の書類の地色(紙の色)と机の色とが同一である場合などである。
【0047】
ステップS30でエッジ検出部22がエッジを検出し、またはステップS30でエッジ推定部24が画像データのエッジを推定することによって、画像データのエッジが特定されると、理想枠領域表示部21は、理想枠領域記憶部41に登録された理想枠領域情報に基づいて理想枠領域411を表示部105に表示する(ステップS50)。
【0048】
続いて保存画像選択部26が、ステップS30またはステップS40で特定された画像データのエッジが、表示部105に表示された理想枠領域411の範囲に入っているかを判定する(ステップS60)。 すなわち、保存画像選択部26は、エッジが理想枠領域411の内周を超え、かつ外周を超えていない状態があらかじめ設定した所定の時間続いた場合に、エッジが理想枠領域411の範囲に入っていると判定する。この判定は例えば、対象のエッジの角座標を特定し、理想枠領域411の内周の左上座標と右下座標を第1の閾値とし、理想枠領域411の外周の左上座標と右下座標を第2の閾値とした場合に、対象のエッジの左上座標と右下座標がそれぞれ第1の閾値以上であり、かつ第2の閾値以下であるかを判定することによって行われる。
【0049】
保存画像選択部26が、エッジが理想枠領域411の範囲に入っていると判定した場合(ステップS60がYes)、保存画像選択部26はこの画像データを保存画像データとして選択する(ステップS70)。保存画像登録部25はこの保存画像データを保存画像データ記憶部42に登録する(ステップS80)。これにより、情報取得装置1の処理は終了する。なお、保存画像登録部25は、保存画像データを保存画像データ記憶部42に登録する際にエッジの外側の画像をトリミングしても良い。
【0050】
保存画像選択部26が、エッジが理想枠領域411の範囲に入っていないと判定した場合(ステップS50がNo)、ステップS20に戻り、プレビュー部20は新たな画像データを表示する。この場合、書類のエッジが理想枠領域411の範囲に入るように、ユーザが情報処理装置1の撮影部121、または対象の書類を動かすなどし、エッジが理想枠領域411に範囲に入るようにする。このように画像データのエッジと理想枠領域411の表示により、ユーザが適切なサイズの画像データを取得する補助を行うことができる。
【0051】
ここで、図8乃至図11を参照して、図7のステップS40におけるエッジ推定処理について説明する。ここでは図6に示した画像データにおけるエッジ推定処理について説明する。
【0052】
図8は本実施形態のエッジ推定部24に係るエッジ推定処理の一例を示すフローチャートである。エッジ検出部22によって書類のエッジが検出されない状態がタイマー部23に設定された所定の時間を超えて続いた場合に、エッジ推定部24は取得された画像データを2値化する(ステップS41)。
【0053】
エッジ推定部24は、2値化した画像データにおいて、エッジ推定データ記憶部43に格納されたエッジ推定データに含まれる外側枠領域データと内側枠領域データとを参照して、エッジの推定を行う。具体的には、外側枠領域データに基づく外側枠領域431と内側枠領域データに基づく内側枠領域432とを用いて画像データ中のエッジを推定する。
【0054】
ここで、図9に外側枠領域431と内側枠領域432のイメージ図を示す。図9に示すように、外側枠領域431は、例えば表示部105に表示された画像データの外周から所定幅の領域であり、図9の網掛けで示された領域である。すなわち、外側枠領域431は、例えば本実施形態の情報処理装置1が取得可能な画像データの最大サイズから所定の幅をもつ領域である。
【0055】
対して、内側枠領域432は、外側枠領域431の内周より内側の所定幅の領域であって、図9に斜線で示す領域である。
【0056】
なお、外側枠領域431は、上述した理想枠領域411と同じ領域でもよい。または外側枠領域431と内側枠領域432とをあわせた領域が理想枠領域411と同じ領域でも良い。これらの領域はそれぞれ、あらかじめ装置の設計者や利用者などによって設定される。例えば外側枠領域431と内側枠領域432の幅は同一でも良いし、異なっても良い。また、撮影対象の書類の種類やレイアウトに合わせて領域の一辺毎に幅が異なるようにすることも可能である。
【0057】
エッジ推定部24は、外側枠領域431に含まれる2値化した画像データが所定の割合以上白色であるかを判定する(ステップS42)。外側枠領域431に含まれる2値化した画像データが所定の割合以上白色である場合(ステップS42がYes)、エッジ推定部24は、内側枠領域432に含まれる2値化した画像データが所定の割合以上黒色であるかを判定する(ステップS43)。なお、ここでは、2値化した画像データにおいて白色の画像データは書類の地の部分と机などの書類の背景の画像データであり、黒色の画像データは書類の文字や画像などの背景以外の画像データである。すなわち、本実施形態では2値化した画像データにおける書類の背景色および書類自体の色を白色とし、書類の記載内容を黒色としたが、これに限らず実際の画像データの背景色や、記載された文字の色などに合わせて変更してよい。
【0058】
内側枠領域432に含まれる2値化した画像データが所定の割合以上黒色である場合(ステップS43がYes)、エッジ推定部24は取得された画像データのエッジを外側枠領域431の範囲で特定する(ステップS44)。ステップS44で特定したエッジは例えば図10に示した破線の枠である。
【0059】
エッジ推定部24は特定したエッジを保存画像選択部26に送信し、エッジ推定処理を終了する。なお、ステップS44で特定するエッジは、例えば外側枠領域431における最も外側の枠にしても良い。または理想枠領域441の外周をエッジとしても良い。または理想枠領域の真ん中の枠をエッジとすることや表示部105に表示可能な画像データの最大サイズをエッジとすることも可能である。また、撮影する書類のサイズ毎にエッジを設定することも可能である。この場合、撮影者がカメラを起動すると、撮影する書類のサイズを選択する画面を表示部105に表示する。撮影者が書類サイズを選択すると、その書類の種類に対応したエッジを用いてエッジ推定を行う。
【0060】
外側枠領域431に含まれる2値化した画像データが所定の割合以上黒色である場合(ステップS42がNo)、エッジ推定部24はエッジ推定処理を終了する。この場合、書類の撮影距離が近いとみなせるため、プレビュー部20は、エッジ推定部24の推定結果に基づいて、書類の撮影距離が近いことを表示部105に表示し、ユーザに提示するようにしても良い。ユーザは提示された情報に基づいて、例えば撮影部121の位置を書類の遠くに移動し、画像データの取得を再度行う。
【0061】
また、内側枠領域432に含まれる2値化した画像データが一定の割合以上白色である場合(ステップS43がNo)、エッジ推定部24はエッジ推定処理を終了する。この場合、書類の撮影距離が遠いとみなせるため、プレビュー部20は、エッジ推定部24の推定結果に基づいて、書類の撮影距離が遠いことを表示部105に表示し、ユーザに提示するようにしても良い。ユーザは提示された情報に基づいて、例えば撮影部121の位置を書類の近くに移動し、画像データの取得を再度行う。
【0062】
2値化された画像データにおいて、外側枠領域431が所定の割合以上白色である場合、書類のエッジおよび書類の背景が、撮影部121によって撮影されていると推定できる。したがって、撮影部121書類の全体を撮影していると推定できる。ただしこの場合、取得した画像データにおける書類の内容が可読困難なほど小さなサイズである場合がある。このような事態を防ぐため、本実施形態では、外側枠領域431が所定の割合以上白色であり、内側枠領域432が所定の割合以上黒色である場合に、保存画像データ取得に適した状態であると判定し、画像データを保存画像データ記憶部42に登録する。これにより記載内容が適切なサイズで取得されていることが確認できるため、書類の画像データから、記載された文字や画像を認識可能・可読な画像データを記憶することが可能となる。
【0063】
また、外側枠領域431が所定の割合以上白色であって、内側枠領域432が所定の割合以上白色の場合、書類を撮影する距離が遠いと推測できる。したがって取得した画像データの可読が困難であるため、画像データを登録しない。
【0064】
また、外側枠領域431が所定の割合以上黒色の場合は、距離が近いため、対象の書類全体の画像データを取得できていない、すなわち、撮影した画像データに不備があると推定できる。なお、外側枠領域431と内側枠領域432の判定は逆の順番であっても良い。
【0065】
また、本実施形態の情報処理装置1において、保存画像選択部26が、エッジが理想枠領域411の範囲に入っていると判定した場合、撮影部121が所定枚数自動撮影して複数の保存候補画像データを取得し、取得された複数の保存候補画像データのうち、手振れや焦点ズレが最も無い画像データをステップS70において選択するようにしても良い。この場合、連続して保存候補画像データを取得している間は表示部105にカウントダウンを表示する。また、手振れや焦点ズレの最も無い画像データの選択は、例えば階調変化率を算出し、この階調変化率が最も高い画像データを選択することで実現可能である。また、画像データの可読性のために、保存画像データのコントラスト補正、台形補正、影消去、などの補正を行っても良い。これにより、可読性が高い画像データを保存することができる。
【0066】
また、エッジの外側や理想枠領域411の外側をトリミングして保存画像データ保存しても良い。これにより、必要な部分の画像データのみを登録することができる。
【0067】
上述したように、本実施形態の情報処理装置1によると、撮影対象の書類の画像データが適切なサイズであるかどうかを判定し、適切なサイズの画像データのみを取得する。これにより、適切な画像データを取得することが可能である。
【0068】
また、本実施形態の情報処理装置1によると、書類と机の色が同色であるなどにより、画像の背景色がほぼ同一色になり、エッジが検出できない場合でも、書類のエッジを推定し、推定したエッジに基づいて、画像を取得する。このため、撮影場所に関わらず、適切な画像データを取得することが可能である。
【0069】
すなわち、本実施形態の情報処理装置1は、例えば営業職員用端末に搭載することにより、帳票の物流時間ロスが減ることにより手続きに要する時間の短縮が可能である。したがって、本実施形態の情報処理装置1は、契約者が契約書などの書類をコピーして郵送するといった作業をなくし、営業職員が契約者を訪問する価値を高めるのに貢献する
(第2の実施形態)
以下、図11乃至図13を参照して、第2の実施形態の情報処理装置100について説明する。なお、第1の実施形態の情報処理装置1と同一の構成には同一の符号を付し、説明は省略する。
【0070】
図11は、第2の実施形態の情報処理装置100の全体構成を示すブロック図である。
【0071】
図11に示すように、本実施形態の情報処理装置100は、図1に示した情報処理装置1の構成に可読性判定部27、および文字列候補記憶部44をさらに有する構成である。
【0072】
可読性判定部27は、文字認識部28を有し、文字認識部28が撮影部121によって取得された画像データの文字認識を行った結果を参照して、撮影部121が取得した書類の画像データが、書類の記載内容が可読な状態の画像データであるかを判定する可読性判定処理を行う。
【0073】
図12を参照して、情報処理装置100による処理について説明する。図11は本実施形態の情報処理装置100の処理の一例を示すフローチャートである。
【0074】
図12のステップS10〜ステップS50までの処理は、第1の実施形態の情報処理装置1における処理と同様であるため、説明を省略する。図12のステップS60の処理から説明する。
【0075】
保存画像選択部26が、画像データのエッジは理想枠領域411の範囲に入っていると判定した場合(ステップS60がYes)、可読性判定部27は画像データの可読性を判定する(ステップS90)。
【0076】
図13を参照して、可読性判定部27による画像データの可読性の判定処理について説明する。図13は、本実施形態の画像データの可読性判定処理の一例を示すフローチャートである。
【0077】
まず、可読性判定部27の文字認識部28が対象の画像データの文字認識を行う(ステップS91)。ここで、可読性判定部27は、文字認識結果の文字列を用いて記憶装置107の文字列候補記憶部44を検索する(ステップS92)。なお、文字列候補記憶部44には、キーワードとして、日本語として意味を成す文字列や、画像データ取得対象の書類に特有な文字列があらかじめ登録されている。すなわち、ステップS92で、可読性判定部27は、文字認識結果の文字列にキーワードがあるかを検索する。
【0078】
検索した結果、キーワードがある場合(ステップS93がYes)、可読性判定部27は画像データが可読であると判定する(ステップS94)。これにより、可読性判定部27は可読性判定処理を終了する。
【0079】
検索した結果、キーワードが無い場合であって(ステップS93がNo)、キーワード検索回数が3回以下の場合(ステップS95がYes)、可読性判定部27は画像データを90度回転する(ステップS95)。そして、ステップS91からの処理を繰り返す。
【0080】
キーワードが無い場合であって(ステップS93がNo)、キーワード検索回数が3回を超えた場合(ステップS95がNo)、可読性判定部27は、画像データは可読でないと判定する(ステップS97)。これにより、可読性判定部27は可読性判定処理を終了する。
【0081】
図12の説明に戻る。可読性判定部27によって画像データが可読と判定された場合(ステップS100がYes)、保存画像データ判定部26は当該画データを保存画像データとして選択する(ステップS70)。保存画像登録部25は保存画像データを保存画像データ記憶部42に登録する(ステップS80)。このとき、可読性判定部27によって回転された角度を修正して登録する。そして、情報処理装置100は、処理を終了する。
【0082】
可読性判定部27によって画像データが可読できないと判定された場合(ステップS100がNo)、プレビュー部20は、ユーザに画像の再取得を促すための通知を表示部105に表示する(ステップS110)。そして、情報処理装置100は、処理を終了する。
【0083】
上述のように、本実施形態の情報処理装置100は、取得した画像データのサイズが十分かどうかを判定し、さらに、記載内容が可読かどうかを判定してから画像データを登録する。これにより、本実施形態の情報処理装置100は、十分な可読性を有する画像データの取得を可能とする。したがって、取得した画像に不備があった場合に発生する、利用者や顧客に対する負担を防ぐことができるため、利用者の業務を効率的にすることが可能である。
【0084】
以上、本発明のいくつかの実施形態を説明したが、これら実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【0085】
例えば理想枠領域411は、画像サイズの閾値を設定し、設定した閾値から所定の幅の領域としても良い。
【0086】
また、第1の実施形態において、エッジ推定部24が、外側枠領域431が所定の割合以上白色であり、内側枠領域432が所定の割合以上黒色であると判定した場合の画像データを保存画像データとして保存しても良い。すなわち、図7のステップS40のエッジ推定処理を行った場合は、図7のステップS50と60の処理を行わずに、画像データを保存しても良い。
【符号の説明】
【0087】
1、100…情報処理装置、101…中央処理制御装置、105…表示部、107…記憶装置、121…撮影部

【特許請求の範囲】
【請求項1】
書類を撮影する撮影部と、
前記撮影部に撮影された前記書類の画像データを取得する画像取得部と、
所定の領域である外側枠領域の画像データの色が所定割合以上前記書類自体の色または書類の背景色であるかを判定する第1の判定部と、
前記外側枠領域の内側の所定の領域である内側枠領域の前記画像データの色が所定割合以上前記書類自体の色でなく、かつ書類の背景色でもないことを判定する第2の判定部と、
前記第1の判定部の判定結果と前記第2の判定部の判定結果とに基づいて前記画像データを記憶装置に記憶する画像登録部と、
を備える情報処理装置。
【請求項2】
書類を撮影する撮影部と、
前記撮影部に撮影された前記書類の画像データを取得する画像取得部と、
所定の領域である外側枠領域の画像データの色が所定割合以上白色であるかを判定する第1の判定部と、
前記外側枠領域の内側の所定の領域である内側枠領域の前記画像データの色が所定割合以上黒色であるかを判定する第2の判定部と、
前記第1の判定部の判定結果と前記第2の判定部の判定結果とに基づいて前記画像データを記憶装置に記憶する画像登録部と、
を備える情報処理装置。
【請求項3】
前記第1の判定部の判定結果と前記第2の判定部の判定結果とに基づいて前記画像データのエッジを推定するエッジ推定部を備え、
前記画像登録部は、前記画像データの適切なサイズの領域をあらかじめ設定した理想枠領域に前記推定されたエッジが含まれるかを判定し、この判定結果に基づいて前記画像データを前記記憶装置に登録する請求項1乃至請求項2のいずれか1項に記載の情報処理装置。
【請求項4】
前記エッジが前記理想枠領域に含まれない場合に、前記理想枠領域と前記画像データとを重ねて表示部に表示するプレビュー部をさらに備える請求項3に記載の情報処理装置。
【請求項5】
前記撮影部は、画像データを複数撮影し、
前記画像登録部は、前記複数の画像データから最も階調変化率の高い画像データを登録する請求項1乃至請求項4のいずれか1項に記載の情報処理装置。
【請求項6】
前記画像データの文字認識を行い、文字認識結果の文字列と画像データ取得対象に特有な文字列として文字列候補記憶部に記憶されている文字列とを用いて、前記画像データ中の文字の可読性を判定する第3の判定部とを備える請求項1乃至請求項5のいずれか1項に記載の情報処理装置。
【請求項7】
書類を撮影するステップと、
前記撮影部に撮影された前記書類の画像データを取得するステップと、
所定の領域である外側枠領域の画像データの色が所定割合以上前記書類自体の色または書類の背景色であるかを判定するステップと、
前記外側枠領域の内側の所定の領域である内側枠領域の前記画像データの色が所定割合以上前記書類自体の色でなく、かつ書類の背景色でもないことを判定するステップと、
前記第1の判定部の判定結果と前記第2の判定部の判定結果とに基づいて前記画像データを記憶装置に記憶するステップと、
を備える情報処理方法。
【請求項8】
書類を撮影するステップと、
前記撮影部に撮影された前記書類の画像データを取得するステップと、
所定の領域である外側枠領域の画像データの色が所定割合以上白色であるかを判定するステップと、
前記外側枠領域の内側の所定の領域である内側枠領域の前記画像データの色が所定割合以上黒色であるかを判定するステップと、
前記第1の判定部の判定結果と前記第2の判定部の判定結果とに基づいて前記画像データを記憶装置に記憶するステップと、
を備える情報処理方法。
【請求項9】
カメラを備えたコンピュータに、
書類を撮影する機能と、
前記撮影部に撮影された前記書類の画像データを取得する機能と、
所定の領域である外側枠領域の画像データの色が所定割合以上前記書類自体の色または書類の背景色であるかを判定する機能と、
前記外側枠領域の内側の所定の領域である内側枠領域の前記画像データの色が所定割合以上前記書類自体の色でなく、かつ書類の背景色でもないことを判定する機能と、
前記第1の判定部の判定結果と前記第2の判定部の判定結果とに基づいて前記画像データを記憶装置に記憶する機能と、
を実現させる情報処理プログラム。
【請求項10】
カメラを備えたコンピュータに、
書類を撮影する機能と、
前記撮影部に撮影された前記書類の画像データを取得する機能と、
所定の領域である外側枠領域の画像データの色が所定割合以上白色であるかを判定する機能と、
前記外側枠領域の内側の所定の領域である内側枠領域の前記画像データの色が所定割合以上黒色であるかを判定する機能と、
前記第1の判定部の判定結果と前記第2の判定部の判定結果とに基づいて前記画像データを記憶装置に記憶する機能と、
を実現させる情報処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2012−205089(P2012−205089A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−68041(P2011−68041)
【出願日】平成23年3月25日(2011.3.25)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】