説明

画像管理装置、画像管理方法、及び、コンピュータプログラム

【課題】名刺等の文字が記載されている被写体をカメラで撮影して、被写体の文字を電話帳等に登録する際に、必要となる作業用メモリを少なくすることを目的とする。
【解決手段】画像管理装置は、被写体の文字の大きさに応じた画素数を決定し、決定された画素数の撮影データを撮影して記憶し、記憶されている撮影データから被写体の文字を認識し、被写体の文字を視認することが可能な画素数の保存用データを記憶されている撮影データから生成して記憶した後、撮影データを削除する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像の文字を文字データとして認識する技術に関する。
【背景技術】
【0002】
近年、携帯電話機等の携帯端末の多くがデジタルカメラを搭載しており、撮影する画像の高画素化が進んでいる。そのデジタルカメラを用いて名刺を撮影し、名刺の撮影画像を携帯端末に保存することがなされている。
【0003】
一方、携帯端末は小型化が進んでおり、それに伴って、表示画面の大きさは限られたものとなっている。
【0004】
従って、通常の風景写真のように1画面に名刺全体を表示した場合には、電話番号等の小さな文字が読み取れず、拡大しないと見えない場合が生じ得る。
【0005】
そこで、名刺の撮影画像の表示を工夫し、名刺ならではの操作性を高める技術が提案されている。
【0006】
例えば、電話番号が記載されている部分を表示するときは拡大して表示する、及び、電話番号が記載されている部分を表示しながら、電話番号の入力を可能にする等である(特許文献1等参照)。
【0007】
また、名刺の撮影画像から文字を認識して、電話番号等を電話帳に登録し、名刺の撮影画像をアイコンとして登録することもなされている。
【0008】
カメラが高機能化して解像度が高くなっていることから、拡大しても画像が鮮明であるので電話番号を読み取ることができ、また、画像の文字を認識して文字データとすることが可能となっている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2006−71827号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかし、カメラが高機能化して高画素化が進んでいる(解像度が高くなっている)ことから、名刺の撮影画像のデータのサイズは大きいものとなってきている。
【0011】
また一方で、高機能化及び多機能化が進む携帯端末においては、動作する際に多くの作業用メモリを必要とする機能もある。また、複数の機能を並行して動作させる場合は、それぞれの機能の動作に必要な作業用メモリを合わせた容量の作業用メモリが必要となる。
【0012】
しかし、高機能化及び多機能化に加えて小型化が進む携帯端末においては、搭載できるメモリにも限度があり、作業用メモリの有効利用が望まれる。
【0013】
そこで、本発明は、名刺等の文字が記載されている被写体をカメラで撮影して、被写体の文字を電話帳等に登録する際に、必要となる作業用メモリを少なくすることを目的とする。
【課題を解決するための手段】
【0014】
本発明の1形態に係る画像管理装置は、被写体の文字の大きさに応じた画素数を決定する決定手段と、前記被写体を撮影し、前記決定された画素数の撮影データを出力する撮像手段と、前記撮像手段で出力された撮影データを記憶する撮影データ記憶手段と、前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識する文字読取手段と、前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成する保存用データ生成手段と、前記保存用データを記憶する保存用データ記憶手段と、を有する。
【発明の効果】
【0015】
上記構成の画像管理装置は、名刺等の文字が記載されている被写体をカメラで撮影して、被写体の文字を電話帳等に登録する際に、必要となる作業用メモリを少なくすることができる。
【図面の簡単な説明】
【0016】
【図1】携帯電話機の外観及び電話帳表示時の画面の例を示す図である。
【図2】名刺撮影時の携帯電話機を正面から見たところを示す図である。
【図3】電話帳の個人情報をディスプレイに表示させた場合の、画面の遷移の例を示す図である。
【図4】名刺登録処理における撮影データの流れ等を示す図である。
【図5】携帯電話機の機能的構成の例を示すブロック図である。
【図6】変換テーブルの構成及び内容の例を示す図である。
【図7】電話帳データの構成及び内容の例を示す図である。
【図8】携帯電話機の名刺登録処理のフローチャートである。
【図9】電話帳に登録されている個人情報の名刺画像表示処理のフローチャートである。
【発明を実施するための形態】
【0017】
<実施形態>
携帯端末等に搭載されているカメラは、風景及び人物等を撮影することが主な目的であり、きれいな撮影画像となるように、解像度が高いものが好まれる。
【0018】
しかし、名刺の撮影画像に求められることは、きれいな画像であることではなく、名刺の文字を読めること、名刺の文字をOCR(Optical Character Recognition)等で認識できること、及び、名刺に記載されているマーク等を視認できること等である。
【0019】
従って、カメラで撮影した撮影画像に対して求められる解像度は、風景等を撮影した撮影画像に求められるものと、名刺を撮影した撮影画像に求められるものとは異なるのが必然である。
【0020】
実施形態の携帯端末等では、風景等を撮影する場合とは別に、名刺をカメラで撮影して電話帳に登録する場合の名刺登録機能を有する。
【0021】
以下、実施形態の名刺登録機能を有する携帯電話機について説明する。
【0022】
図1は、実施形態の携帯電話機1000の外観及び電話帳表示時の画面の例を示す図である。
【0023】
携帯電話機1000は、いわゆる折り畳み式携帯電話機であり、図1は、開いた携帯電話機1000を正面から見たところを示している。
【0024】
携帯電話機1000は、第1筐体1001と第2筐体1002と、これらを結合するヒンジ1003とを有する。
【0025】
第1筐体1001は、ディスプレイ2000を備える。
【0026】
ユーザが電話帳を表示させた場合、ディスプレイ2000には、2つの画面が並んで表示される。個人情報表示画面2010及びソフトキー表示画面2020である。
【0027】
個人情報表示画面2010は、電話帳に登録されている個人情報の内容を表示する画面であり、個人情報である電話番号等の文字データ及びアイコン2001を表示する。アイコン2001として、顔写真及び図柄等を表示することができる。図1では、横書きの名刺のアイコン2001が表示されている。
【0028】
ソフトキー表示画面2020は、電話帳を表示させる操作で用いるソフトキーを表示する画面である。表示されるソフトキーは、個人情報表示画面2010に表示されている内容及びカーソルの位置に応じて異なる。
【0029】
例えば、図1においてソフトキー表示画面2020に表示されたソフトキー「修正」は、現在表示されている個人情報を修正するためのキーである。「発信」は、個人情報表示画面2010に表示されている電話番号に発信するためのキーである。また「メニュー」は、メニューを表示するためのキーである。
【0030】
また、第2筐体1002は、操作キーを備える。操作キーは、ソフトキー対応キー10、機能キー20及び文字入力キー30に分類される。
【0031】
ソフトキー対応キー10のうち、キー11は、中央のソフトキー、図1においては「発信」に対応する。また、キー13及びキー14は、それぞれ、左のソフトキー「修正」及びソフトキー「メニュー」に対応する。
【0032】
ソフトキー対応キー10のうち、キー12は、ディスプレイ2000に表示されるカーソルを上下左右に移動するために使用するキーである。以下、「カーソルキー12」というものとする。
【0033】
機能キー20のキー「発信」は、電話発信キーであり、キー「切断」は、電話通話切断キーである。キー「クリア」は、文字の入力において文字を消去するためのキーである。
【0034】
文字入力キー30は、いわゆるテンキーであり、それぞれのキーに対応付けされている文字を入力するためのキーである。尚、図1では、各キーには数字が記載されているが、数字の他に「あ行」〜「わ行」等が対応付けられている。例えば、キー「1」には「あ行」が、キー「2」には「か行」が割り当てられている。
【0035】
ここで、図2〜図4を用いて、携帯電話機1000における名刺登録機能の使い方について説明する。
【0036】
図2を用いて、名刺を撮影する場合を説明する。また、図3を用いて、撮影した名刺を参照する場合を説明する。これらの説明をする際、図4を参照する。
【0037】
図4は、名刺登録処理における撮影データの流れ等を示す図である。図4における、撮像部1300等の各機能部の詳細については、<機能>の項で説明する。
【0038】
まず、名刺を撮影する場合を説明する。尚、実施形態では、名刺登録機能を用いて、「名刺撮影モード」でカメラを起動して名刺を撮影すると、自動的に電話帳に登録されるものとする。
【0039】
図2は、名刺撮影時の携帯電話機1000を正面から見たところを示す図である。
【0040】
名刺を登録するために、まず、ユーザが名刺を撮影する。
【0041】
具体的には、「名刺撮影モード」でカメラ(図4の撮像部1300に該当する。)を起動して、名刺登録機能を有効にする。カメラが起動されると、撮影する名刺の画像の位置合わせの為に、ディスプレイ2000の四隅にガイド枠2101が表示される。
【0042】
ユーザは、ディスプレイ2000に表示されたガイド枠2101に名刺の画像が収まるようにして、「撮影」が対応するキー11を押下する。この場合、名刺が逆さまになっていてもよく、また、文字が横になっていてもよい。後で画像を手動または自動で90度毎に回転してもよいし、OCRで認識して、文字認識率が低ければ回転して、再度、OCRで認識して認識率の最も高い時の回転した画像を、名刺の向きが正しい画像としてもよい。
【0043】
撮像部1300によって撮影された名刺画像3001は、名刺登録作業用記憶部3000に記憶される(図4参照)。
【0044】
この名刺画像3001から、文字認識部1500によって名前等の文字データが認識され、名前等が電話帳記憶部3200に記憶される(図4の電話帳データ3210参照)。
【0045】
また、名刺画像3001は、文字の向きが正しく補正された名刺画像3101として名刺画像記憶部3100に記憶される。尚、この名刺画像3101には識別子、例えば、「G002」が付けられる。
【0046】
この名刺画像3101が記憶されたら、名刺登録作業用記憶部3000の名刺画像3001は削除される。すなわち、名刺登録作業用記憶部3000は、名刺画像3001を記憶することができる領域があればよい。
【0047】
次に、図3は、ユーザが電話帳の個人情報をディスプレイ2000に表示させた場合の、画面の遷移の例を示す図である。図3において、反転文字、又は、太線の矩形は、カーソルでフォーカスされている位置を示している。
【0048】
ユーザがメニュー等を操作して、電話帳から、「○山△男」の個人情報を表示させる(図3の画面2201参照)。画面2201では、電話番号がカーソルでフォーカスされている。
【0049】
この画面2201は、電話帳記憶部3200に記憶されている電話帳データ3210と、名刺画像記憶部3100に記憶されている名刺画像3101とから、電話帳表示部1700によってディスプレイ2000に表示される(図4の画面2201参照)。電話帳データ3210の「画像」として設定されている「G002」が識別子として付けられている名刺画像3101を表示する。
【0050】
ここで、ユーザがカーソルキー12を操作してアイコン2001にカーソルを移動する(図3の画面2202のカーソル2204参照)。
【0051】
画面2002の状態で、ユーザが、「拡大」に対応するキー11を押下して、アイコン2001の拡大表示を指示する。
【0052】
ユーザの指示により、アイコン2001が拡大されて表示される(図3の画面2203参照)。ここで、更にユーザが、「拡大」に対応するキー11を押下して、拡大表示を指示すると、更に拡大された名刺画像が表示される。「縮小」に対応するキー14を押下して、縮小表示を指示すると、縮小された名刺画像が表示される。また、カーソルキー12を押下して表示位置を変える指示を行うと、指示に応じて表示されている名刺の部分が移動する。これらの表示の際には、名刺画像記憶部3100に記憶されている名刺画像3101が必要に応じて読み出されて使用される。
【0053】
ユーザが名刺のアイコン2001を拡大表示させるのは、ユーザが知りたい情報を知るためである。例えば、電話帳に登録された電話番号が合っているかを確認するために、名刺に記載されている電話番号を見る、及び、名刺に記載されている会社のロゴを確認する等である。
【0054】
名刺登録作業用記憶部3000に記憶されている名刺画像3001と、名刺画像記憶部3100に記憶されている名刺画像3101との違いは、その画素数である。
【0055】
名刺画像3001は、文字認識部1500が文字認識を行うことができる画素数の画像である。この画素数は、文字認識を行うOCR等の性能によって異なる。
【0056】
一方、名刺画像3101は、ディスプレイ2000に表示した場合に(図3の画面2203参照)、人間が文字を視認できる程度の画素数の画像である。名刺に印刷される文字の大きさが限られていることから、予め名刺画像3101の画素数を決めておくことが可能である。
【0057】
画素数は、通常、名刺画像3001よりも名刺画像3101の方が小さくなる場合が多い。従って、記憶する圧縮データも、名刺画像3101の方が小さい場合が多い。例えば、JPEG形式の名刺画像3001のデータが960KB(キロバイト)であり、JPEG形式の名刺画像3001のデータは、圧縮されて240KBのように小さくなる。
【0058】
<機能>
以下、図5を用いて、携帯電話機1000の機能について説明する。
【0059】
図5は、携帯電話機1000の機能的構成の例を示すブロック図である。
【0060】
携帯電話機1000は、携帯電話機が通常有する通話機能及びメール機能等を有するが、図5においては、名刺登録処理に関係する機能部のみを記載している。
【0061】
また、図5において、点線矢印は名刺のデータの流れを示す。
【0062】
携帯電話機1000は、インタフェース部1100、名刺登録制御部1200、撮像部1300、撮影モード設定部1400、文字認識部1500、縮小画像生成部1600、電話帳表示部1700、ディスプレイ2000、名刺登録作業用記憶部3000、名刺画像記憶部3100及び電話帳記憶部3200を有する。
【0063】
インタフェース部1100は、第2筐体1002の操作キーを含み、ユーザからの操作、例えば、キーの押下等を検出する機能を有する。
【0064】
名刺登録制御部1200は、以下に説明する各機能部に指示を出して名刺登録処理を行う機能を有する。
【0065】
撮像部1300は、いわゆるカメラであり、複数の撮影モードで撮影できる機能を有する。ここで、撮影モードとは、撮像部1300が出力する撮影データの撮影画像の画素数と色数をいう。
【0066】
例えば、16色の640×480画素の撮影データを出力するモード等である。
【0067】
この撮像部1300が撮影する撮影モードは、撮影モード設定部1400によって設定される。
【0068】
また、この撮像部1300は、撮影した結果である撮影データを、所定のフォーマットで名刺登録作業用記憶部3000に記憶させる。この所定のフォーマットは、撮影モード設定部1400から通知される。
【0069】
以下、「撮影データ」とは、画素のデータをいうものとする。また、「撮影画像」とは、撮影データに基づいてディスプレイに表示されたイメージをいうものとする。
【0070】
撮影モード設定部1400は、撮影モードを決定し、撮像部1300に決定した撮影モードを設定する機能を有する。撮影モードの決定方法は、<撮影モードの決定方法>の項で説明する。
【0071】
文字認識部1500は、いわゆるOCRであり、撮影画像の文字を認識し、文字データとして出力する機能を有する。また、文字認識部1500は、次の2つの情報を撮影モード設定部1400に通知する機能も有する。
【0072】
1つ目は、文字認識部1500自身が認識できる文字のサイズ、及び、処理可能な画像データのフォーマットに関する情報である。例えば、文字サイズ「縦5ドット」、フォーマット「JPEG(Joint Photographic Experts Group)」等と通知する。
【0073】
2つ目は、文字認識部1500が認識した撮影画像の向きに関する情報である。この向きに関する情報とは、撮影画像の文字が正しい向きになる為には、撮影画像を何度回転させる必要があるかを示す情報である。例えば、撮影画像が傾いている場合には、向きに関する情報として傾きの角度が通知される。また、撮影画像が逆さまである場合には、向きに関する情報として「180度」が通知される。尚、角度以外の情報を向きに関する情報として通知してもよい。
【0074】
縮小画像生成部1600は、名刺登録作業用記憶部3000に記憶されている撮影データから、保存用の撮影データを生成する機能を有する。縮小画像生成部1600は、文字認識部1500が通知した撮影画像の向きに関する情報に基づいて、名刺登録作業用記憶部3000に記憶されている撮影データの撮影画像の向きを補正し、予め決めてある画素数の保存用の撮影データを生成する。
【0075】
また、縮小画像生成部1600は、生成した保存用の撮影データを、名刺画像記憶部3100に記憶させる機能を有する。
【0076】
電話帳表示部1700は、電話帳の表示を行う機能を有する。具体的には、電話帳記憶部3200から個人情報を読み出してディスプレイ2000に表示する。また、名刺画像記憶部3100から撮影データを読み出してアイコン2001としてディスプレイ2000に表示する。
【0077】
ディスプレイ2000は、液晶等のディスプレイパネルを含み、撮像部1300が撮影する画像、及び、電話帳の個人情報等を表示する機能を有する。
【0078】
名刺登録作業用記憶部3000は、撮像部1300が出力した撮影データ(以下、「作業用撮影データ」という場合がある。)を記憶しておく機能を有する。尚、図4においては、作業用撮影データは、名刺画像3001のデータである。
【0079】
名刺画像記憶部3100は、保存用の撮影データ(以下、「保存用撮影データ」という場合がある。)を記憶しておく機能を有する。保存用撮影データは、識別子と対応付けて記憶されている。尚、図4においては、保存用撮影データは、名刺画像3101のデータである。
【0080】
電話帳記憶部3200は、電話番号等の個人情報を記憶しておく機能を有する。個人情報には、アイコン2001を表示するための画像の識別子が含まれている。この識別子は、名刺画像記憶部3100に記憶されている撮影データに対応付けられている識別子と同じである。
【0081】
上述した機能の全部または一部は、携帯電話機1000の有するCPUが、携帯電話機1000のメモリ等に記録されているプログラムを実行することにより実現される。
【0082】
<データ>
次に、実施形態の携帯電話機1000で用いるデータについて図6及び図7を用いて説明する。
【0083】
図6は、変換テーブル1410の構成及び内容の例を示す図である。
【0084】
この変換テーブル1410は、撮影モード設定部1400が、いかなる撮影モードを撮像部1300に設定すべきかを判断するために用いるテーブルである。
【0085】
変換テーブル1410の説明をする前に、撮影モード設定部1400が設定すべき撮影モードを決定する方法について説明する。
【0086】
<撮影モードの決定方法>
撮影モード設定部1400は、文字認識部1500の性能に応じて撮像部1300に設定する撮影モードを決定する。
【0087】
具体的には、撮影モード設定部1400は文字認識部1500に、文字認識部1500が認識可能な文字サイズの最小値、及び、文字認識部1500が処理可能なフォーマットを問い合わせる。文字サイズの最小値は、1文字の縦のドット数で示される。
【0088】
撮影モード設定部1400は、文字認識部1500が認識可能な文字サイズを上回るドット数で撮影できる撮影モードを、撮像部1300に設定する撮影モードとして決定する。
【0089】
通常の名刺で用いられる印刷文字の最小サイズは、予め知ることができる。従って、名刺の大きさ(例えば、91mm×55mm)、印刷文字の最小サイズ等から、名刺の撮影画像に必要な画素数を求めることができる。
【0090】
撮影モード設定部1400は、撮像部1300に設定できる複数の撮影モードのうちから、名刺の撮影画像に必要な画素数を保証できる撮影モードを、撮像部1300に設定する撮影モードとして決定する。名刺の撮影画像に必要な画素数を保証できる撮影モードが複数ある場合は、画素数の小さい方の撮影モードを選択する。
【0091】
このようにすることで、名刺登録作業用記憶部3000には文字認識可能な撮影データであって、無駄のない量の撮影データを記憶することが可能となる。
【0092】
また、文字認識部1500に問い合わせた性能に基づいて撮影モードを決定することから、文字認識部1500のバージョンアップがあった場合、及び、異なる性能の文字認識部1500に替わった場合等であっても、他の機能部を変更する必要がない。
【0093】
尚、撮影モード設定部1400は、文字認識部1500から受け取ったフォーマットを、撮像部1300に通知する。撮像部1300は、通知されたフォーマットで撮影データを名刺登録作業用記憶部3000に記憶させる。これは、文字認識のために、文字認識部1500に撮影データをそのまま渡せるようにするためである。
【0094】
以下、変換テーブル1410について説明する。この変換テーブル1410は、撮影モード設定部1400が内部に記憶しているものである。
【0095】
変換テーブル1410は、文字サイズ1411、画素数1412及びフォーマット1413を有する。
【0096】
文字サイズ1411は、文字サイズを示す。詳細には、文字の縦のサイズをドット数で示す。
【0097】
画素数1412は、撮影データの画素数を示す。すなわち、名刺の撮影データが備えるべき最小の画素数を示す。
【0098】
フォーマット1413は、文字認識部1500が処理可能な撮影データのフォーマットを示す。「−」は、ビットマップを示す。
【0099】
例えば、文字認識部1500が認識可能な文字サイズが「9ドット」であり、処理可能なフォーマットが「JPEG」であるとする。撮影モード設定部1400は、文字サイズ1411「5〜10」ドットに対応する画素数1412「320×240」ドット以上の撮影画像を撮影することができる撮影モードを文字認識部1500に設定する。また。撮影モード設定部1400は、フォーマットとして「JPEG」を文字認識部1500に通知する。
【0100】
次に、図7は、電話帳データ3210の構成及び内容の例を示す図である。
【0101】
この電話帳データ3210は1つの個人情報であり、通常、複数の電話帳データ3210が電話帳記憶部3200に記憶されている。
【0102】
電話帳データ3210は、項目3211及び内容3212を有する。
【0103】
項目3211は、電話帳データ3210に含まれる項目を示す。
【0104】
内容3212は、項目3211で示される項目の内容を示す。
【0105】
例えば、項目3211「名前」は、電話帳データ3210が誰に関するデータであるかを示し、その内容3212は「○山△男」である。従って、この電話帳データ3210は、「○山△男」の個人情報である。
【0106】
また、項目3211「画像」は、電話帳データ3210の個人情報に関する画像の識別子を示し、その内容3212は「G002」である。従って、名刺画像記憶部3100に記憶されている識別子「G002」で識別される画像が、「○山△男」に関する画像である。
【0107】
<動作>
以下、実施形態の携帯電話機1000の動作について図8及び図9を用いて説明する。
【0108】
図8は、携帯電話機1000の名刺登録処理のフローチャートである。図9は、電話帳に登録されている個人情報の名刺画像表示処理のフローチャートである。
【0109】
図8を用いて、携帯電話機1000のユーザが名刺を登録する場合を説明する。
【0110】
ユーザが、メニューから「名刺撮影モード」を選択してカメラを起動する操作を行う。
【0111】
カメラが「名刺撮影モード」で起動する操作を検出したインタフェース部1100は(ステップS100)、名刺登録制御部1200に名刺登録処理を開始するよう指示する。
【0112】
指示を受けた名刺登録制御部1200は、文字認識部1500の性能に関する情報を問い合わせて取得する(ステップS110)。
【0113】
具体的には、文字認識部1500から、文字認識部1500が認識可能な文字サイズの最小値、及び、文字認識部1500が処理可能なフォーマットを文字認識部1500に問い合わせて受け取る(ステップS200)。
【0114】
文字認識部1500から性能に関する情報を受け取った撮影モード設定部1400は、変換テーブル1410を参照して、撮影モードを決定する。撮影モードの決定方法は、上述した<撮影モードの決定方法>の通りである。
【0115】
撮影モードを決定した撮影モード設定部1400は、決定した撮影モードを撮像部1300に設定し、文字認識部1500から受け取ったフォーマットを通知して、撮像部1300を起動する(ステップS120)。
【0116】
起動された撮像部1300は、ディスプレイ2000の四隅にガイド枠2101を表示し、ディスプレイ2000に撮影画像を表示する(図2参照)。
【0117】
ここで、ユーザは、ディスプレイ2000に表示されたガイド枠2101に名刺の画像が収まるようにして、「撮影」が対応するソフトキー11を押下する。
【0118】
「撮影」が対応するソフトキー11の押下を検出したインタフェース部1100は(ステップS130)、キーが押下された旨を撮像部1300に通知する。
【0119】
通知を受けた撮像部1300は、撮影モード設定部1400から通知されたフォーマットの形式の作業用撮影データを生成して、名刺登録作業用記憶部3000に記憶させる(ステップS140、図4の名刺画像3001を参照)。
【0120】
「撮影」が対応するソフトキー11が押下された旨を撮像部1300に通知したインタフェース部1100は、撮影された旨を名刺登録制御部1200に通知する。
【0121】
通知を受けた名刺登録制御部1200は、名刺登録作業用記憶部3000に記憶されている作業用撮影データから、文字データを認識するよう文字認識部1500に依頼する。
【0122】
文字データを認識するよう依頼を受けた文字認識部1500は、作業用撮影データから生成する撮影画像(図4の名刺画像3001を参照)の文字を認識し、認識した文字データを名刺登録制御部1200に渡す(ステップS150、ステップS210)。
【0123】
なお、撮影した名刺の画像データを、JPEGなどで圧縮して登録する場合は、圧縮する前に記憶する名刺画像データを上向きにしておく方が望ましい。なぜなら、JPEGは、ロスレス圧縮ではないため、元の名刺画像を復元してから画像を回転する度に、画像が劣化するからである。
【0124】
また、文字認識部1500は、文字認識時に判定した撮影画像の向きに関する情報を名刺登録制御部1200に渡す(ステップS160、ステップS220)。
【0125】
文字情報の向きに関する情報を渡された名刺登録制御部1200は、受け取った向きに関する情報を渡して、縮小画像生成部1600に保存用撮影データを生成するよう依頼する。
【0126】
保存用撮影データを生成するよう依頼を受けた縮小画像生成部1600は、作業用撮影データ、及び、受け取った向きに関する情報から保存用撮影データ(図4の名刺画像3101を参照)を生成し、名刺画像記憶部3100に記憶させる。記憶させる際、識別子を付与し、識別子と対応付けて記憶させる(ステップS170)。
【0127】
保存用撮影データを記憶させた縮小画像生成部1600は、対応付けた識別子を名刺登録制御部1200に渡す。
【0128】
また、縮小画像生成部1600は、名刺登録作業用記憶部3000に記憶されている作業用撮影データを削除する。すなわち、名刺登録作業用記憶部3000における作業用撮影データが記憶されている領域を解放する(ステップS180)。
【0129】
文字認識部1500から文字データを渡され、縮小画像生成部1600から識別子を渡された名刺登録制御部1200は、文字データと識別子とから電話帳データ3210を生成して電話帳記憶部3200に記憶させる(ステップS190、図4又は図7の電話帳データ3210を参照)。
【0130】
次に、ユーザが電話帳に登録した個人情報から名刺画像を表示する場合を、図9を用いて説明する。
【0131】
ユーザが、電話帳に登録されている個人を指定して情報の表示を指示する操作を行う。
【0132】
個人情報の表示を指示する操作を検出したインタフェース部1100は(ステップS300)、電話帳表示部1700に個人情報の表示処理を開始するよう指示する。
【0133】
指示を受けた電話帳表示部1700は、電話帳記憶部3200から指定された個人の電話帳データ3210(図7参照)を読み出す(ステップS400)。
【0134】
また、電話帳表示部1700は、読み出した電話帳データ3210の項目3211「画像」の内容3212として設定されている画像の識別子を読み出す(ステップS410)。次に電話帳表示部1700は、読み出した識別子に対応付けられている保存用撮影データを、名刺画像記憶部3100から読み出す。電話帳表示部1700は、読み出した保存用データを用いて、より小さな画像であるアイコン2001(図1参照)を生成する。
【0135】
電話帳表示部1700は、読み出した電話帳データ3210、及び、生成したアイコン2001をディスプレイ2000に表示する(ステップS310、図4の画面2201を参照)。
【0136】
ここで、ユーザは、カーソルの移動を指示する操作、又は、画像の拡大を指示する操作等を行う。
【0137】
ユーザの指示を検出したインタフェース部1100は(ステップS320)、電話帳表示部1700に検出した指示を通知する。
【0138】
指示が画像の拡大を行う指示である場合(ステップS320:画像の拡大)、電話帳表示部1700は、電話帳データ3210から読み出した識別子に対応付けられている保存用撮影データを、名刺画像記憶部3100から読み出し、ディスプレイ2000に表示し(ステップS330)、ユーザの指示を待つ。
【0139】
指示が終了の指示である場合(ステップS320:終了)、電話帳表示部1700は、処理を終了する。
【0140】
また、指示が他の処理の指示である場合(ステップS320:他の処理)、指示に従い他の処理を行い(ステップS340)、ユーザの指示を待つ。
【0141】
<補足>
以上、本発明の実施形態について説明したが、本発明は上記形態に限らず、以下のようにしてもよい。
(1)実施形態の文字認識部1500は、作業用撮影データから文字を認識する際に、文字認識率をもとに、名刺の正しい向きを求める。具体的には、まず、作業用撮影データから文字を認識する。その文字認識率が所定値より低い場合は、更に、前記撮像データを90度回転又は180度回転してそれぞれ文字を認識する。最も文字認識率が高いときの撮像データを、前記被写体の正しい向きとみなす。
(2)実施形態では、1枚の名刺を撮影する毎に電話帳に登録することとしているが、作業用撮影データを複数枚記憶した後に、電話帳に登録することとしてもよい。
(3)実施形態では、作業用撮影データから保存用撮影データを生成した後に、縮小画像生成部1600が作業用撮影データを削除することとしている。しかし、保存用撮影データを生成しない場合には、文字認識部1500が文字を認識後に作業用撮影データを削除することとしてもよい。
(4)携帯電話機1000は、図5等の各構成要素の全部又は一部を、1チップ又は複数チップの集積回路で実現してもよい。
(5)携帯電話機1000は、図5等の各構成要素の全部又は一部を、コンピュータのプログラムで実現してもよいし、その他どのような形態で実施してもよい。
【0142】
コンピュータプログラムの場合、メモリカード、CD−ROMなどいかなる記録媒体に書き込まれたものをコンピュータに読み込ませて実行させる形にしてもよいし、ネットワークを経由してプログラムをダウンロードして実行させる形にしてもよい。
【0143】
上に述べた実施例には、以下に述べるような付記も開示されている。
(付記1)
撮像対象を撮影し、撮影データを取得する画像撮像装置と、出力装置と連携可能な画像管理装置であって、
前記画像撮像装置で撮影された文字を含む撮像対象を、撮影データを取得する撮像手段と、
前記撮影データから文字を認識する文字読取手段と、
前記撮影データに含まれる文字の大きさと前記文字読取手段で読取可能な文字の大きさに応じて、視認可能な保存する撮影データの画素数を決定する決定手段と、
該生成した視認可能な画像データを記憶可能な保存用データ記憶手段と、
前記撮影データから視認可能な保存用データとそれに対応する識別子を生成し、該生成した保存用データと識別子を前記保存用データ記憶手段に記憶させる保存用データ生成手段と、
該保存用データを前記出力装置に出力する出力手段と、
を備える画像管理装置。
(付記2)
撮像対象を撮影し、撮影データを取得する画像撮像手段と、
文字を含む撮像対象を撮影し、撮影データを取得する撮像手段と、
前記撮影データから文字を認識する文字読取手段と、
前記撮影データに含まれる文字の大きさと前記文字読取手段で読取可能な文字の大きさに応じて、視認可能な保存する前記画像データの画素数を決定する決定手段と、
該生成した視認可能な画像データを記憶可能な保存用データ記憶手段と、
前記撮影データから視認可能な保存用データそれに対応する識別子を生成し、該生成した保存用データと識別子を前記保存用データ記憶手段に記憶させる保存用データ生成手段と、
前記保存用データ記憶手段に記憶されている前記保存用データの中から表示したい保存用データの識別子を指定する指定手段と、
該指定された識別子の保存用データを画面に表示する表示手段と、
を備える画像管理装置。
【符号の説明】
【0144】
10 ソフトキー対応キー
20 機能キー
30 文字入力キー
1000 携帯電話機
1100 インタフェース部
1200 名刺登録制御部
1300 撮像部
1400 撮影モード設定部
1410 変換テーブル
1500 文字認識部
1600 縮小画像生成部
1700 電話帳表示部
2000 ディスプレイ
2001 アイコン
2101 ガイド枠
2204 カーソル
3000 名刺登録作業用記憶部
3001 3101 名刺画像
3100 名刺画像記憶部
3200 電話帳記憶部
3210 電話帳データ

【特許請求の範囲】
【請求項1】
被写体の文字の大きさに応じた画素数を決定する決定手段と、
前記被写体を撮影し、前記決定された画素数の撮影データを出力する撮像手段と、
前記撮像手段で出力された撮影データを記憶する撮影データ記憶手段と、
前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識する文字読取手段と、
前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成する保存用データ生成手段と、
前記保存用データを記憶する保存用データ記憶手段と
を備える画像管理装置。
【請求項2】
前記決定手段は、前記被写体の文字を前記文字読取手段が認識することが可能な前記撮影データの画素数を決定する
請求項1に記載の画像管理装置。
【請求項3】
前記文字読取手段は、前記撮影データから文字を認識する際に、文字認識率が所定値より低い場合は、更に、前記撮像データを90度回転又は180度回転してそれぞれ文字認識し、最も文字認識率が高いときの撮像データを、前記被写体の正しい向きとみなして、前記撮像データと置換する
請求項1ないし請求項3のいずれかに記載の画像管理装置。
【請求項4】
前記文字読取手段は、前記撮影データ記憶手段に記憶されている撮影データから文字を認識した後であって、前記保存用データ記憶手段に前記保存用データが記憶された後に、当該撮影データを削除する
請求項1ないし請求項3のいずれかに記載の画像管理装置。
【請求項5】
被写体を撮影し、保存用データを記憶する画像管理装置に、データを管理させる画像管理方法であって、
前記被写体の文字の大きさに応じた画素数を決定させ、
前記被写体を撮影し、前記決定された画素数の撮影データを出力させ、
前記出力された撮影データを撮影データ記憶手段に記憶させ、
前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識させ、
前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成させ、
前記保存用データを保存用データ記憶手段に記憶させ、
前記保存用データ記憶手段に前記保存用データが記憶された後に、前記撮影データを削除させる
画像管理方法。
【請求項6】
被写体を撮影し、保存用データを記憶する画像管理装置に、データを管理させるコンピュータプログラムであって、
被写体の文字の大きさに応じた画素数を決定する決定処理を実行させ、
前記被写体を撮影し、前記決定された画素数の撮影データを出力する撮像処理を実行させ、
前記撮像処理で出力された撮影データを撮影データ記憶手段に記憶させる処理を実行させ、
前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識する文字読取処理を実行させ、
前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成する保存用データ生成処理を実行させ、
前記保存用データを保存用データ記憶手段に記憶させる処理を実行させ、
前記保存用データ記憶手段に前記保存用データが記憶された後に、前記撮影データを削除させる処理を実行させる
コンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−70601(P2011−70601A)
【公開日】平成23年4月7日(2011.4.7)
【国際特許分類】
【出願番号】特願2009−223458(P2009−223458)
【出願日】平成21年9月28日(2009.9.28)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】