説明

撮像装置及びその制御方法

【課題】撮像した画像に関する個別具体的な情報をパターン認識を利用し自動的に画像に関連付けして、容易に画像を管理できるようにする。
【解決手段】被写体を撮影して画像を取得する撮像手段と、使用者による撮影指示を受け付ける受け付け手段と、前記撮影指示を受け付ける前に前記撮像手段により取得された画像中の領域からパターン認識を行うパターン認識手段と、前記パターン認識手段の認識結果を記憶する記憶手段と、前記撮影指示を受け付けた後に前記撮像手段により取得した画像に、前記パターン認識手段がパターン認識に用いた前記領域が含まれていない場合に、前記記憶手段に記憶されている前記認識結果を、前記画像に関連付ける関連付け手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルカメラ等の撮像装置に関し、特に撮像装置で撮影された画像データを保存及び管理する技術に関する。
【背景技術】
【0002】
JEITA(電子情報技術産業協会)では、デジタルカメラの画像フォーマットとして、DCF(Design rule for Camera File system)を制定している。DCFは、デジタルカメラで撮影した画像データをコンパクトフラッシュ(登録商標)メモリ等のリムーバブルメモリに記録する際のディレクトリ構造、ファイルフォーマットを規定したものである。
【0003】
DCFでは、ファイル構造はExif(Exchange imagefile format)98で定義されている。また、画像データはJPEG(Joint Photographic Expert Group)方式で圧縮され,サムネイルは非圧縮で大きさは160画素×120画素とされるようになっている。更に画像データは、Exifタグにより、撮影時のカメラ情報を記録可能なようになっている。
【0004】
ここで、カメラ情報とは、日付、カメラのメーカ名、機種名、ソフトウェアのバージョン、シャッタースピード、絞り、自動露出プログラム、写真内容の記述等である。これらカメラ情報のうち、写真内容の記述以外は、デジタルカメラの製造時、或いは画像撮影時に自動的に取り込むことが可能である。
【0005】
上記カメラ情報の中で、写真内容の記述としては、例えば「2007年度○△小学校 入学式」や、「xx水族館 イルカショー」というような、何処で何を、といったような被写体や撮影場所等に関する個別具体的な情報が記述されることが一般的である。
【0006】
このような写真内容に関する個別具体的な情報を撮影時に自動的に取り込むようにすることは、操作性において非常に有効である。このような自動取り込みを実現する手段としては、例えば自動GPS(Global Positioning System)情報を利用することや画像認識を利用すること等が考えられる。
【0007】
しかしながら、GPSや画像認識では、場所に関しては東京の新宿等の一般的な地理情報を、顔に関しては一致/不一致を認識できても、観光地、遊園地、美術館、テーマパークの名称等の写真(画像データ)管理に必要な個別具体的な情報を得ることはできない。そのため、従来は、撮像した画像データに関する個別具体的な情報、即ち説明データを自動的に画像データに付して管理することができなかった。
【0008】
このような問題を解決するため、例えば特許文献1では、被写体を説明する説明データをインデックスと共に格納したファイルをメモリカードに予め記憶しておき、撮影する前或いは撮影した後にインデックスを入力するようにした技術が開示されている。詳細には、撮影した画像データをファイル形式でメモリカードに格納すると共に、説明データに係るファイルと画像データに係るファイルとを、入力に係るインデックスを用いて関連付けるようにしている。
【0009】
また、特許文献2では、動画像に現れる認識対象物体から、明るさの異なる複数画像それぞれに現れる認識対象物体から文字領域を抽出し、文字領域と辞書画像とのマッチング処理により文字領域に記されている文字を認識する技術が開示されている。詳細には、明るさの異なる複数画像それぞれのパターン認識結果のうちマッチング処理におけるマッチング度が高いものをパターン認識結果として出力するようにしている。この技術によれば、日中に通常の画像では周辺物の影の影響により暗すぎて認識に不適切な文字を、明るさの異なる画像にてパターン認識に適切な状態にすることができる。また、夜間に通常の画像では周辺からの光量照射により明るすぎて認識に不適切な文字を、明るさの異なる画像にて適切な状態にすることができる。これにより、パターン認識性能を向上することができる。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2003−198909号公報
【特許文献2】特開2003−242440号公報
【特許文献3】特開昭52−156624号公報
【特許文献4】特開平4−346333号公報
【特許文献5】特開平8−036597号公報
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、特許文献1の技術では、被写体を説明する説明データをメモリカードに予め記憶しなければならず、撮影場所等の情報が特定されていない状況下では入力ができない。そのため、情報が特定できない場合には、カメラ或いはPC等から情報を入力する必要があり、このような作業はカメラ等の入力方法に制約があるようなデバイスの場合には、文字入力が非常に煩わしいという課題があった。
【0012】
また、特許文献2は、動画像における撮影環境に起因する明るさの変化に文字認識を最適化するためのものであり、撮影場所等の情報を自動的に画像データに関連付して管理するものではない。
【0013】
本発明は上記の課題を解決するものであり、撮像した画像に関する個別具体的な情報をパターン認識を利用し自動的に画像に関連付けして、容易に画像を管理できるようにすることを目的とする。
【課題を解決するための手段】
【0014】
本発明は、被写体を撮影して画像を取得する撮像手段と、使用者による撮影指示を受け付ける受け付け手段と、前記撮影指示を受け付ける前に前記撮像手段により取得された画像中の領域からパターン認識を行うパターン認識手段と、前記パターン認識手段の認識結果を記憶する記憶手段と、前記撮影指示を受け付けた後に前記撮像手段により取得した画像に、前記パターン認識手段がパターン認識に用いた前記領域が含まれていない場合に、前記記憶手段に記憶されている前記認識結果を、前記画像に関連付ける関連付け手段とを有することを特徴とする。
【発明の効果】
【0015】
本発明によれば、撮影した画像に関する個別具体的な情報をパソコンやカメラで文字情報として付加する等の煩わしい作業を軽減することができ、操作性の向上を実現すると共に画像の管理を容易にすることができる。
【図面の簡単な説明】
【0016】
【図1】本発明の実施の形態に係るデジタルカメラの構成を示すブロック図である。
【図2−1】本発明の第1の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。
【図2−2】本発明の第1の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。
【図3−1】本発明の第2の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。
【図3−2】本発明の第2の実施の形態に係るデジタルカメラの動作を説明するフローチャートである。
【図4−1】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図4−2】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図4−3】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図4−4】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図4−5】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図4−6】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図4−7】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図4−8】本発明の実施の形態に係るデジタルカメラにおいて撮影される画像を示した図である。
【図5】本発明の実施の形態に係るデジタルカメラが備える辞書データの一例を示した図である。
【発明を実施するための形態】
【0017】
以下、本発明の好適な実施の形態について図面を参照して詳細に説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態に係るデジタルカメラ(撮像装置)の構成を示すブロック図である。
【0018】
図1において100はデジタルカメラある。11は撮影レンズ、12は絞り機能を備えるシャッター、14は光学像を電気信号に変換する撮像素子、16は撮像素子14のアナログ信号出力をディジタル信号に変換するA/D変換器である。また10は、撮影レンズ11を含む撮像部を覆うことにより、該撮像部の汚れや破損を防止するバリアである保護部である。
【0019】
18はタイミング発生回路であり、撮像素子14、A/D変換器16、D/A変換器26にクロック信号や制御信号を供給する。タイミング発生回路18は、メモリ制御回路22やシステム制御回路50により制御される。
【0020】
20は画像処理回路であり、A/D変換器16からのデータ或いはメモリ制御回路22からのデータに対して所定の画素補間処理や色変換処理を行う。画像処理回路20はまた、撮像した画像データを用いて所定の演算処理を行うことで、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(フラッシュプリ発光)処理の一部を行っている。そしてシステム制御回路50が画像処理回路20による所定の演算処理の演算結果に基づき、露光制御手段40、測距制御手段42に対して制御を行うことで、上記TTL方式のAF処理、AE処理、EF処理が行われる。画像処理回路20はまた、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
【0021】
58は顔検出部であり、画像処理回路20からのデータ或いはメモリ制御回路22からのデータに対して所定の顔検出処理を行い、画像に顔があるかどうかを検出するものである。このような技術については既に多くの手法が顔認識技術として実現されている。
例えば、特許文献3では、撮影画像から人の顔を抽出する手法として、原画像から肌色データを抽出し、肌色範囲と判断された測光点のクラスタを顔とする方法が提案されている。
また、特許文献4では、測光データを色相と彩度に変換し、この2次元ヒストグラムを作成、解析することで顔領域を判断する方法が提案されている。
また、特許文献5では、人の顔の形状に相当する顔候補領域を抽出し、その領域内の特徴量から顔領域を決定するという方法が提案されている。なお、本発明では、顔検出方法についてはどのような方法を使用しても構わない。
【0022】
59はパターン検出部であり、予め記憶された辞書データ74を用いて、画像にABC、123、一二三、ひらがな、カタカナ、漢字等の文字や登録された会社ロゴ、標識、顔、絵文字、熟語等があるかどうかを検出する。このような検出技術については既に多くの手法がパターン認識技術として実現されている。本発明では、文字検出方法についてはどのような方法を使用しても良くここでは言及しない。
【0023】
57はコード変換部であり、パターン検出部59で検出したパターンをコードデータ(以下、コード情報)に変換する。即ち、OCR(Optical Character Reader)処理を行う。
【0024】
72は被写体情報生成部であり、ライブビュー時の取り込み画像から被写体情報を生成する。71は被写体比較部であり、被写体情報生成部72が生成した情報を所定の対象と比較する。なお、被写体情報生成部72及び被写体比較部71の詳細については後述する。
【0025】
73はコード比較部であり、コード変換部57によって変換された前コード情報と新コード情報とを辞書データ74を参照しながら比較する。なお、詳細は後述するがライブビュー時においては、画像取込の際にパターン検出部59によりパターン検出が随時行われており、順次取り込まれる画像に応じてコード情報が更新されるようになっている。
【0026】
22はメモリ制御回路であり、A/D変換器16、タイミング発生回路18、画像処理回路20、画像表示メモリ24、D/A変換器26、メモリ30、圧縮・伸長回路32を制御する。なお、A/D変換器16からのデータは、画像処理回路20及びメモリ制御回路22を介して、或いは直接メモリ制御回路22を介して、画像表示メモリ24或いはメモリ30に書き込まれる。
【0027】
24は画像表示メモリ、26はD/A変換器、28はTFT・LCD等からなる画像表示部である。画像表示メモリ24に書き込まれた表示用の画像データはD/A変換器26を介して画像表示部28により表示される。画像表示部28を用いて撮像した画像データを逐次表示すれば、電子ファインダー機能を実現することが可能である。画像表示部28はまた、システム制御回路50の指示により任意に表示をON/OFFすることが可能であり、表示をOFFにした場合にはデジタルカメラ100の電力消費を大幅に低減することができる。
【0028】
30は撮影した静止画像や動画像を格納するためのメモリであり、所定枚数の静止画像や所定時間の動画像を格納するのに十分な記憶容量を備えている。これにより、デジタルカメラ100は、複数枚の静止画像を連続して撮影する連射撮影やパノラマ撮影の場合にも、高速かつ大量の画像書き込みをメモリ30に対して行うことが可能となる。メモリ30はまた、システム制御回路50の作業領域としても使用することが可能である。
【0029】
32は圧縮・伸長回路であり、適応離散コサイン変換(ADCT)等により画像データを圧縮及び伸長する。圧縮・伸長回路32はメモリ30に格納された画像を読み込んで圧縮処理或いは伸長処理を行い、処理を終えたデータをメモリ30に書き込む。
【0030】
40は露光制御手段であり、絞り機能を備えるシャッター12を制御し、またフラッシュ48と連携することによりフラッシュ調光機能も有するものである。42は測距制御手段であり、撮影レンズ11のフォーカシングを制御する。44はズーム制御手段であり、撮影レンズ11のズーミングを制御する。46はバリア制御手段であり、バリアである保護部10の動作を制御する。48はフラッシュであり、AF補助光の投光機能、フラッシュ調光機能も有する。
【0031】
上述したように露光制御手段40、測距制御手段42はTTL方式を用いて制御されており、撮像した画像データを画像処理回路20が演算した演算結果に基づき、システム制御回路50が露光制御手段40、測距制御手段42に対して制御を行う。
【0032】
50はデジタルカメラ100全体を制御するシステム制御回路、52はシステム制御回路50の動作用の定数、変数、プログラム等を記憶するメモリである。
【0033】
54は表示部であり、システム制御回路50でのプログラムの実行に応じて、文字、画像、音声等を用いて動作状態やメッセージ等を表示する。表示部54は、デジタルカメラ100の操作部近辺の視認し易い位置に単数或いは複数個所設置され、例えばLCDやLED等の液晶表示装置、スピーカーや発音素子等の組み合わせにより構成されている。表示部54はまた、その一部の機能が光学ファインダー104内に設置されている。
【0034】
表示部54の表示内容のうち、LCD等に表示するものとしては、シングルショット/連写撮影表示、セルフタイマー表示、圧縮率表示、記録画素数表示、記録枚数表示、残撮影可能枚数表示、シャッタースピード表示等がある。また、絞り値表示、露出補正表示、フラッシュ表示、赤目緩和表示、マクロ撮影表示、ブザー設定表示、時計用電池残量表示、電池残量表示、エラー表示等がある。更には、複数桁の数字による情報表示、記録媒体200及び210の着脱状態表示、通信I/F動作表示、日付・時刻表示等がある。
【0035】
また、表示部54の表示内容のうち、光学ファインダー104内に表示するものとしては、合焦表示、手振れ警告表示、フラッシュ充電表示、シャッタースピード表示、絞り値表示、露出補正表示等がある。
【0036】
56は電気的に消去・記録可能な不揮発性メモリであり、例えばEEPROM等が用いられる。
【0037】
60、62、64、66、68及び70は、システム制御回路50の各種の動作指示を入力するための操作手段であり、スイッチ、ダイアル、タッチパネル、視線検知によるポインティング、音声認識装置等の単数或いは複数の組み合わせで構成される。以下、これらの操作手段の具体的な説明を行う。
【0038】
60はモードダイアルスイッチであり、電源オフ、自動撮影モード、撮影モード、パノラマ撮影モード、再生モード、マルチ画面再生・消去モード、PC接続モード等の各機能モードを切り替え設定することができる。
【0039】
62はシャッタースイッチSW1であり、不図示のシャッタースイッチの操作途中でONとなり、AF処理、AE処理、AWB処理、EF処理等の動作開始を指示する。64はシャッタースイッチSW2であり、不図示のシャッタースイッチの操作完了でONとなり、撮影記録の一連の処理の動作開始を指示する。具体的には、まず撮像素子14から読み出した信号を、A/D変換器16、メモリ制御回路22を介してメモリ30に画像データを書き込む露光処理を指示する。次に画像処理回路20やメモリ制御回路22での演算を用いた現像処理を指示する。最後に、メモリ30から画像データを読み出し、圧縮・伸長回路32で圧縮を行い、記録媒体200或いは210に画像データを書き込む記録処理を指示する。
【0040】
66は画像表示ON/OFFスイッチであり、画像表示部28のON/OFFを設定することができる。この機能により、光学ファインダー104を用いて撮影を行う際に、TFT・LCD等からなる画像表示部28への電流供給を遮断することにより、省電力を図ることが可能となる。
【0041】
68はクイックレビューON/OFFスイッチであり、撮影直後に撮影した画像データを自動再生するクイックレビュー機能を設定する。なお、本実施の形態では特に、画像表示部28をOFFとした場合におけるクイックレビュー機能の設定をする機能を備えるものとする。
【0042】
70は各種ボタンやタッチパネル等からなる操作部であり、メニューボタン、セットボタン、マクロボタン、マルチ画面再生改ページボタン、フラッシュ設定ボタン、単写/連写/セルフタイマー切り替えボタン等を含む。また、メニュー移動+(プラス)ボタン、メニュー移動−(マイナス)ボタン、再生画像移動+(プラス)ボタン、再生画像−(マイナス)ボタン、撮影画質選択ボタン、露出補正ボタン、日付/時間設定ボタン等を含む。
【0043】
80は電源制御手段であり、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成されている。電源制御手段80は電池の装着の有無、電池の種類、電池残量の検出を行い、検出結果及びシステム制御回路50の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体を含む各部へ供給する。
【0044】
82及び84はコネクタであり、86は電源手段である。電源手段86はアルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる。
【0045】
90及び94はメモリカードやハードディスク等の記録媒体とのインタフェース、92及び96はメモリカードやハードディスク等の記録媒体と接続を行うコネクタである。98は記録媒体着脱検知手段であり、コネクタ92又は96に記録媒体200又は210が装着されているか否かを検知する。
【0046】
なお、本実施の形態では、記録媒体を取り付けるインタフェース及びコネクタを2系統持つものとして説明しているが、もちろん記録媒体を取り付けるインタフェース及びコネクタを単数或いは複数、いずれの系統数を備える構成としても構わない。また、異なる規格のインタフェース及びコネクタを組み合わせて備えるような構成としても構わない。
インタフェース及びコネクタとしては、例えばPCMCIAカードやCF(コンパクトフラッシュ)カード等の規格に準拠したものを用いることができる。インタフェース90及び94、そしてコネクタ92及び96をPCMCIAカードやCF(コンパクトフラッシュ)カード等の規格に準拠したものを用いて構成した場合には、LANカードやモデムカード等の各種通信カードを接続することができる。そして、接続した場合には、他のコンピュータやプリンタ等の周辺機器との間で画像データや画像データに付属した管理情報を転送し合うことができる。なお、LANカードやモデムカード以外にも、例えば、USBカード、IEEE1394カード、P1284カード、SCSIカード、PHS等の通信カードを接続することも可能である。
【0047】
104は光学ファインダーであり、画像表示部28による電子ファインダー機能を使用すること無しに、光学ファインダー104のみを用いて撮影を行うことを可能とする。また、光学ファインダー104内には、表示部54の一部の機能、例えば、合焦表示、手振れ警告表示、フラッシュ充電表示、シャッタースピード表示、絞り値表示、露出補正表示等が設置されている。
【0048】
110は通信手段であり、RS232CやUSB、IEEE1394、P1284、SCSI、モデム、LAN、無線通信等の各種通信機能を有する。112はコネクタ或いはアンテナであり、通信手段110によりデジタルカメラ100を他の機器と有線又は無線で接続する。
【0049】
200はメモリカードやハードディスク等の記録媒体である。記録媒体200は、半導体メモリや磁気ディスク等から構成される記録部202、デジタルカメラ100とのインタフェース204、及びデジタルカメラ100と接続を行うコネクタ206を備えている。210はメモリカードやハードディスク等の記録媒体である。記録媒体210は、半導体メモリや磁気ディスク等から構成される記録部212、デジタルカメラ100とのインタフェース214、及びデジタルカメラ100と接続を行うコネクタ216を備えている。
【0050】
次に、以上のような構成を備えたデジタルカメラ100の本発明の主眼となる動作を図2−1及び図2−2を参照して説明する。図2−1は、デジタルカメラ100がライブビュー動作中に実行する処理のフローチャートであり、図2−2はデジタルカメラ100が撮影記録処理を指示された場合に実行する処理のフローチャートである。
【0051】
まず図2−1のステップS201において、デジタルカメラ100は、ライブビュー撮影を開始し、画像取込を行う。詳細には、撮影レンズ11から入力された光学像を撮像素子14により電気信号に変換し、A/D変換器16によりアナログ信号出力をディジタル信号に変換し、画像処理回路20により撮像した画像データを用いて所定の演算処理し、撮影前の画像取込を行う。
【0052】
次にステップS202において、デジタルカメラ100は、パターン検出部59によりパターン領域が存在するか否かを判定する。判定の結果、パターン領域がなかったら、画像取込(S201)に戻り、パターン領域が存在すればステップS203へと進む。
【0053】
ステップS203において、デジタルカメラ100は、パターン領域に対して、コード変換部57によりOCR処理を行い、コード情報を生成する。なお、ステップS201〜S203の処理は、本発明でいうパターン認識手段による一処理例に対応する。
【0054】
次にステップS204において、デジタルカメラ100は、ステップS203でのOCRの結(コード情報、本発明でいう認識結果)と前コード情報とをコード比較部73にて比較し、有効性の判定を行う。判定結果が有効性無しであれば前コード情報を更新せず、有効性有りであればステップS205においてコード情報を最新のコード情報に更新し、画像取込(S201)に戻る。なお、ステップS204処理は、本発明でいうパターン比較手段の一処理例に対応し、ステップS205の処理は、本発明でいう更新手段及び第1の記憶手段の一処理例に対応する。
【0055】
以上のように、デジタルカメラ100においては、ライブビュー動作中には、ライブビュー表示のために取り込んだ画像において所定の間隔でパターン領域を検出し、それをコード情報として記憶及び更新するようにしている。
【0056】
次に図2−2を参照して、デジタルカメラ100が撮影記録処理を指示された場合に実行する処理を説明する。なお、図2−2の処理は図2−1の処理と並行的に行われるものである。
【0057】
まずステップS206において、デジタルカメラ100は、シャッタースイッチSW2(64)が押されたか否かの監視を行う。押された場合はステップS207において、保存されているコード情報を読み出し、ステップS208において撮影画像を生成する。
【0058】
そして、ステップS209において、デジタルカメラ100は、ステップS207で取得したコード情報を撮影画像に付加(関連付け)し、インタフェース90及び94を介してCFやSDカード等の記録媒体に書き込みを行う。なお、ステップS209の処理は、本発明でいう関連付手段に一処理例に対応する。
【0059】
ここで図4−1〜図4−8を用いて、図2−1及び図2−2を用いて説明した処理の具体的な動作を説明する。まず図4−1等を参照して、従来の問題点を説明する。
【0060】
図4−1に示す画像401の撮影を行えば、写真を見ただけで「二〇〇七年度入学式」のときに撮影したものであることがわかる。しかしながら、図4−2に示す画像402の撮影を行えば、写真を見ただけで「二〇〇七年度入学式」のときに撮影したものであることが辛うじてわかるかもしれないが、情報としては不十分である。さらに、図4−3に示す画像403の撮影を行えば、写真を見ただけでは「二〇〇七年度入学式」であることはわからない。
そこで、図4−3に示すような画像403の撮影を行った場合でも、例えば図4−8に示すようにコード情報(図中408a)を印刷時や画像表示時に見えるようにすれば、該写真を見ただけで「二〇〇七年度入学式」であることがわかるようになる。
しかしながら、従来の撮像装置では、文字列検索を行う場合や画像408のような印刷画像、表示画像を得るために、パソコンやカメラで文字情報を付加する又は文字情報を予め登録して画像と文字情報との関連付けを行う等の非常に煩わしい作業が必要であった。
本発明に係るデジタルカメラ100では、このような煩わしい作業を解消する。以下、図4−1〜図4−3を参照して、デジタルカメラ100の動作を具体的に説明する。
【0061】
まず図4−1に示す画像をライブビュー表示のために画像取込(ステップS201)すると、ここで示す画像401の場合はパターン検出部59にてパターン領域が存在(ステップS202)すると判定される。ここでは、401aに示す領域をパターン領域として検出したものとする。
【0062】
そして、コード変換部57にてOCR処理(ステップS203)が行われ、OCR処理の結果を用いて、コード比較部73にて前コード情報と比較(ステップS204)する。ここでは、OCR処理の結果であるコード情報が新規であるため、コード情報を更新(ステップS205)し、画像取込(ステップS201)に戻る。
【0063】
次にユーザーは、構図、フォーカス位置、露出等を表示部54を見ながら変更し、図4−2に示す画像402を経て、図4−3に示すような画像403を最適な撮影ポイントとして探したとする。この場合、その途中過程にある図4−2に示す画像402は、ライブビュー表示のために画像取込(ステップS201)されており、画像402はパターン検出部59により402aに示すパターン領域が存在(ステップS202)すると判定されている。そして、コード変換部57にてOCR処理(ステップS203)が行われ、OCR処理の結果を用いて、コード比較部73にて前コード情報と比較(ステップS204)される。ここでの比較においては、今回のコード情報が前コード情報より少ない(有効性が低い)ので、コード情報は更新されない。従って、前コード情報は更新されず、前回の「二〇〇七年度入学式」が残ることになる。なお、コード情報の有効性の比較については、辞書データ74を参照しながら行われるが、例えば文字の明確さ等に基づき判断するようにする。
【0064】
次に図4−3に示す画像403も、ライブビュー表示のための画像取込(ステップS201)がなされている。そして画像403の場合には、パターン検出部59にてパターン領域が存在(S202)しないと判定されるので、前コード情報は更新されず、ここでも「二〇〇七年度入学式」が残ることになる。
【0065】
ここでシャッタースイッチ64が押される(ステップS206)と、ステップS205で保存された「二〇〇七年度入学式」情報が読み出される(ステップS207)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS208)される。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS209)。以上のように処理がなされることで、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
【0066】
以上のように、第1の実施の形態に係るデジタルカメラ100では、ライブビュー動作中にパターン領域を検出し、撮影画像に関する個別具体的なコード情報として記憶しておき、撮影された撮影画像に関連付けて管理するようにした。このようなデジタルカメラ100では、撮影画像に関する個別具体的なコード情報をパソコンやカメラで文字情報として付加する等の煩わしい作業を軽減することができるため、操作性の向上を実現することができる。また、特にカメラ等の入力方法に一部制約があるデバイスにおいては、非常に煩わしい文字入力の頻度を少なくできるため、操作性向上の効果が高い。
また、撮影画像において個別具体的なコード情報を認識できなかった場合にも、記憶したコード情報を該撮影画像に関連付けて管理できるため、文字情報の付加という作業を軽減するだけではなく、関連する一連の撮影画像の良好な管理を助援することもできる。
【0067】
(第2の実施の形態)
以下、本発明の第2の実施の形態について説明する。本実施の形態では、パターン領域の検出後のコード情報の更新の判断に被写体情報を考慮する。なお、本実施の形態に係るデジタルカメラは、第1の実施の形態と同様であるため引用する符号は同一のものとし、説明は省略する。
【0068】
第2の実施の形態に係るデジタルカメラ100の本発明の主眼となる動作を図3−1及び図3−2を参照して説明する。図3−1は、デジタルカメラ100がライブビュー動作中に実行する処理のフローチャートであり、図3−2は、デジタルカメラ100が撮影記録処理を指示された場合に実行する処理のフローチャートである。
【0069】
まず図3−1のステップS301において、デジタルカメラ100は、ライブビュー撮影を開始し、画像取込を行う。詳細には、撮影レンズ11から入力された光学像を撮像素子14により電気信号に変換し、A/D変換器16によりアナログ信号出力をディジタル信号に変換し、画像処理回路20により撮像した画像データを用いて所定の演算処理し、画像取込を行う。
【0070】
次にステップS302において、デジタルカメラ100は被写体情報生成部72により、被写体情報を生成する。被写体情報の詳細については後述する。なお、ステップS302の処理は、本発明でいう被写体情報生成手段の一処理例に対応する。
【0071】
次にステップS303において、デジタルカメラ100は被写体比較部71により前被写体情報との関連性が一致しているか否かを判定する。一致していなかったらステップS313へと進み、一致していればステップS304へと進む。なお、ステップS303の処理は、本発明でいう被写体情報比較手段の一処理例に対応する。
【0072】
ステップS304において、デジタルカメラ100は、パターン検出部59によりパターン領域が存在するか否かを判定し、存在していなければ、画像取込(S301)に戻る。存在していれば、ステップS305においてコード変換部57によりOCR処理を行う。なお、ステップS304及びS305の処理は、本発明でいうパターン認識手段の一処理例に対応する。
【0073】
次にステップS306において、デジタルカメラ100はコード比較部73によりOCRの結果と前コード情報とを比較し、有効性の判定を行う。判定の結果、有効性が低ければ前コード情報を更新せず、画像取込(S301)に戻る。一方、有効性が高ければ、ステップS307において、ステップS302にて生成した被写体情報を保存し、ステップS308において、コード情報を更新し、画像取込(S301)に戻る。なお、ステップS306の処理は、本発明でいうパターン比較手段の一処理例に対応し、ステップS307の処理は、第2の記憶手段の一処理例に対応し、ステップS308の処理は、本発明でいう第1の記憶手段の一処理例に対応する。
【0074】
一方、ステップS303において、被写体比較部71により前被写体情報との関連性が一致していないと判定された場合のステップS313においては、まずデジタルカメラ100がパターン検出部59によりパターン領域が存在するか否か判定する。存在しない場合はステップS317にてコード情報の初期化を行い、画像取込(S301)に戻り、パターン領域が存在する場合はステップS314に進む。
【0075】
ステップS314において、デジタルカメラ100は、ステップS313でのパターン領域に対して、コード変換部57によりOCR処理する。そして、ステップS315においてステップS302で生成した被写体情報を保存し、ステップS316においてコード情報を更新して、画像取込(S301)に戻る。
【0076】
次に図3−2を参照して、デジタルカメラ100が撮影記録処理を指示された場合に実行する処理を説明する。なお、図3−2の処理は図3−1の処理と並行的に行われるものである。
【0077】
まずステップS309において、デジタルカメラ100は、シャッタースイッチSW2(64)が押されたか否かの監視を行う。押された場合はステップS310において、保存されているコード情報を読み出し、ステップS311において、撮影画像を生成する。
【0078】
そして、ステップS312において、デジタルカメラ100は、ステップS310で取得したコード情報を撮影画像に付加し、インタフェース90及び94を介してCFやSDカード等の記録媒体に書き込みを行う。
【0079】
次に図4−1〜図4−8を用いて、図3−1及び図3−2を用いて説明した処理の具体的な動作を説明する。
【0080】
まず図4−1に示す画像をライブビュー表示のために画像取込(ステップS301)をして、被写体情報生成部72により図4−1(b)に示すような被写体情報を生成する(S302)。次に被写体比較部71により前被写体情報と一致するか判定を行うが(S303)、ここでは新規の被写体情報であるため判定は一致しないとされ、パターン検出部59によりパターン領域の存在の判定が行われる(S304)。ここで、画像401には401aに示すパターン領域が存在するので、コード変換部57によりOCR処理が行われる(S305)。そしてOCR処理の結果を用いて、前コード情報と比較を行うが(S306)、新規のため判定結果は有効性が高いとされ、ステップS302で生成した被写体情報を保存し(S307)、コード情報を保存し(S308)、画像取込(S301)に戻る。
【0081】
なお、ここで被写体情報とは、図4−1(b)に示すような情報であり、本例においては、輪郭画像415、文字情報、焦点距離情報、レンズ距離情報、人数情報等を含むものである。このような被写体情報は、画像の輪郭部分を抽出したり、コード情報を抽出したり、顔認識技術による人数情報を特定したり、被写体との距離情報やレンズ焦点距離情報を取得したりして得る。或いは、図示しないが画像を何分割かに分けるゾーン分割、オブジェクト認識等の技術により被写体を特定する等、複数の手法を用いて被写体情報としたりすることも一般的に行われている。
更なる方法としては、パターン認識が行われた画像から連続的に画像が拡大・縮小・移動が行われているか監視することにより、被写体情報の判定に利用することも可能である。しかしながら、連続的に監視する方法では、オートパワーオフにより撮影が中断された、空や地面のみの画像となってしまった、レンズが交換された、レンズキャップがされてしまった等の課題がある。そのため、前記方法や時間情報との併用により精度を高めることも可能であるが、ここではその方法については言及しない。
【0082】
次にユーザーは、構図、フォーカス位置、露出等を表示部54を見ながら変更し、図4−2に示す画像402を経て、図4−3に示すような画像403を最適な撮影ポイントとして探したとする。この場合、その途中過程にある図4−2に示す画像402は、ライブビュー表示のために画像取込(S301)されており、画像402から被写体情報生成部72により被写体情報が生成される(S302)。そして被写体比較部71により前被写体情報と一致するか判定をされ(S303)、ここでは画像の一部が一致しているため判定結果は一致とされる。そしてパターン検出部59によりパターン領域の存在判定がされる(S304)。画像402においては402aに示すパターン領域が存在するので、コード変換部57にてOCR処理(S305)が行われる。そしてOCR処理の結果を用いて、前コード情報との比較(S306)をされるが、前コード情報の方がより有効性が高いので、コード情報は更新されずに、画像取込(S301)に戻る。
【0083】
次に図4−3に示す画像403においても、ライブビュー表示のための画像取込(ステップS301)がなされ、画像403から被写体情報生成部72により被写体情報が生成される(S302)。そして被写体比較部71により前被写体情報と一致するか判定をされ(S303)、ここでは画像の一部が一致しているため判定結果は一致とされ、パターン検出部59によりパターン領域の存在判定がされる(S304)。画像403においてはパターン領域が存在しないので、コード変換部57によるOCR処理は行われず、コード情報も更新されず、「二〇〇七年度入学式」のコード情報が残り、画像取込(S301)に戻る。
【0084】
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308で保存された「二〇〇七年度入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像を生成(ステップS311)する。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
【0085】
更に、図4−4に示す画像404を撮影した場合について説明する。
図4−4に示す画像を撮影する場合、画像404はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−4(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部が一致しているので、判定結果は一致となり、パターン検出部59によりパターン領域の存在判定がされる(S304)。画像404においてはパターン領域が存在しないため、コード変換部57によるOCR処理は行われず、コード情報も更新されないので、「二〇〇七年度入学式」のコード情報が残り、画像取込(S301)に戻る。
【0086】
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308で保存された「二〇〇七年度入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、図4−4に示す画像404を撮影する場合においても、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
【0087】
更に図4−5に示す画像405を撮影した場合について説明する。
図4−5に示す画像を撮影する場合、画像405はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−5(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部が一致しているので、判定結果は一致となり、パターン検出部59によりパターン領域の存在判定がされる(S304)。画像405においてはパターン領域が存在しないため、コード変換部57によるOCR処理は行われず、コード情報も更新されないので、「二〇〇七年度入学式」のコード情報が残り、画像取込(S301)に戻る。
【0088】
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308で保存された「二〇〇七年度入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像には「二〇〇七年度入学式」のコード情報が付加され、90及び94のインタフェースを介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、図4−5に示す画像405を撮影する場合においても、「二〇〇七年度入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
【0089】
更に図4−6に示す画像406を撮影した場合について説明する。
図4−6に示す画像を撮影する場合、画像406はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−6(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部も一致していないので、判定結果は不一致となり、パターン検出部59によりパターン領域の存在判定がされる(S313)。画像406においてはパターン領域(406a)が存在するため、コード変換部57によるOCR処理が行われ(S314)、コード情報を「○△小学校入学式」に更新し、画像取込(S301)に戻る。
【0090】
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS316で保存された「○△小学校入学式」情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像にはコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされることで、図4−6に示す画像406を撮影する場合においては、「○△小学校入学式」のコード情報と撮影画像が自動的に関連付けされ、コード情報を検索、画像表示、印刷といった文字合成等に利用できるようになる。
【0091】
更に図4−7に示す画像407を撮影した場合について説明する。
図4−7に示す画像を撮影する場合、画像407はライブビュー表示のために画像取込(S301)され、被写体情報生成部72により図4−7(b)に示すような被写体情報が生成される。そして被写体比較部71により前被写体情報と一致するか判定される(S303)。ここでは、画像の一部も一致していないので、判定結果は不一致となり、パターン検出部59によりパターン領域の存在判定がされる(S313)。画像407においてはパターン領域が存在しないため、コード変換部57によるOCR処理が行われず、コード情報を初期化(S317)し、画像取込(S301)に戻る。
【0092】
ここでシャッタースイッチ64が押される(ステップS309)と、ステップS308及びS316で保存された情報が読み出される(ステップS310)。そして、デジタルカメラ100に設定されている撮影パラメータに従い、撮影画像が生成(ステップS311)される。そして、撮影画像にはコード情報が付加され、インタフェース90及び94を介してCFやSD等の記録媒体に書き込まれることになる(ステップS312)。以上のように処理がなされ、図4−7に示す画像407を撮影する場合においては、コード情報がないことが撮影画像に自動的に関連付けされる。そして、コード情報を検索、画像表示、印刷といった文字合成等に誤って利用されないようにする。
【0093】
以上のように、第2の実施の形態のデジタルカメラ100では、ライブビュー動作中にパターン領域を検出し個別具体的なコード情報として記憶すると共に、被写体情報を特定しておき、被写体情報を考慮して、コード情報を更新するようにした。そして、コード情報を撮影された撮影画像に関連付けて管理するようにした。このようなデジタルカメラ100では、撮影画像に関する個別具体的なコード情報をパソコンやカメラで文字情報として付加する等の煩わしい作業を軽減することができるため、操作性の向上を実現することができる。また、特にカメラ等の入力方法に一部制約があるデバイスにおいては、非常に煩わしい文字入力の頻度を少なくできるため、操作性向上の効果が高い。また、コード情報を前回と今回の被写体情報を比較し比較結果に応じて管理することで、誤ったコード情報を撮影画像に関連付けしなくなり、更なる操作性の向上を実現することができる。
【0094】
ここで、図5(a)〜(d)は、図1で示した辞書データ74の一部の例であり、「Bitmap」から文字に変換するためのデータ等を示している。パターン検出部59、コード変換部57に対し、図5のような辞書データを含むことで、顔から人名、標識から標識名、会社ロゴから会社名を特定することが可能となる。
【0095】
以上で説明した実施の形態においては、パターン検出部59により、文字で構成されたパターン領域を検出するようにし、それをコード情報とする例を挙げたが、本発明はこの態様に限定されるものではない。例えば会社ロゴ、標識、顔等をパターン領域として検出し、それをコード情報としてもよく、更にそれらに対応する文字列に変換して印刷画像或いは表示画像に付加するようにしてもよい。
【0096】
なお、本発明を実現するために、上述した実施形態の機能を実現するソフトウェアのプログラムコード(コンピュータプログラム)を記録した記録媒体を用いても良い。この場合には記録媒体をシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによって本発明の目的が達成される。
【0097】
この場合、記録媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記録媒体は本発明を構成することになる。
【0098】
プログラムコードを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0099】
また、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(基本システム或いはオペレーティングシステム)等が実際の処理の一部又は全部を行う場合も含まれることは言うまでもない。
【0100】
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。この場合には、書き込まれたプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行ってもよい。
【符号の説明】
【0101】
14 撮像素子
50 システム制御回路
57 コード変換部
59 パターン検出部
71 被写体比較部
72 被写体情報生成部
73 コード比較部
74 辞書データ
100 デジタルカメラ

【特許請求の範囲】
【請求項1】
被写体を撮影して画像を取得する撮像手段と、
使用者による撮影指示を受け付ける受け付け手段と、
前記撮影指示を受け付ける前に前記撮像手段により取得された画像中の領域からパターン認識を行うパターン認識手段と、
前記パターン認識手段の認識結果を記憶する記憶手段と、
前記撮影指示を受け付けた後に前記撮像手段により取得した画像に、前記パターン認識手段がパターン認識に用いた前記領域が含まれていない場合に、前記記憶手段に記憶されている前記認識結果を、前記画像に関連付ける関連付け手段とを有することを特徴とする撮像装置。
【請求項2】
前記関連付け手段は、前記撮影指示を受け付ける前に前記撮像手段により取得された画像と、前記撮影指示を受け付けた後に前記撮像手段により取得した画像とを比較して、少なくとも一部の領域が一致する場合に、前記記憶手段に記憶されている前記認識結果を前記画像に関連付けることを特徴とする請求項1に記載の撮像装置。
【請求項3】
更に、新たに取得された画像からパターン認識した認識結果が、前記記憶手段に記憶されている認識結果よりも有効性が高いと判定した場合に、前記記憶手段に記憶されている認識結果を更新する更新手段を有することを特徴とする請求項1又は2に記載の撮像装置。
【請求項4】
前記更新手段は、前記撮影指示を受け付ける前に前記撮像手段により取得された画像と、前記撮影指示を受け付けた後に前記撮像手段により取得した画像とを比較して、少なくとも一部の領域が一致する場合であって、且つ新たに取得された画像からパターン認識した認識結果が、前記記憶手段に記憶されている認識結果よりも有効性が高いと判定した場合に、前記記憶手段に記憶されている認識結果を更新することを特徴とする請求項3に記載の撮像装置。
【請求項5】
前記撮影指示を受け付ける前に前記撮像手段により取得された画像は、ライブビュー表示を行う為に取得される画像であることを特徴とする請求項1ないし4のいずれか1項に記載の撮像装置。
【請求項6】
被写体を撮影して画像を取得する撮像手段と、
使用者による撮影指示を受け付ける受け付け手段とを有する撮像装置の制御方法であって、
前記撮影指示を受け付ける前に前記撮像手段により取得された画像中の領域からパターン認識を行うパターン認識工程と、
前記パターン認識工程の認識結果をメモリに記憶する記憶工程と、
前記撮影指示を受け付けた後に前記撮像手段により取得した画像に、前記パターン認識工程でパターン認識に用いた前記領域が含まれていない場合に、前記記憶工程でメモリに記憶された前記認識結果を、前記画像に関連付ける関連付け工程とを有することを特徴とする制御方法。

【図1】
image rotate

【図2−1】
image rotate

【図2−2】
image rotate

【図3−1】
image rotate

【図3−2】
image rotate

【図4−1】
image rotate

【図4−2】
image rotate

【図4−3】
image rotate

【図4−4】
image rotate

【図4−5】
image rotate

【図4−6】
image rotate

【図4−7】
image rotate

【図4−8】
image rotate

【図5】
image rotate


【公開番号】特開2012−80588(P2012−80588A)
【公開日】平成24年4月19日(2012.4.19)
【国際特許分類】
【出願番号】特願2012−2594(P2012−2594)
【出願日】平成24年1月10日(2012.1.10)
【分割の表示】特願2007−295989(P2007−295989)の分割
【原出願日】平成19年11月14日(2007.11.14)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】