説明

画像処理装置及びカメラ

【課題】 複数の人物に対してそれぞれが所望する画像を容易に分配することができる画像処理装置を提供する。
【解決手段】 集音された音声を入力する音声入力部22と、前記音声入力部から入力された音声の人物特定要素を抽出する音声処理部24と、特定の人物の声が有する固有のパターンを記録する音声記録部26と、前記人物特定要素と前記パターンとの特徴を比較することにより話者を特定する話者特定部4と、画像データを取得する画像取得部4と、前記画像データに基づく画像を出力する画像出力部20と、前記画像出力部により前記画像を出力している間に前記話者特定部により特定された前記話者を示す情報と前記画像データとを関連付けた分類データを作成する画像分類部4とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及びカメラに関するものである。
【背景技術】
【0002】
撮影画像データのExif形式等のファイルのタグデータ内にメタデータとして、画像データの分類・整理に用いられる項目情報を含めてメモリカードに記録するカメラが知られている(例えば、特許文献1参照)。このカメラにおいては、撮影の際に音声を用いて入力された項目情報をメタデータとして記録している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−289309号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、このカメラにおいては、撮影後に撮影画像を確認した際に複数の鑑賞者がそれぞれ所望した撮影画像の画像データを各鑑賞者に分配しようとすると、分配の際に画像データの分類を行う必要があり煩わしかった。
【0005】
本発明の目的は、複数の人物に対してそれぞれが所望する画像を容易に分配することができる画像処理装置及びカメラを提供することである。
【課題を解決するための手段】
【0006】
本発明に係る画像処理装置は、集音された音声を入力する音声入力部と、前記音声入力部から入力された音声の人物特定要素を抽出する音声処理部と、特定の人物の声が有する固有のパターンを記録する音声記録部と、前記人物特定要素と前記パターンとの特徴を比較することにより話者を特定する話者特定部と、画像データを取得する画像取得部と、前記画像データに基づく画像を出力する画像出力部と、前記画像出力部により前記画像を出力している間に前記話者特定部により特定された前記話者を示す情報と前記画像データとを関連付けた分類データを作成する画像分類部とを備えることを特徴とする。
【発明の効果】
【0007】
本発明によれば、複数の人物に対してそれぞれが所望する画像を容易に分配することができる。
【図面の簡単な説明】
【0008】
【図1】本発明の実施の形態に係るカメラのシステム構成を示すブロック図である。
【図2】本発明の実施の形態に係るカメラの人物IDの登録処理を示すフローチャートである。
【図3】本発明の実施の形態に係るカメラの個人音声認証データ格納フォルダの内容を示す図である。
【図4】本発明の実施の形態に係るカメラの分類データ作成処理を示すフローチャートである。
【図5】本発明の実施の形態に係るカメラの語彙データに含まれる追加言語及び削除言語を示す図である。
【図6】本発明の実施の形態に係るカメラの分類データを示す図である。
【図7】本発明の実施の形態に係る実施の形態に係る分類データの確認処理及び分類データの追加・削除処理を示すフローチャートである。
【図8】本発明の実施の形態に係るカメラの分類データの追加・削除処理を示すフローチャートである。
【図9】本発明の実施の形態に係るカメラの背面表示部におけるサムネール表示を示す図である。
【図10】本発明の実施の形態に係るカメラの背面表示部におけるサムネール表示を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して本発明の実施の形態に係るカメラについて説明する。図1は、実施の形態に係るカメラのシステム構成を示すブロック図である。カメラ2は、CPU4を備え、CPU4には、CCD或いはCMOS等により構成され、撮影レンズ6を介した被写体光を撮像して撮像信号を生成する撮像素子8、撮像素子8から出力された撮像信号を図示しないA/D変換部においてA/D変換することにより生成された画像データを記憶する画像記憶部10、撮像素子8から出力される撮像信号に基づく画像データに、ホワイトバランス調整、輪郭補償、ガンマ補正等の画像処理を行う画像処理部12、カードスロット13に着脱可能に構成され画像データや種々のデータを記録するメモリカード14、撮影画像等の画像をカメラ2の背面に設けられLCDまたは有機EL等により構成された背面表示部16または接続部18を介して図示しない外部表示装置に対して出力する画像出力部20、カメラ2の周囲の音声を集音して音声信号を生成するマイクロホン22、マイクロホン22から出力された音声信号に基づく音声データから人物特定要素を抽出する音声処理部24、音声処理部24により抽出した人物特定要素と特定の人物とを対応させる個人音声認証データ等を記録する内部メモリ26、マイクロホン22から出力される音声信号に基づく音声データについて音声認識を行い、認識対象の語句を記憶させた語彙データを参照して話者の言葉を特定する音声認識部28、画像データを外部装置に対して送信する送信部30、レリーズボタン32、マルチセレクタ等のキーまたは背面表示部16に積層して配置されたタッチパネルを含む操作部34、USB機器を接続するUSBポート36が接続されている。
【0010】
図2は、実施の形態に係るカメラの個人音声認証データの作成処理を示すフローチャートである。操作部34を介したユーザの操作に基づいて個人音声認証データの作成モードに設定し、マイクロホン22を介して特定の個人の声が入力されると(ステップS1)、CPU4は、音声処理部24を制御してマイクロホン22から出力される音声信号に基づく音声データから人物特定要素を抽出させる(ステップS2)。ここで、人間の声の周波数と強度との関係、周波数及び強度の時間変化等は人物固有のパターンを有し、例えば、声紋として個人の識別に利用することができる。従って、特定の人物の声の周波数と強度との関係、周波数及び強度の時間変化等に基づいて人物特定要素を抽出させる。
【0011】
次に、操作部34を介したユーザの操作により特定の個人の名前やニックネーム等、個人を特定するための個人IDが入力されると、CPU4は個人IDを登録し(ステップS3)、ステップS2で抽出した人物特定要素に基づくパターンを個人IDに対応させた個人音声認証データを作成する(ステップS4)。そして、CPU4は個人音声認証データを内部メモリ26の個人音声認証データ格納フォルダ内に記録する(ステップS5)。
【0012】
次に、CPU4は操作部34を介したユーザの操作に基づいて他の人物の個人音声認証データを作成するか否かを判断し(ステップS6)、他の人物の個人音声認証データを作成する場合には、ステップS1に示す処理に戻る。一方、他の人物の個人音声認証データを作成しない場合には処理を終了する。
【0013】
図2に示す個人音声認証データの作成処理によって、内部メモリ26の個人音声認証データ格納フォルダには、例えば図3に示すような個人音声認証データが格納される。図3は、ステップS2において抽出された人物特定要素に基づくパターンAにステップS3で登録された個人ID「A」を対応させた個人音声認証データA、ステップS2において抽出された人物特定要素Bに基づくパターンBにステップS3で登録された個人ID「B」を対応させた個人音声認証データB、ステップS2において抽出された人物特定要素Cに基づくパターンCにステップS3で登録された個人ID「C」を対応させた個人音声認証データCが個人認証データ格納フォルダに格納されていることを示している。
【0014】
なお、図2に示すフローチャートのステップS3において操作部34を介して個人IDを入力する構成を例に説明したが、マイクロホン22を介して個人IDを入力する構成としてもよい。この場合には、CPU4は、音声認識部28を制御して音声認識を行わせることにより言葉を特定し、特定した言葉を個人IDとして登録する。
【0015】
また、図2に示すフローチャートのステップS3において個人IDを入力する構成としたが、個人IDの入力を省略し、CPU4が、人物特定要素を抽出した順に個人IDを「A」、「B」、「C」…または「001」、「002」、「003」…とする等、予め設定された個人IDを付す構成としてもよい。
【0016】
また、図2に示すフローチャートのステップS5において、個人音声認証データを内部メモリ26に記録する構成としたが、メモリカード14に個人音声認証データを記録させる構成としてもよい。
【0017】
次に、図4に示すフローチャートを参照して実施の形態に係る分類データの作成処理について説明する。操作部34を介したユーザの操作に基づいて撮影画像を1コマずつ表示する再生モードを設定すると、CPU4は画像出力部20を制御して背面表示部16に初期説明を表示させる(ステップS11)。この初期説明には、マイクロホン22を介して集音した音声を用いて画像の分類を行う際のガイドが含まれている。即ち、以下に説明するように、どのような言葉に対してどのような処理が行われるかについての説明が含まれている。なお、このフローチャートの1コマずつ表示する再生モードは、操作部34を介したユーザの操作に基づいて次の画像を表示させる1枚表示モードであってもよいし、1コマの画像を表示してから所定時間が経過するとCPU4が次の画像を表示させるスライドショーモードであってもよい。
【0018】
次に、CPU4はメモリカード14から分類の対象となる対象画像データのうち、1コマ分の画像データを読み出し(ステップS12)、画像出力部20を制御して背面表示部16に画像データに基づく画像を表示させる(ステップS13)。ここで、分類の対象となる対象画像データは、メモリカード14に記録されているすべての撮影画像データであってもよいし、特定の日や特定の時間帯など所定の期間に撮影された画像の撮影画像データであってもよい。
【0019】
次に、CPU4はマイクロホン22を介してカメラ2の周囲の音声が入力されたか否かを判断する(ステップS14)。音声が入力された場合にはCPU4は、音声処理部24を制御してマイクロホン22から出力された音声信号に基づく音声データを用いて人物特定要素を抽出させる(ステップS15)。
【0020】
次に、CPU4は、人物特定要素から話者が特定できるか否かを判断する(ステップS16)。即ち、ステップS15において抽出した人物特定要素の特徴と、内部メモリ26に記録された個人音声認証データのパターンとを比較し、人物特定要素の特徴が、内部メモリ26の個人音声認証データ格納フォルダに格納された何れかの個人音声認証データのパターンと同一人物のものであるか否かを判断する。また、CPU4は、同一人物のものである場合には、当該個人音声認証データに対応する個人IDを読み出し、話者を特定する。
【0021】
話者が特定できた場合には、CPU4は、音声認識部28を制御して音声認識を行い、話者の言葉が追加言語であるか、削除言語であるか、追加言語でも削除言語でもないかを判断する(ステップS17)。ここで、図5に示すように語彙データには、音声認識部28の認識対象となる追加言語群及び削除言語群を含む語句が記憶されている。また、追加言語群には「欲しい」、「追加」、「はい」、「プラス」等の追加言語が含まれ、削除言語群には「いらない」、「削除」、「いいえ」、「マイナス」等の削除言語が含まれている。また、図5に示す語句は例示であり、追加言語として想定される語句であれば追加言語群に含まれ、削除言語として想定される語句であれば削除言語群に含まれる。
【0022】
音声認識部28により話者の言葉が追加言語であると認識した場合には、CPU4はメモリカード14または内部メモリ26に分類データを作成する(ステップS18)。例えば、図6に示すように話者として特定された人物のIDに基づく個人フォルダ内に分類データを作成する。ここで、分類データとしては画像データを特定可能な情報であればどのようなデータでもよく、ステップS12で読み出した画像データのファイル名等の情報を示すテキストデータを個人フォルダに格納してもよいし、ステップS12で読み出した画像データをコピーして個人フォルダに格納してもよい。
【0023】
また、音声認識部28により話者の言葉が削除言語であると認識した場合には、CPU4は、ステップS16において話者として特定した人物の個人フォルダからステップS12で読み出した画像データについての分類データを削除する(ステップS19)。なお、削除言語であると認識した際に、話者として特定した人物の個人フォルダにステップS12で読み出した画像データについての分類データが存在しない場合には、ステップS19に示す処理を行わずに後述するステップS20に示す処理を行ってもよいし、後述するステップS22に示す処理を行ってもよい。ステップS22に示す処理を行う場合には、CPU4は画像出力部20を制御して、背面表示部16に削除すべき分類データが存在しない旨の警告表示をさせる。
【0024】
ステップS18またはステップS19に示す処理を行うと、CPU4は画像出力部20を制御して背面表示部16に話者を特定し、かつ、言語を認識した旨の確認表示をさせる(ステップS20)。さらにCPU4はステップS20に示す処理において、ステップS18に示す分類データの作成処理を行った旨の確認表示またはステップS19に示す分類データの削除処理を行った旨の確認表示をさせてもよい。
【0025】
次に、CPU4は次に表示すべき対象画像データが存在するか否かを判断する(ステップS21)。次に表示すべき対象画像データが存在する場合には、ステップS12に示す処理に戻り、次に表示すべき対象画像データが存在しない場合には処理を終了する。
【0026】
また、上述のステップS16において話者が特定できなかった場合、及びステップS17において話者の言葉が追加言語でも削除言語でもない場合には、CPU4は画像出力部20を制御して、背面表示部16に話者の特定または言葉の認識ができなかった旨を示す警告表示をさせる(ステップS22)。
【0027】
また、上述のステップS14において音声が入力されない場合には、CPU4は次に表示すべき対象画像データが存在するか否かを判断する(ステップS23)。次に表示すべき対象画像データが存在する場合には、ステップS12に示す処理に戻り、次に表示すべき対象画像データが存在しない場合には処理を終了する。
【0028】
なお、図2に示すフローチャートにおいて個人IDに対応させて特定の人物の顔を記録させた場合には、顔認識を行うことにより対象画像データに基づく画像内に被写体として含まれる人物の個人フォルダに予め分類データを格納した上で、図3のフローチャートに示す処理を開始してもよい。
【0029】
次に、図7及び図8に示すフローチャートを参照して実施の形態に係る分類データの確認処理及び分類データの追加・削除処理について説明する。操作部34を介したユーザの操作によりサムネール表示を行う再生モードを設定すると(ステップS31)、CPU4は操作部34を介したユーザの操作に基づいて、サムネール表示をどのように行うかを判断する(ステップS32)。即ち、サムネール画像に対して個人IDを表示するか否かを判断する。
【0030】
ここで、CPU4は画像出力部20を制御して、サムネール表示された各画像の画像データについての分類データが特定の個人フォルダ内に格納されているか否かを個人IDの表示/非表示により、または個人IDの表示態様を変更することにより背面表示部16に表示させることができる。また、ステップS32に示す処理において個人IDを表示する場合にCPU4は、全員の個人IDを表示するか、特定の個人の個人IDを表示するかについても判断する。即ち、図2に示す個人音声認証データ作成処理において登録された人物全員の分類データに基づくサムネール表示を行うか、特定の個人の分類データに基づく表示を行うかについて判断する。
【0031】
登録された人物全員の分類データに基づくサムネール表示を行う場合には、CPU4は画像出力部20を制御して、図9に示すようにサムネール画像の画像データについての分類データが個人フォルダ内に格納されている人物の人物IDを、当該サムネール画像に表示させる(ステップS33)。例えば、図6に示すように人物IDが「A」である人物の個人フォルダには「画像001」、「画像002」、「画像005」、「画像006」…の分類データが格納されている。従って、図9においては、「画像001」、「画像002」、「画像005」、「画像006」のサムネール画像に個人ID「A」を重畳表示させる。同様に図6に示すように人物IDが「B」である人物の個人フォルダには「画像001」、「画像003」、「画像004」、「画像005」…の分類データが格納され、人物IDが「C」である人物の個人フォルダには「画像002」、「画像003」、「画像004」、「画像005」…の分類データが格納されている。従って、図9においては、「画像001」、「画像003」、「画像004」、「画像005」のサムネール画像に個人ID「B」を重畳表示させ、「画像002」、「画像003」、「画像004」、「画像005」のサムネール画像に個人ID「C」を重畳表示させる。なお、図9においては個人IDをサムネール画像に重畳表示させる構成としたが、個人IDをサムネール画像の近傍に表示させる構成としてもよい。
【0032】
次に、CPU4は、分類データの追加、削除を行うか否かを判断する(ステップS34)。即ち、操作部34を介したユーザの操作によりサムネール画像の何れかが選択されたか否かを判断する。
【0033】
何れかのサムネール画像が選択された場合には、CPU4は分類データの追加・削除処理を行い(ステップS35)、操作部34を介したユーザの操作に基づいて他のサムネール画像の画像データについて分類データの追加または削除を行うか否かを判断する(ステップS36)。他のサムネール画像の画像データについて分類データの追加または削除を行う場合には、ステップS33に示す処理に戻る。一方、他のサムネール画像の画像データについて分類データの追加または削除を行わない場合には、処理を終了する。
【0034】
ステップS32において特定の個人の分類データに基づく表示を行う場合には、CPU4は操作部34を介したユーザの操作に基づいて何れの個人の分類データに基づく表示を行うかを決定する(ステップS37)。次に、CPU4は画像出力部20を制御して、特定の個人の個人フォルダ内に格納されている分類データに基づいてサムネール表示をさせる(ステップS38)。例えば、図10に示すように、ステップS37において個人IDが「A」である人物の分類データに基づく表示を行うことを決定した場合に、CPU4は画像出力部20を制御して、個人IDが「A」である人物の個人フォルダ内に格納されている分類データが識別可能な表示態様で表示させる。個人フォルダが図6に示すものである場合には、人物IDが「A」である人物の個人フォルダには「画像001」、「画像002」、「画像005」、「画像006」…の分類データが格納されている。従って、図9に示すように、CPU4は、「画像001」、「画像002」、「画像005」、「画像006」のサムネール画像に個人ID「A」を重畳表示させる。また、CPU4は、人物IDが「A」である人物の個人フォルダに分類データが格納されていない「画像003」、「画像004」のサムネール画像を個人フォルダに分類データが格納されている「画像001」、「画像002」、「画像005」、「画像006」のサムネール画像に比べて暗めに表示させるとともに、人物IDが「B」及び「C」である人物の個人フォルダに分類データが格納されている画像データに基づくサムネール画像には個人ID「B」及び「C」を「A」に比べてそれぞれ薄めに重畳表示させる。ここで、人物IDが「A」である人物の個人フォルダに分類データが格納されていない画像データのサムネール画像も表示させるため、画像の選択漏れを防ぐことができる。
【0035】
次に、CPU4は、ステップS39〜ステップS41に示す処理を行うが、これらの処理はステップS34〜S36に示す処理とそれぞれ同様であるため、説明は省略する。なお、ステップS41に示す処理において、他のサムネール画像の画像データについて分類データの追加または削除を行う場合には、ステップS38に示す処理に戻る。また、ステップS32において、個人IDを表示しない場合には、CPU4は画像出力部20を制御して、背面表示部16に通常のサムネール表示を行わせ(ステップS42)、処理を終了する。
【0036】
また、図8は、図7のステップS35またはステップS40における分類データの追加・削除処理を示すフローチャートである。マイクロホン22を介して音声が入力されると(ステップS51)、ステップS52〜S58に示す処理を行うが、ステップS52〜S57に示す処理は図4のフローチャートのS15〜S20に示す処理とそれぞれ同様であり、また、ステップS58に示す処理は図4のフローチャートのステップS22に示す処理と同様であるため、説明は省略する。
【0037】
なお、図10に示したサムネール表示は一例であり、人物IDが「A」以外のもの、即ち人物ID「B」及び「C」を非表示としてもよい。また、人物IDが「A」である人物の個人フォルダに分類データが格納されている画像のサムネール画像を個人フォルダに分類データが格納されている画像のサムネール画像に比べて暗めに表示させてもよい。また、サムネール画像に対して重畳表示させる個人ID「A」を「B」及び「C」に比べて薄めに表示させてもよい。また、個人IDをサムネール画像に重畳表示させる構成に代えて、個人IDをサムネール画像の近傍に表示させる構成としてもよい。即ち、ステップS37において決定された個人の個人フォルダに格納されている分類データを識別可能な表示であれば、どのように表示を行ってもよい。また、各個人の個人フォルダ、または特定の個人の個人フォルダに格納された分類データの数を表示させてもよい。
【0038】
また、図4のフローチャートにおける再生モードである1枚表示モードやスライドショーモードにおいても、背面表示部16に表示中の画像に画像データについての分類データが特定の人物の個人フォルダに格納されていることを示す表示を行ってもよい。この場合には、例えば、CPU4は画像出力部20を制御して、表示中の画像に個人IDを重畳表示させる。
【0039】
本実施の形態に係るカメラによりCPU4は送信部30またはUSBポート36を介して作成された分類データに基づいて画像データを出力する。画像データの出力は、個人フォルダ毎に行い、分類データが画像データである場合には、特定の個人の個人フォルダに格納された画像データを出力する。また、分類データがテキストデータである場合には、テキストデータが示す画像データを参照し、特定の個人の個人フォルダに格納された分類データが示す画像データを出力する。
【0040】
これにより、USBポート36に接続されたUSBメモリやCD・DVDドライブに挿入されたCDまたはDVDディスク、ハードディスクドライブに対して個人フォルダに格納された分類データに基づく画像データを出力することができる。また、個人フォルダに格納された分類データに基づく画像データを送信部30を介して出力することができる。また、個人IDとメールアドレスが関連付けて記録されている場合には、送信部30を介して特定の個人に対して画像データを送信することができる。送信部30を介して個人IDが登録された人物のタブレットPCや携帯電話とデータ通信を行うことにより、当該人物の個人フォルダに格納された分類データに基づく画像データを出力してもよい。また、メモリカードスロット13に接続されたメモリカード14に対して個人フォルダに格納された分類データに基づく画像データを出力してもよい。
【0041】
また、個人フォルダに格納された分類データに基づいて現像を行ってもよい。この場合に、個人フォルダに格納された同一の画像データについての分類データの数を指定されたプリント枚数としてもよい。また、図5に示す語彙データの追加言語群において数字を含めてもよい。即ち、音声認識部28により「1」や「2」等の数字が認識された場合には、認識した数の分類データを作成し個人フォルダに格納する。また、図5に示す語彙データの削除言語群に数字を含めてもよく、個人フォルダに格納されている同一の画像についての分類データの数が音声認識部28により認識した数字よりも小さい場合には、認識した数字と分類データの数の差分に相当する数の分類データを削除する。
【0042】
また、同様に音声認識部28により「1枚増やす」や「1枚プラス」等が認識されると、認識した数の分類データを作成して個人フォルダに格納し、「1枚減らす」、「1枚マイナス」等が任席されると、認識した数の分類データを個人フォルダから削除してもよい。
【0043】
本実施の形態に係るカメラによれば、複数の人物に対してそれぞれが所望する画像を容易に分配することができる。例えば、団体で旅行に行った際にカメラ2により撮影した画像を確認している最中に容易に鑑賞者各自の意思を反映した画像の分類を行うことができる。従って、分類した画像をそれぞれの鑑賞者に容易に分配することができ、手作業等で分配する場合の煩わしさを解消することができ、また、分配にかかる時間を短縮することができる。
【0044】
なお、上述の実施の形態の図4のフローチャートのステップS14及び図8のフローチャートのステップS51において複数人の声がマイクロホン22を介して入力された場合には、複数の話者を特定する構成としてもよい。即ち、CPU4は音声処理部24を制御して、マイクロホン22から出力された音声信号に基づく音声データを用いて人物特定要素を抽出させ、個人音声認証データのパターンと比較することにより複数の話者を特定する。
【0045】
また、上述の実施の形態において、ユーザは操作部34を介して操作を行う構成としたが、音声を用いて操作入力を行う構成としてもよい。この場合には、マイクロホン22から出力された音声信号に基づく音声データを音声認識部28により音声認識を行い、所定の操作指示を示す言語が認識された場合に、CPU4は対応する処理を行う。
【0046】
また、上述の実施の形態においては、カメラ2がマイクロホン22を備える構成としたが、音声入力端子を備える場合には音声入力端子に外付けのマイクロホンを接続する構成としてもよい。
【0047】
また、上述の実施の形態においては、画像出力部20から背面表示部16に画像を出力する構成としたが、接続部18を介して接続された外部表示装置に対して画像を出力する構成としてもよい。
【0048】
また、上述の実施の形態においては、画像の分類を行う画像処理装置を備えたカメラを例に説明したが、画像処理装置を備えたPCであってもよいし、デジタルフォトフレームやDVDプレーヤ等の再生装置であってもよい。
【符号の説明】
【0049】
2…カメラ、4…CPU、16…背面表示部、20…画像出力部、22…マイクロホン、24…音声処理部、28…音声認識部

【特許請求の範囲】
【請求項1】
集音された音声を入力する音声入力部と、
前記音声入力部から入力された音声の人物特定要素を抽出する音声処理部と、
特定の人物の声が有する固有のパターンを記録する音声記録部と、
前記人物特定要素と前記パターンとの特徴を比較することにより話者を特定する話者特定部と、
画像データを取得する画像取得部と、
前記画像データに基づく画像を出力する画像出力部と、
前記画像出力部により前記画像を出力している間に前記話者特定部により特定された前記話者を示す情報と前記画像データとを関連付けた分類データを作成する画像分類部と
を備えることを特徴とする画像処理装置。
【請求項2】
前記話者が話した言葉を認識する音声認識部を備え、
前記画像分類部は、前記音声認識部により認識した前記言葉に基づいて前記分類データを作成することを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記画像分類部は、前記音声認識部により認識された言葉が追加言語群に属する場合に前記分類データを追加し、前記音声認識部により認識された言葉が削除言語群に属する場合には前記分類データを削除することを特徴とする請求項2記載の画像処理装置。
【請求項4】
前記画像出力部は、前記分類データの追加または削除を行った旨を示す確認表示を出力することを特徴とする請求項3記載の画像処理装置。
【請求項5】
前記画像出力部により前記画像が、前記画像データに基づく前記画像を1コマずつ順次表示するスライドショーモード、選択された前記画像データに基づく前記画像を1コマ表示する1枚表示モードまたは複数の前記画像データに基づく複数の前記画像を一覧表示すサムネール表示モードにより出力されている間に、前記画像分類部による前記分類データの追加及び削除が可能であることを特徴とする請求項3または4記載の画像処理装置。
【請求項6】
前記画像出力部は、前記スライドショーモード、前記1枚表示モード及び前記サムネール表示モードに応じた表示態様で前記確認表示を出力することを特徴とする請求項5記載の画像処理装置。
【請求項7】
前記画像分類部は、前記スライドショーモードまたは前記1枚表示モードにより前記画像の出力を行う場合に前記画像出力部により出力している1コマの前記画像の前記画像データについて前記分類データの追加または削除を行うことを特徴とする請求項5または6記載の画像処理装置。
【請求項8】
前記画像出力部は、前記サムネール表示モードにより前記画像の出力を行う場合に前記画像データが、前記分類データによって前記話者特定部により特定された前記話者を示す情報に関連付けられているか否かに応じた表示態様で前記画像を出力することを特徴とする請求項5または6記載の画像処理装置。
【請求項9】
前記話者特定部は、複数の人物の声が同時に集音されて前記音声入力部により入力された場合に複数の話者を特定することを特徴とする請求項1〜8の何れか一項に記載の画像処理装置。
【請求項10】
前記話者特定部により特定された前記話者を示す情報に関連付けられた前記画像データを前記分類データに基づいて出力する画像データ出力部を備えることを特徴とする請求項1〜9の何れか一項に記載の画像処理装置。
【請求項11】
請求項1〜10の何れか一項に記載の画像処理装置を備えることを特徴とするカメラ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2013−26703(P2013−26703A)
【公開日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願番号】特願2011−157502(P2011−157502)
【出願日】平成23年7月19日(2011.7.19)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】