説明

画像処理装置、画像処理方法、および撮像装置

【課題】画像内の被写体を検出し、検出した被写体に関連した文字列を付加した合成画像を生成することができる画像処理装置、画像処理方法、および撮像装置を提供する。
【解決手段】入力された画像中の被写体を抽出し、抽出した被写体の特徴に基づいて、抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識部と、被写体認識部が抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定部と、重み付け情報に基づいて、所定の言語データベースから対象被写体を含む抽出した被写体に適合する文字列を検索する言語検索部と、言語検索部によって検索された対象被写体に適合する文字列を、入力された画像中の対象被写体に関連付けて合成した合成画像を生成する画像合成部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被写体に関連する情報に基づいた画像を生成する画像処理装置、画像処理方法、および撮像装置に関する。
【背景技術】
【0002】
従来、画像を生成する画像処理装置として、例えば、特許文献1のように、画像に関連付けた文字列を吹き出しとして表示する撮像装置が提案されている。特許文献1に開示された撮像装置は、画像認識処理およびカレンダー機能により、注目画像の属性(人物、動物、植物、生物、山、川など)や季節を取得し、注目画像の動作や表情の状態に応じた言葉の種類を選択可能に表示する。次に、絞込み処理により文字列を表示し、注目画像とその文字列を関連付けた吹き出しを付加した画像を生成するものである。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−81785号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示された撮像装置では、吹き出しとして付加する内容(文字列)を、例えば、撮像装置のユーザーが選択することによって、選択した内容を含む吹き出しを画像に付加することができる。しかしながら、画像に付加する吹き出しの内容を選択するのは、撮像装置のユーザーに手間がかかり、吹き出しの内容を選択するための操作が煩雑になってしまう。このため、画像に吹き出しを付加する機能が実際に使用される頻度が少なくなってしまうことが考えられる。
【0005】
本発明は、上記の課題認識に基づいてなされたものであり、画像内の被写体を検出し、検出した被写体に関連した文字列を付加した合成画像を生成することができる画像処理装置、画像処理方法、および撮像装置を提供することを目的としている。
【課題を解決するための手段】
【0006】
上記の課題を解決するため、本発明の画像処理装置は、入力された画像中の被写体を抽出し、該抽出した被写体の特徴に基づいて、該抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識部と、前記被写体認識部が抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定部と、前記重み付け情報に基づいて、所定の言語データベースから前記対象被写体を含む前記抽出した被写体に適合する文字列を検索する言語検索部と、前記言語検索部によって検索された前記対象被写体に適合する文字列を、前記入力された画像中の該対象被写体に関連付けて合成した合成画像を生成する画像合成部と、を備えることを特徴とする。
【0007】
また、本発明の前記画像合成部は、前記対象被写体に適合する文字列を、該対象被写体からの吹き出しとして関連付けた合成画像を生成する、ことを特徴とする。
【0008】
また、本発明の前記被写体認識部が重み付けする際の前記被写体の特徴は、前記抽出された被写体の形状および色彩の特徴であり、前記被写体認識部は、前記入力された画像中の被写体の輪郭を抽出し、前記抽出した被写体の輪郭と、所定の形状との一致率の情報に基づいて、該被写体の形状に関する重み付けを行い、前記抽出した被写体の輪郭内の色のデータの情報に基づいて、該被写体の色彩に関する重み付けを行い、前記言語検索部は、前記一致率の情報および前記色のデータの情報に基づいて、前記被写体に適合する文字列を検索する、ことを特徴とする。
【0009】
また、本発明の前記被写体認識部が重み付けする際の前記被写体の特徴は、前記抽出された被写体の形状の特徴であり、前記被写体認識部は、前記入力された画像中の被写体の輪郭を抽出し、前記抽出した被写体の輪郭と、所定の形状との一致率の情報に基づいて、該被写体の形状に関する重み付けを行い、前記言語検索部は、前記一致率の情報に基づいて、前記被写体に適合する文字列を検索する、ことを特徴とする。
【0010】
また、本発明の前記被写体認識部が重み付けする際の前記被写体の特徴は、前記抽出された被写体の色彩の特徴であり、前記被写体認識部は、前記入力された画像中の被写体の輪郭を抽出し、前記抽出した被写体の輪郭内の色のデータの情報に基づいて、該被写体の色彩に関する重み付けを行い、前記言語検索部は、前記色のデータの情報に基づいて、前記被写体に適合する文字列を検索する、ことを特徴とする。
【0011】
また、本発明の前記対象物特定部は、該画像処理装置の操作者によって指定された被写体を、前記対象被写体として特定する、ことを特徴とする。
【0012】
また、本発明の撮像装置は、被写体を撮影した画像を出力すると共に、前記被写体を撮影したときの焦点の情報を出力する撮影部と、前記撮影部が撮影した画像中の被写体を抽出し、該抽出した被写体の特徴に基づいて、該抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識部と、前記撮影部が撮影したときの焦点の情報に基づいて、前記被写体認識部が抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定部と、前記重み付け情報に基づいて、所定の言語データベースから前記対象被写体を含む前記抽出した被写体に適合する文字列を検索する言語検索部と、前記言語検索部によって検索された前記対象被写体に適合する文字列を、前記入力された画像中の該対象被写体に関連付けて合成した合成画像を生成する画像合成部と、を備えることを特徴とする。
【0013】
また、本発明の前記対象物特定部は、前記焦点の情報において焦点が合っていることを表している前記抽出した被写体、または該撮像装置の操作者によって指定された被写体のいずれか1つの被写体、または両方の被写体を、前記対象被写体として特定する、ことを特徴とする。
【0014】
また、本発明の撮像装置は、前記画像合成部によって生成された前記合成画像を表示する表示部、を、さらに備える、ことを特徴とする。
【0015】
また、本発明の撮像装置は、前記画像合成部によって生成された前記合成画像を記録する記録部、を、さらに備える、ことを特徴とする。
【0016】
また、本発明の画像処理方法は、入力された画像中の被写体を抽出し、該抽出した被写体の特徴に基づいて、該抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識ステップと、前記被写体認識ステップによって抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定ステップと、前記重み付け情報に基づいて、所定の言語データベースから前記対象被写体を含む前記抽出した被写体に適合する文字列を検索する言語検索ステップと、前記言語検索ステップによって検索された前記対象被写体に適合する文字列を、前記入力された画像中の該対象被写体に関連付けて合成した合成画像を生成する画像合成ステップと、を含むことを特徴とする。
【発明の効果】
【0017】
本発明によれば、画像内の被写体を検出し、検出した被写体に関連した文字列を付加した合成画像を生成することができるという効果が得られる。
【図面の簡単な説明】
【0018】
【図1】本発明の第1の実施形態における画像処理装置の概略構成を示したブロック図である。
【図2】本第1の実施形態の画像処理装置で用いられる言語データベースにおける言語データの構成の一例を模式的に示した図である。
【図3】本第1の実施形態の画像処理装置における画像合成処理の手順を示したフローチャートである。
【図4】本第1の実施形態の画像処理装置における被写体の特定方法と、画像合成によって生成される画像の一例を示した図である。
【図5】本第1の実施形態の画像処理装置における画像合成によって生成される画像の別の一例を示した図である。
【図6】本第1の実施形態の画像処理装置を備えた第2の実施形態の撮像装置の概略構成を示したブロック図である。
【図7】本第2の実施形態の撮像装置における画像合成処理の手順を示したフローチャートである。
【図8】本第2の実施形態の撮像装置における吹き出し位置の指定方法の一例を示した図である。
【発明を実施するための形態】
【0019】
<第1の実施形態>
以下、本発明の実施形態について、図面を参照して説明する。図1は、本第1の実施形態における画像処理装置の概略構成を示したブロック図である。図1に示した画像処理装置200は、例えば、デジタルスチルカメラなどの撮像装置に適用される。なお、画像処理装置200を撮像装置に適用した場合の詳細な説明は、後述する。図1に示した画像処理装置200は、被写体認識部1と、対象物特定部2と、言語索出部3と、画像合成部4とから構成されている。また、画像処理装置200には、被写体に適合するコメントの文字列を記憶している言語データベース300が接続されている。画像処理装置200は、入力された画像データ内の指定された被写体に、言語データベース300に記憶している被写体に関連したコメント(文字列)を付加した画像を生成して出力する。
【0020】
以下の説明においては、画像処理装置200と言語データベース300との構成に、画像処理装置200に画像データを入力するデータ入力部100と、画像処理装置200が生成した画像を表示する、例えば、液晶などの表示装置である表示部400とを加えた画像処理システムの場合について説明する。なお、図1においては、言語データベース300が、画像処理装置200の外部の構成要素である場合を示したが、言語データベース300は、画像処理装置200の内部の構成要素であってもよい。また、図1においては、言語データベース300が画像処理装置200の外部に配線されている場合を示したが、例えば、ネットワークを経由して画像処理装置200から離れている言語データベース300にアクセスする構成とすることもできる。
【0021】
被写体認識部1は、データ入力部100から入力された画像データ(以下、「元画像」という)内の被写体の画像認識を行い、被写体を抽出する。そして、被写体認識部1は、データ入力部100から入力された元画像に抽出した被写体の情報を付加して対象物特定部2に出力する。また、被写体認識部1は、抽出した被写体の特徴(例えば、形状や色彩)に基づいて、それぞれの被写体の重み付け処理を行う。そして、重み付け処理した各被写体の重み付け情報(以下、「重み情報」という)を、言語索出部3に出力する。
【0022】
ここで、被写体認識部1による処理内容の一例について説明する。被写体認識部1における被写体の抽出では、元画像内の被写体の輪郭をそれぞれ抽出する。そして、抽出した被写体の輪郭または被写体の輪郭内のデータに基づいて、重み付け処理を行う。
【0023】
例えば、抽出した被写体の輪郭、すなわち、被写体の形状に基づいた重み付け処理を行う際には、被写体の形状のテンプレートマッチング(照合)の処理を行い、テンプレートとの一致率に基づいて重み付け処理を行う。より具体的には、被写体認識部1は、抽出した各被写体の輪郭が、被写体認識部1内に備えた、例えば、三角、四角、丸などのテンプレートに類似しているか否かを、それぞれの被写体毎に比較する。そして、それぞれの比較結果を、各被写体の重み情報として言語索出部3に出力する。
【0024】
なお、被写体の輪郭とテンプレートとの比較を行う際には、例えば、テンプレートの大きさと同じ大きさになるように、被写体の輪郭を拡大処理または縮小処理を行って一致率を算出する。そして、最も一致率の高い形状のテンプレートを、当該被写体のテンプレートとして選択する。その後、被写体認識部1は、選択されたテンプレートを用いて、それぞれの被写体の重み付けを行う。被写体の形状に基づいた重み付け処理では、被写体の輪郭と選択されたテンプレートとの一致率が、当該被写体の重み情報になる。
【0025】
また、例えば、被写体の輪郭内のデータ、すなわち、被写体の色彩に基づいた重み付け処理を行う際には、例えば、被写体の色の濃淡を表す輝度に基づいて重み付け処理を行う。被写体の色彩に基づいた重み付け処理では、各被写体の輝度の情報が、当該被写体の重み情報になる。また、被写体の色彩に基づいた重み付け処理では、例えば、各被写体を構成しているそれぞれの色(例えば、赤、緑、または青などのそれぞれの色)の情報に基づいて、各被写体の重み付けを行うこともできる。
【0026】
対象物特定部2は、画像処理装置200のユーザーによる図示しない操作部の操作に応じて、被写体認識部1が抽出した被写体の内、コメントを付加する対象の被写体(以下、「対象被写体」という)を特定する。そして、被写体認識部1から入力された被写体の情報が付加された元画像に、さらに対象被写体の情報を付加して、画像合成部4に出力する。また、対象物特定部2は、特定された対象被写体の情報(以下、「対象被写体情報」という)を、言語索出部3に出力する。なお、対象物特定部2は、対象被写体が、被写体認識部1から入力された被写体の情報に含まれていない場合、すなわち、被写体認識部1が抽出した被写体と異なる被写体が、対象被写体である場合には、対象被写体の情報を被写体認識部1にも出力する。これにより、被写体認識部1は、対象被写体の画像認識を再度行って対象被写体を抽出し、対象被写体の重み情報を言語索出部3に出力することができる。
【0027】
言語索出部3は、被写体認識部1から入力された重み情報と、対象物特定部2から入力された対象被写体情報とに基づいて、言語データベース300に記憶しているコメントの文字列の検索を行い、対象被写体に適合するコメントの文字列(以下、「コメントデータ」という)を選択する。そして、言語索出部3は、選択したコメントデータを、言語データベース300から取得し、取得したコメントデータを、画像合成部4に出力する。
【0028】
画像合成部4は、対象物特定部2から入力された被写体の情報と対象被写体情報とが付加された元画像に、言語索出部3から入力されたコメントデータを、例えば、対象被写体の吹き出しとして合成する画像合成処理を行った合成画像を生成する。そして、画像合成部4は、コメントデータが吹き出し内のコメント(以下、「吹き出しコメント」という)として合成された合成画像を、表示部400に出力する。なお、画像合成部4がコメントデータを吹き出しコメントとして合成する際には、コメントを含む吹き出しの領域の画像データを、元画像に上書きする画像合成処理を行うこともできるが、例えば、透明度の情報を予め画像処理装置200に設定しておき、吹き出しの領域の画像データを透明度の情報に応じた割合で重ね合わせる画像合成処理を行うこともできる。
【0029】
次に、本第1の実施形態の画像処理装置200における画像合成処理について説明する。なお、以下の説明においては、被写体の形状と色彩との重み情報を用いて、対象被写体に適合したコメントデータを吹き出しコメントとして合成した合成画像を生成する場合について説明する。まず、本第1の実施形態の画像処理装置200において元画像に合成されるコメントデータを記憶した言語データベース300のデータ構成について説明する。図2は、本第1の実施形態の画像処理装置200で用いられる言語データベース300における言語データ(コメントデータ)の構成の一例を模式的に示した図である。なお、図2においては、網掛けで表したところに、図2中に吹き出しで示したコメントデータが記憶されているものとする。
【0030】
言語データベース300は、重み情報に対応したコメントデータが一義的に選択されるように構成されている。例えば、図2に示したように、言語データベース300には、被写体の形状(一致率)と、被写体の色彩(被写体の輝度)に応じて、1つのコメントデータが選択されるように、コメントデータが記憶されている。言語データベース300を、このような構成とすることによって、重み情報に対応した1つのコメントデータのみが、言語索出部3によって必ず選択される。図2では、被写体の形状と色彩との重み情報に基づいて、重みPの位置のコメントデータである言葉の文字列「きれい」が選択された場合の例を示している。
【0031】
なお、図2に示した言語データベース300の構成の一例では、被写体の形状と色彩との重み情報に基づいて対象被写体に適合した言葉の文字列を選択する場合の例について説明したが、被写体の形状または色彩のいずれか一方の重み情報に基づいて、対象被写体に適合した言葉の文字列を選択することができる。より具体的には、図2からもわかるように、言語データベース300には、被写体の形状(一致率)毎、すなわち、図2においては横方向の行毎に、1つのコメントデータのみが記憶されている。また、被写体の色彩(被写体の輝度)毎、すなわち、図2においては縦方向の列毎にも、1つのコメントデータのみが記憶されている。言語データベース300がこのような構成となっているため、言語索出部3は、入力された重み情報が1つであっても、必ず1つのコメントデータを選択することができる。なお、複数の重み情報に基づいて対象被写体に適合した言葉の文字列を選択する場合、コメントデータの選択に用いられる重み情報の優先順位(例えば、図2においては、形状または色彩のどちらの重み情報を優先してコメントデータを選択するか)は、画像合成処理を実行する前に、予め画像処理装置200に設定しておくことが望ましい。この重み情報の優先順位は、例えば、画像処理装置200のユーザーが決定し、予め画像処理装置200に設定しておく構成とすることができる。
【0032】
次に、本第1の実施形態の画像処理装置200における画像合成処理の手順について説明する。図3は、本第1の実施形態の画像処理装置200における画像合成処理の手順を示したフローチャートである。
【0033】
まず、ステップS31において、データ入力部100に元画像が入力されると、データ入力部100は、入力された元画像を被写体認識部1に出力する。続いて、ステップS32において、被写体認識部1は、データ入力部100から入力された元画像内の被写体の画像認識を行い、被写体の輪郭をそれぞれ抽出する。そして、被写体認識部1は、抽出した被写体の輪郭の情報を元画像に付加して対象物特定部2に出力する。
【0034】
続いて、ステップS33において、対象物特定部2は、画像処理装置200のユーザーによる図示しない操作部の操作に応じて、対象被写体を特定し、被写体認識部1から入力された被写体の輪郭の情報が付加された元画像に、特定した対象被写体の情報をさらに付加して、画像合成部4に出力する。また、対象物特定部2は、対象被写体情報を、言語索出部3に出力する。
【0035】
続いて、ステップS34において、被写体認識部1は、抽出した被写体の特徴に基づいて、それぞれの被写体の重み付け処理を行い、各被写体の重み情報を言語索出部3に出力する。なお、本第1の実施形態では、被写体の形状と色彩との重み情報が言語索出部3に出力される。
【0036】
続いて、ステップS35において、言語索出部3は、ステップS33において対象物特定部2から入力された対象被写体情報と、ステップS34において被写体認識部1から出力された重み情報とに基づいて、言語データベース300内のコメントデータを検索する。そして、対象被写体に適合するコメントデータ取得して、画像合成部4に出力する。
【0037】
続いて、ステップS36において、画像合成部4は、対象物特定部2から入力された対象被写体の情報が付加された元画像に、言語索出部3から入力されたコメントデータを、対象被写体の吹き出しコメントとして合成した合成画像を生成する。そして、生成した合成画像を、表示部400に表示し、画像合成処理を終了する。
【0038】
ここで、画像処理装置200によって画像合成処理する場合の一例について説明する。図4は、本第1の実施形態の画像処理装置200における被写体の特定方法と、画像合成によって生成される画像の一例を示した図である。
【0039】
元画像が、図4(a)に示したような、花と2頭の蝶の画像である場合を想定する。被写体認識部1は、図4(a)に示した元画像内の被写体の画像認識を行い、図4(b)に示したように、それぞれの被写体(被写体A〜C)の輪郭を抽出する。
【0040】
また、対象物特定部2は、画像処理装置200のユーザーによって指定された被写体を、対象被写体として特定する。なお、ユーザーによる対象被写体の指定は、例えば、図示しない操作部に備えた十字キーやタッチパネルなどを、ユーザーが操作することによって行うことができる。図4(c)では、元画像内の被写体C(右側の蝶)を、ユーザーがタッチパネル上で対象被写体として指定することによって、対象被写体を特定している様子を示している。
【0041】
この場合、対象物特定部2は、タッチパネルの機能を備えた表示部400に元画像を表示させる。その後、ユーザーによって吹き出しコメントを付加する被写体が指定されたとき、表示部400に備えたタッチパネルから、ユーザーが指定した被写体の位置を表す情報(図4(c)においては、被写体Cの位置の位置を表す情報)が、対象物特定部2に入力される。対象物特定部2は、入力された被写体の位置を表す情報に基づいて、被写体認識部1が抽出した元画像に含まれる被写体(図4(b)においては、被写体A〜C)の中から、被写体Cを対象被写体として特定する。なお、対象被写体を特定する方法は、ユーザーによって指定された被写体を特定することができる方法であれば、どのような方法でもよく、図4(c)に示したようなタッチパネル上で被写体を指定する方法に限定されるものではない。
【0042】
また、被写体認識部1は、抽出した被写体A〜Cの特徴に基づいて、それぞれの被写体の重み付け処理を行う。そして、言語索出部3は、被写体認識部1から入力された重み情報と、対象物特定部2から入力された対象被写体情報に基づいて、言語データベース300内のコメントデータを検索し、被写体Cに適合するコメントデータを取得する。ここでは、図4(b)に示した対象被写体である被写体C(右側の蝶)に適合したコメントデータとして、図2に示した重みPの位置のコメントデータが選択され、「きれい」という言葉の文字列のコメントデータを取得して、画像合成部4に出力するものとする。
【0043】
画像合成部4は、対象物特定部2から入力された元画像と、言語索出部3から入力されたコメントデータとを画像合成処理し、図4(d)に示したような、ユーザーによって指定された対象被写体である被写体Cに、吹き出しコメントとしてコメントデータが合成された合成画像を生成する。なお、ユーザーによって複数の対象被写体が指定された場合には、言語索出部3が指定されたそれぞれの対象被写体に適合するコメントデータを検索し、画像合成部4が、対象被写体毎に吹き出しコメントを合成した合成画像を生成することもできる。
【0044】
なお、画像合成部4がコメントデータを合成する場合、対象被写体の予め定めた方向に、予め定めた大きさの吹き出しコメントを合成することもできるが、被写体認識部1によって元画像に付加された被写体の輪郭の情報に基づいて、合成する吹き出しコメントの方向や大きさを変更することもできる。例えば、図4に示したように、元画像に複数の被写体(被写体A〜C)が含まれている場合には、被写体認識部1によって元画像に付加されている被写体の輪郭の情報に基づいて、対象被写体以外の被写体(被写体AおよびB)に吹き出しコメントが重ならないように、合成する吹き出しコメントの方向や大きさを変更することもできる。
【0045】
例えば、図4(b)に示した被写体Bが対象被写体として指定された場合、図4(d)と同様に吹き出しコメントを合成すると、図5(a)に示したように、吹き出しコメントが被写体Aに重なってしまう。元画像に付加されている被写体の輪郭の情報に基づいて、合成する吹き出しコメントの方向や大きさを変更することによって、例えば、図5(b)に示したように、元画像内の他の被写体(被写体AおよびC)に吹き出しコメントが重ならないように画像合成処理を行うことができる。
【0046】
上記に述べたように、本第1の実施形態の画像処理装置200では、元画像内の対象被写体に適合した吹き出しコメントを自動で付加した合成画像を生成することができる。これにより、画像をより楽しむことができる。
【0047】
<第2の実施形態>
次に、第1の実施形態の画像処理装置200を、例えば、デジタルスチルカメラなどの撮像装置に適用した場合について説明する、図6は、第1の実施形態の画像処理装置を備えた本第2の実施形態の撮像装置の概略構成を示したブロック図である。図6に示した撮像装置500は、レンズ部51と、撮像部52と、撮像制御部53と、画像信号処理部54と、画像記録部55と、表示部56と、制御部57と、画像処理装置200とから構成されている。また、撮像装置500には、言語データベース300が接続されている。また、撮像制御部53には、AF(オートフォーカス:自動焦点)部53aを備えている。また、画像処理装置200は、被写体認識部1と、対象物特定部2と、言語索出部3と、画像合成部4とから構成されている。
【0048】
撮像装置500は、撮影した画像内の指定された被写体に、言語データベース300に記憶している被写体に関連したコメント(文字列)を付加した画像を生成して記録または表示する。なお、撮像装置500に備えた画像処理装置200は、AF部53aから出力される焦点位置の情報が入力される以外は、図1に示した画像処理装置200と同様である。また、言語データベース300も図1に示した言語データベース300と同様である。従って、図6においては、言語データベース300が、撮像装置500の外部の構成要素である場合を示しているが、言語データベース300は、撮像装置500の内部の構成要素であってもよい。以下の説明においては、図1に示した画像処理装置200および言語データベース300と同じ構成要素については、同一の符号を付与し、それぞれの構成要素における同様の動作や構成についての詳細な説明は省略する。
【0049】
レンズ部51は、複数のレンズから構成されズームレンズやオートフォーカスレンズなどを備え、被写体像を撮像部52に結像させる。
撮像部52は、CCD(Charge Coupled Device:電荷結合素子)型撮像素子や、CMOS(Complementary Metal Oxide Semiconductor:相補型金属酸化膜半導体)型撮像素子などのイメージセンサから構成され、レンズ部51の各種レンズを通過して撮像装置500内に入射した被写体の光学像を画像信号に変換する。
【0050】
撮像制御部53は、撮像部52を制御して、被写体の撮像条件の調節制御を行う。また、撮像制御部53に備えたAF部53aは、レンズ部51を光軸方向に移動させて自動焦点の調節を行う。また、AF部53aは、被写体を撮影したときの焦点位置(以下、「AF位置」という)の情報を画像処理装置200内の対象物特定部2に出力する。
【0051】
画像信号処理部54は、撮像部52から出力された画像信号に対して、信号の増幅、画像データへの変換および各種の補正、画像データの圧縮など、種々の画像処理を行う。
画像記録部55は、半導体メモリなどの着脱可能な記録媒体を制御して、画像データの記録または読み出しを行う。
【0052】
表示部56は、撮像部52に結像され、画像信号処理部54によって処理された画像データ、または画像記録部55が読み出された画像データの画像を表示する液晶などの表示装置である。
制御部57は、画像信号処理部54、画像記録部55、表示部56、および画像処理装置200の制御を行う。
【0053】
なお、図6に示した撮像装置500においては、レンズ部51、撮像部52、撮像制御部53、および画像信号処理部54を併せた構成が、図1に示したデータ入力部100に相当する。すなわち、レンズ部51によって撮像部52に結像され、画像信号処理部54によって画像処理された画像データが、撮像装置500に備えた画像処理装置200に入力される元画像になる。また、表示部56は、図1に示した表示部400に相当する。
【0054】
対象物特定部2は、図1に示した対象物特定部2と同様に、撮像装置500のユーザーによる図示しない操作部の操作に応じて、対象被写体を特定する。また、対象物特定部2は、AF部53aから入力されたAF位置の情報に基づいた対象被写体の特定も行う。
【0055】
次に、本第2の実施形態の撮像装置500における画像合成処理の手順について説明する。なお、以下の説明においては、撮影した被写体の形状と色彩との重み情報を用いて、対象被写体に適合したコメントデータを吹き出しコメントとして合成した合成画像を生成する場合について説明する。図7は、本第2の実施形態の撮像装置500における画像合成処理の手順を示したフローチャートである。
【0056】
まず、ステップS61において、撮影が行われると、画像信号処理部54は、レンズ部51によって撮像部52に結像された被写体像の画像信号に基づいた元画像を、被写体認識部1に出力する。続いて、ステップS62において、制御部57は、被写体に吹き出しコメントを合成するか否か、すなわち、撮像装置500の設定が、吹き出しコメントを付加するモードであるか否かを判断する。なお、吹き出しコメントを付加するモードであるか否かの撮像装置500の設定は、撮影前に、予め撮像装置500に設定しておくこともできるが、撮像装置500のユーザーがステップS62のときに決定するようにすることもできる。撮像装置500の設定が吹き出しコメントを付加するモードでない場合は、撮像装置500における画像合成処理を終了する。
【0057】
ステップS62による判断の結果、撮像装置500の設定が吹き出しコメントを付加するモードである場合、ステップS63において、被写体認識部1は、画像信号処理部54から入力された元画像内の被写体の画像認識を行い、被写体の輪郭をそれぞれ抽出する。そして、被写体認識部1は、抽出した被写体の輪郭の情報を元画像に付加して対象物特定部2に出力する。
【0058】
続いて、ステップS64において、対象物特定部2は、撮像装置500のユーザーによる図示しない操作部の操作に応じて、対象被写体を特定する。また、対象物特定部2は、対象被写体情報を、言語索出部3に出力する。
【0059】
続いて、ステップS65において、被写体認識部1は、抽出した被写体の特徴に基づいて、それぞれの被写体の重み付け処理を行い、各被写体の重み情報を言語索出部3に出力する。なお、本第2の実施形態では、被写体の形状と色彩との重み情報が言語索出部3に出力される。
【0060】
続いて、ステップS66において、言語索出部3は、ステップS64において対象物特定部2から入力された対象被写体情報と、ステップS65において被写体認識部1から出力された重み情報とに基づいて、言語データベース300内のコメントデータを検索する。
【0061】
続いて、ステップS67において、対象物特定部2は、AF部53aから入力されたAF位置の情報に基づいて、AF位置を中心にした焦点が合っている被写体を特定し、被写体認識部1から入力された被写体の輪郭の情報が付加された元画像に、特定した対象被写体の情報と焦点が合っている被写体の情報とをさらに付加して、画像合成部4に出力する。なお、対象物特定部2は、焦点が合っている被写体の情報を、言語索出部3に出力することもできる。これにより、言語索出部3は、言語データベース300を再度検索することによって、焦点が合っている被写体に適合するコメントデータを取得することができる。このことによって、画像合成部4は、焦点が合っている被写体に吹き出しコメントを付加することができるようになる。
【0062】
続いて、ステップS68において、対象物特定部2は、撮像装置500のユーザーによる図示しない操作部の操作に応じて、吹き出しコメントを付加する元画像内の位置(以下、「吹き出し位置」という)を決定する。なお、ユーザーの指定によらず、焦点が合っている被写体の位置を吹き出し位置に決定することもできる。また、ユーザーに指定された位置と、焦点が合っている被写体の位置とを、吹き出し位置に決定することもできる。そして、対象物特定部2は、決定した吹き出し位置の情報を、言語索出部3および画像合成部4に出力する。
【0063】
続いて、ステップS69において、言語索出部3は、ステップS68において対象物特定部2から入力された決定した吹き出し位置の情報に基づいて、吹き出し位置に適合するコメントデータ取得して、画像合成部4に出力する。そして、画像合成部4は、対象物特定部2から入力された吹き出し位置の情報に基づいて、言語索出部3から入力されたコメントデータを、吹き出しコメントとして元画像に合成した合成画像を生成する。そして、生成した合成画像を、表示部400に表示、または画像記録部55によって記録媒体に記録し、画像合成処理を終了する。
【0064】
ここで、撮像装置500における吹き出し位置の指定方法の一例について説明する。図8は、本第2の実施形態の撮像装置500における吹き出し位置の指定方法の一例を示した図である。撮像装置500のユーザーによる吹き出し位置の指定は、ユーザーによる対象被写体の指定方法と同様に、十字キーやタッチパネルなどの操作によって行うことができる。例えば、図8に示したように、表示部56にタッチパネルの機能を備えている場合には、ユーザーが撮像装置500の表示部56のタッチパネルに触れることによって得られる、表示部56に備えたタッチパネルからの吹き出し位置を表す情報に基づいて、吹き出し位置を決定することができる。また、例えば、表示部56にタッチパネルの機能を備えていない場合には、図8に示した十字キー58をユーザーが操作することによって、吹き出し位置を決定することもできる。
【0065】
上記に述べたように、本第2の実施形態の撮像装置500では、撮像装置500に備えた操作部によって、容易に、撮影した画像内の被写体に適合した吹き出しコメントを自動で付加した合成画像を生成することができる。そして、生成した合成画像を表示または記録することができる。これにより、撮影したその場で吹き出しコメントが付加された画像を楽しむことができ、後でも吹き出しコメントが付加された画像を楽しむことができる。
【0066】
上記に述べたとおり、本発明を実施するための形態によれば、画像内の被写体に適合したコメントデータを言語データベースから検索することができる。また、言語データベース内には、重み情報に応じて一義的に選択されるコメントデータが記憶されている。これにより、言語データベースを検索した結果、複数のコメントデータが選択されることはなく、必ず1つのコメントデータのみが選択される。従って、本発明を実施するための形態では、従来の撮像装置のように、複数のコメントデータから画像に付加する吹き出しコメントを選択する必要がなく、被写体に適合した吹き出しコメントを自動で付加した合成画像を生成することができる。また、本発明を実施するための形態では、吹き出しコメントを付加する被写体をユーザーが指定することができる。これにより、画像内に複数の被写体がある場合でも、特定の被写体のみに吹き出しコメントを付加することができる。
【0067】
また、本発明を実施するための形態によれば、画像内で焦点が合っている位置の被写体を特定することができる。これにより、ユーザーが注目する被写体を認識することができ、吹き出し位置を自動で決定することができる。また、本発明を実施するための形態では、吹き出し位置をユーザーが指定することができる。これにより、ユーザーの所望の位置に吹き出しコメントを合成することができる。
【0068】
なお、本実施形態においては、画像処理装置200に1つの言語データベース300が接続されている場合の例について説明したが、画像処理装置200に接続されている言語データベース300の個数は、本実施形態に限定されるものではなく、複数の言語データベース300が画像処理装置200に接続されている構成とすることもできる。この場合、例えば、言語索出部3がコメントデータを検索する言語データベース300を、ユーザーが選択する構成にすることもできる。また、例えば、ポートレートや夜景など、撮影されるシーンや、動物や昆虫など、被写体の種類に応じた複数の言語データベース300が接続されている場合には、例えば、撮像装置500の撮影条件や、被写体認識部1が抽出した被写体に応じて、コメントデータを検索する言語データベース300を切り替える構成とすることもできる。
【0069】
また、言語データベース300に記憶されているコメントデータは、予め記憶されたデータのみではなく、例えば、ユーザーが好みに合わせて、コメントの文字列を変更する構成とすることもできる。例えば、撮像装置500内の言語データベース300を変更する場合には、図示しない操作部に備えた十字キーやタッチパネルなどをユーザーが操作することもできる。また、ネットワークを経由して画像処理装置200から離れている言語データベース300を変更する場合には、画像処理装置200で利用しているネットワークと異なる経路で言語データベース300にアクセスすることもできる。
【0070】
また、本実施形態においては、図2において被写体の形状(一致率)と、被写体の色彩(被写体の輝度)との重み情報を、それぞれ6段階に分割した言語データベース300の構成の例について説明したが、言語データベースにおいて分割する重み情報の段階(分割数)は、本実施形態に限定されるものではなく、重み情報毎に言語データベース内で分割する段階(分割数)を変えることができる。例えば、被写体の形状(一致率)を6段階とし、被写体の色彩(被写体の輝度)を8段階とした言語データベースの構成にすることもできる。
【0071】
また、本第2の実施形態においては、第1の実施形態の画像処理装置200を、デジタルスチルカメラなどの撮像装置に適用した場合について説明したが、画像処理装置を適用するシステムは、本実施形態に限定されるものではなく、元画像内の被写体に吹き出しコメントを付加した合成画像を生成するシステムであれば、どのようなシステムも適用することができる。
【0072】
以上、本発明の実施形態について、図面を参照して説明してきたが、具体的な構成はこの実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲においての種々の変更も含まれる。
【符号の説明】
【0073】
100・・・データ入力部(撮影部)
200・・・画像処理装置
1・・・被写体認識部
2・・・対象物特定部
3・・・言語索出部(言語検索部)
4・・・画像合成部
300・・・言語データベース
400・・・表示部
500・・・撮像装置
51・・・レンズ部(撮影部)
52・・・撮像部(撮影部)
53・・・撮像制御部(撮影部)
53a・・・AF部(撮影部)
54・・・画像信号処理部(撮影部)
55・・・画像記録部(記録部)
56・・・表示部
57・・・制御部
58・・・十字キー

【特許請求の範囲】
【請求項1】
入力された画像中の被写体を抽出し、該抽出した被写体の特徴に基づいて、該抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識部と、
前記被写体認識部が抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定部と、
前記重み付け情報に基づいて、所定の言語データベースから前記対象被写体を含む前記抽出した被写体に適合する文字列を検索する言語検索部と、
前記言語検索部によって検索された前記対象被写体に適合する文字列を、前記入力された画像中の該対象被写体に関連付けて合成した合成画像を生成する画像合成部と、
を備えることを特徴とする画像処理装置。
【請求項2】
前記画像合成部は、
前記対象被写体に適合する文字列を、該対象被写体からの吹き出しとして関連付けた合成画像を生成する、
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記被写体認識部が重み付けする際の前記被写体の特徴は、
前記抽出された被写体の形状および色彩の特徴であり、
前記被写体認識部は、
前記入力された画像中の被写体の輪郭を抽出し、
前記抽出した被写体の輪郭と、所定の形状との一致率の情報に基づいて、該被写体の形状に関する重み付けを行い、
前記抽出した被写体の輪郭内の色のデータの情報に基づいて、該被写体の色彩に関する重み付けを行い、
前記言語検索部は、
前記一致率の情報および前記色のデータの情報に基づいて、前記被写体に適合する文字列を検索する、
ことを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記被写体認識部が重み付けする際の前記被写体の特徴は、
前記抽出された被写体の形状の特徴であり、
前記被写体認識部は、
前記入力された画像中の被写体の輪郭を抽出し、
前記抽出した被写体の輪郭と、所定の形状との一致率の情報に基づいて、該被写体の形状に関する重み付けを行い、
前記言語検索部は、
前記一致率の情報に基づいて、前記被写体に適合する文字列を検索する、
ことを特徴とする請求項2に記載の画像処理装置。
【請求項5】
前記被写体認識部が重み付けする際の前記被写体の特徴は、
前記抽出された被写体の色彩の特徴であり、
前記被写体認識部は、
前記入力された画像中の被写体の輪郭を抽出し、
前記抽出した被写体の輪郭内の色のデータの情報に基づいて、該被写体の色彩に関する重み付けを行い、
前記言語検索部は、
前記色のデータの情報に基づいて、前記被写体に適合する文字列を検索する、
ことを特徴とする請求項2に記載の画像処理装置。
【請求項6】
前記対象物特定部は、
該画像処理装置の操作者によって指定された被写体を、前記対象被写体として特定する、
ことを特徴とする請求項2に記載の画像処理装置。
【請求項7】
被写体を撮影した画像を出力すると共に、前記被写体を撮影したときの焦点の情報を出力する撮影部と、
前記撮影部が撮影した画像中の被写体を抽出し、該抽出した被写体の特徴に基づいて、該抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識部と、
前記撮影部が撮影したときの焦点の情報に基づいて、前記被写体認識部が抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定部と、
前記重み付け情報に基づいて、所定の言語データベースから前記対象被写体を含む前記抽出した被写体に適合する文字列を検索する言語検索部と、
前記言語検索部によって検索された前記対象被写体に適合する文字列を、前記入力された画像中の該対象被写体に関連付けて合成した合成画像を生成する画像合成部と、
を備えることを特徴とする撮像装置。
【請求項8】
前記対象物特定部は、
前記焦点の情報において焦点が合っていることを表している前記抽出した被写体、または該撮像装置の操作者によって指定された被写体のいずれか1つの被写体、または両方の被写体を、前記対象被写体として特定する、
ことを特徴とする請求項7に記載の撮像装置。
【請求項9】
前記画像合成部によって生成された前記合成画像を表示する表示部、
を、さらに備える、
ことを特徴とする請求項7に記載の撮像装置。
【請求項10】
前記画像合成部によって生成された前記合成画像を記録する記録部、
を、さらに備える、
ことを特徴とする請求項7に記載の撮像装置。
【請求項11】
入力された画像中の被写体を抽出し、該抽出した被写体の特徴に基づいて、該抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識ステップと、
前記被写体認識ステップによって抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定ステップと、
前記重み付け情報に基づいて、所定の言語データベースから前記対象被写体を含む前記抽出した被写体に適合する文字列を検索する言語検索ステップと、
前記言語検索ステップによって検索された前記対象被写体に適合する文字列を、前記入力された画像中の該対象被写体に関連付けて合成した合成画像を生成する画像合成ステップと、
を含むことを特徴とする画像処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−142739(P2012−142739A)
【公開日】平成24年7月26日(2012.7.26)
【国際特許分類】
【出願番号】特願2010−293228(P2010−293228)
【出願日】平成22年12月28日(2010.12.28)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】