キーワード付与装置及びプログラム
【課題】ユーザの趣味や趣向に沿って、類似した画像に対して分類し易いキーワードを各画像に付与できるようにすること。
【解決手段】特徴量抽出回路15は、入力画像から特徴量を抽出し、クラス分類処理回路16は、上記特徴量抽出回路15で抽出した特徴量に対してクラス分類を行い、分類頻度計測回路18は、上記クラス分類処理回路16で分類したクラス分類の頻度を計測し、キーワード付与回路19は、上記クラス分類処理回路16で分類したクラス分類と、上記分類頻度計測回路18で計測した頻度と、に基づいて上記入力画像にキーワードを付与する。
【解決手段】特徴量抽出回路15は、入力画像から特徴量を抽出し、クラス分類処理回路16は、上記特徴量抽出回路15で抽出した特徴量に対してクラス分類を行い、分類頻度計測回路18は、上記クラス分類処理回路16で分類したクラス分類の頻度を計測し、キーワード付与回路19は、上記クラス分類処理回路16で分類したクラス分類と、上記分類頻度計測回路18で計測した頻度と、に基づいて上記入力画像にキーワードを付与する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像の特徴量を抽出し、特徴量によって画像を識別しキーワードを自動的に付与するキーワード付与装置、及び、コンピュータをそのようなキーワード付与装置として機能させるためのプログラムに関する。
【背景技術】
【0002】
近年、メモリ等の記録媒体の大容量化及び低価格化に伴い、デジタルカメラで撮影した画像がデジタルカメラ内に、大量に蓄積されるようになってきている。また、そのような撮影した画像は、パーソナルコンピュータ等の外部機器に転送して蓄積され、更には、該外部機器内には、そのようなユーザがデジタルカメラで撮影した画像だけでなく、インターネット等を介して収集した画像も蓄積されることとなっている。
【0003】
そこで、各画像にキーワードを付しておき、キーワード検索を行うことによって、デジタルカメラ内或いは外部機器内に大量に蓄積されている画像の中から、ユーザが所望の画像を容易に検索できるようにすることが行われている。このキーワードは、ユーザが画像を撮影又は収集する毎に付与するのであれば、それほど手間はかからないが、既に撮影又は収集されて蓄積されている大量の画像に対して、逐一キーワードを付与していくという操作は非常に煩雑であり、時間がかかってしまうものであった。
【0004】
そこで、例えば、特許文献1は、キーワード付与の対象となる画像に類似する類似画像を検索抽出し、その抽出された類似画像に付与されているキーワードを対象画像にも付与することで、自動的にキーワードを付与することができる手法を提案している。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第3683481号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、ユーザが撮影や収集する画像は、ユーザの趣味や趣向に強く依存し、偏る傾向があるため、特定のキーワードが偏って付与される可能性が高い。この場合、同じキーワードが付与された画像ばかりが膨大な量になり、キーワードを用いて画像の検索や整理を行うことは困難になってしまう。
【0007】
本発明は、上記の点に鑑みてなされたもので、ユーザの趣味や趣向に沿って、類似した画像に対して分類し易いキーワードを各画像に付与することが可能なキーワード付与装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明のキーワード付与装置の一態様は、
入力画像から特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段と、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段と、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段と、
を具備することを特徴とする。
また、本発明のプログラムの一態様は、コンピュータを、
入力画像から特徴量を抽出する特徴量抽出手段、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段、
として機能させるためのプログラムであることを特徴とする。
【発明の効果】
【0009】
本発明によれば、クラス分類結果と頻度とを考慮してキーワードを付与するので、頻度が高い類似画像には別のキーワードを付与することができるようになり、ユーザの趣味や趣向に沿って、類似した画像に対して分類し易いキーワードを各画像に付与することが可能なキーワード付与装置及びプログラムを提供することができる。
【図面の簡単な説明】
【0010】
【図1】図1は、本発明の第1実施形態に係るキーワード付与装置が適用されたデジタルカメラの構成を示す図である。
【図2】図2は、第1実施形態に係るキーワード付与装置が適用されたデジタルカメラの動作を説明するためのフローチャートを示す図である。
【図3】図3は、特徴空間における学習データの分布の例を示す図である。
【図4A】図4Aは、図3のクラス分類に対応する分類木の例を表わした図である。
【図4B】図4Bは、図3のクラス分類に対応する分類木の別の例を表わした図である。
【図5】図5は、ユーザが撮影した画像に対するクラス分類結果の例を示す図である。
【図6】図6は、図5の例における分類頻度を示す図である。
【図7】図7は、動物好きのユーザが撮影した画像に対するクラス分類結果の例を示す図である。
【図8】図8は、図7の例における分類頻度を示す図である。
【図9】図9は、図7の例のクラス分類結果に対しクラス分類修正を行った結果を示す図である。
【図10】図10は、図9のクラス分類修正結果における分類頻度を示す図である。
【図11】図11は、図9の例のクラス分類修正結果に対し更にクラス分類修正を行った結果を示す図である。
【図12】図12は、図11のクラス分類修正結果における分類頻度を示す図である。
【図13】図13は、表示出力例を示す図である。
【図14】図14は、本発明の第1実施形態の変形例に係るキーワード付与装置が適用されたデジタルカメラの構成を示す図である。
【図15】図15は、本発明の第2実施形態に係るキーワード付与装置が適用されたデジタルカメラの構成を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明を実施するための形態を図面を参照して説明する。
[第1実施形態]
図1に示すように、本発明の第1実施形態に係るキーワード付与装置が適用されたデジタルカメラ10は、当該デジタルカメラ10全体を制御するCPU11と、撮影した画像を記録しておくメモリ12と、該メモリ12に記録された画像や所謂スルー画を表示するための液晶モニタ等の出力部13と、を備える。なお、画像撮影のための構成については、周知であるので、その説明及び図示は省略する。
【0012】
デジタルカメラ10は、更に、画像入力部14、特徴量抽出回路15、クラス分類処理回路16、画像枚数測定回路17、分類頻度計測回路18、キーワード付与回路19、及び出力制御回路20を備える。ここで、キーワード付与回路19は、クラス分類修正回路19Aを有している。
【0013】
画像入力部14は、CPU11、メモリ12及び特徴量抽出回路15に接続されている。特徴量抽出回路15は、CPU11及びクラス分類処理回路16に接続されている。クラス分類処理回路16は、CPU11、メモリ12及び画像枚数測定回路17に接続されている。画像枚数測定回路17は、CPU11に接続されている。分類頻度計測回路18は、CPU11、メモリ12及びキーワード付与回路19のクラス分類修正回路19Aに接続されている。キーワード付与回路19のクラス分類修正回路19Aは、CPU11及びメモリ12に接続されている。出力制御回路20は、CPU11、メモリ12及び出力部13に接続されている。
【0014】
以下、このような構成における動作を、図2のフローチャートに沿って説明する。
【0015】
CPU11は、画像入力部14に、メモリ12からキーワード付与の対象となる画像を読み出させ、その読み出した対象画像を、例えば特徴量抽出手段として機能する特徴量抽出回路15へ入力させる(ステップS11)。次に、CPU11は、特徴量抽出回路15に、入力された画像から特徴量(ベクトル)を抽出させ、その抽出した特徴量を、例えばクラス分類手段として機能するクラス分類処理回路16へ入力させる(ステップS12)。
【0016】
次に、CPU11は、クラス分類処理回路16に、抽出した特徴量(ベクトル)の特徴空間でのクラス分類を行わせ、そのクラス分類結果をメモリ12の当該対象画像に付加させると共に、画像枚数測定回路17へ終了信号を入力させる(ステップS13)。ここで、対象画像へのクラス分類結果の付加は、テーブルに記録することで対象画像に関連付けるものであっても良いが、パーソナルコンピュータ等の外部機器への対象画像の移動等を考慮して、対象画像のファイルヘッダ(例えばExif情報)に追記するような形式で、画像と一体的に移動・削除されるように付加することが望ましい。
【0017】
ここで、クラス分類について、詳細に説明する。
クラス分類処理回路16は、予め設定されたクラス分類を学習している。その学習過程では、先ず、予め人間によって正しいキーワードを付与された画像(学習データ)を用意し、これらの画像から特徴量(ベクトル)を抽出して、クラス分類処理回路16に入力する。ここで、特徴量は、色相、彩度、輝度、形状、大きさ、位置、など画像自体に含まれる様々の特徴量や、Exif情報に含まれるISO感度等の撮影情報のような画像に付加されている様々の特徴量の中から、学習データの分類に適した如何なる特徴量を用いても良い。なお、上記特徴量抽出回路15は、この学習過程で採用した特徴量を抽出するものとなっている。そして、クラス分類処理回路16では、入力された画像(学習データ)の特徴量(ベクトル)を、図3に示すように特徴空間に配置し、同じキーワードを付与された画像が特徴空間で同じクラスに分類されるよう、分類境界を形成する。このクラス分類には如何なる手法を用いても良いが、例えばk−近傍法を用いる。図3において×印が各学習データに対応し、閉領域が各キーワードに対応するクラスの分類境界を表す。なお、図3の特徴空間は、簡略化のために2次元空間として示しているだけであり、実際にはN次元空間である。ここでNは任意の自然数を表している。
【0018】
また、人間が画像に付与するキーワードは、例えば、図4A或いは図4Bに示すような階層構造を持っており、上位の階層のキーワードは特徴空間においてより大きな領域を占め、下位の階層のキーワードの領域を包含する。なお、これら図4A或いは図4Bに示す分類木は一例に過ぎず、キーワードや階層数はこれに限定されないことは勿論である。
【0019】
クラス分類処理回路16は、CPU11の制御の下、上記特徴量抽出回路15から入力されたキーワード付与の対象画像の特徴量(ベクトル)を、このようにして学習したクラスの分類境界によりクラス分類を行う。すなわち、対象画像の特徴量(ベクトル)が特徴空間において何れかの閉領域に含まれる場合、その画像を閉領域に対応するクラスに分類する。なお、初期状態では、最上位層(第一階層)のクラスでの分類を行う。クラス分類処理回路16は、1枚のキーワード付与の対象画像の処理が終了すると、終了信号を画像枚数測定回路17に入力する。
【0020】
画像枚数測定回路17は、クラス分類処理回路16から入力される終了信号により、何枚のキーワード付与の対象画像が処理されたかを測定している。CPU11は、この画像枚数測定回路17の測定結果により、所定数枚、ここでは100の倍数枚の対象画像を処理したかどうか判別する(ステップS14)。まだ100の倍数枚の対象画像を処理していない場合には、上記ステップS11に戻り、次の対象画像に対する処理を実施する。
【0021】
このようにして、ユーザが撮影した複数枚の対象画像がクラス分類されていく。その結果、図5に示すように、ユーザが撮影した画像に対するクラス分類結果が得られることとなる。
【0022】
なお、1枚の画像から抽出される特徴量(ベクトル)は1つとは限らず、複数の特徴量(ベクトル)が抽出されることもある。そして、抽出された複数の特徴量(ベクトル)は、同一のクラスに分類される場合もあれば、複数のクラスに分類される場合もある。なお、後者の場合は、1枚の画像に複数のキーワードが同時に付与されることになる。
【0023】
そして、上記ステップS14において、100の倍数枚の対象画像を処理したと判別した場合には、CPU11は、例えば分類頻度計測手段として機能する分類頻度計測回路18に、メモリ12に蓄積されているクラス分類済みの画像から、各クラスの分類頻度Zを計測させる(ステップS15)。例えば、分類頻度計測回路18では、既にクラス分類済みの全画像における全体の特徴量の数をm[個]、クラス内の特徴量の数をn[個]とし、
Z = 100 × n / m
により、クラス毎に分類頻度Z[%]を計測する。図5のクラス分類頻度をグラフに表わしたものを図6に示す。こうして計測された各クラスの分類頻度は、例えばキーワード付与手段として機能するキーワード付与回路19の例えばクラス分類修正手段として機能するクラス分類修正回路19Aに入力される。
【0024】
次に、CPU11は、キーワード付与回路19のクラス分類修正回路19Aに、クラス毎に分類頻度がある所定の値α以上であるか否かを判定させる(ステップS16)。このαの値は、全クラスの分類頻度の平均値よりも大きい値が好適である。分類頻度がα以上であるクラスが存在する場合は、CPU11は、クラス分類修正回路19Aに、そのクラスに対してクラス分類修正処理を実施させる(ステップS17)。分類頻度がα以上でないクラスには、このステップS17の処理はスキップされ、CPU11は、クラス分類修正回路19Aに、各クラスに対応するキーワードを付与させる(ステップS18)。
【0025】
図6の例では、クラスによる撮影枚数の偏りが無く、上記ある所定の値α=40とすると、分類頻度Zがα以上となるクラスは存在しないため、クラス分類修正は行われない。従って、図4A又は図4Bにおける第一階層のクラスに分類されたままとなり、メモリ12に蓄積されているクラス分類済みの各画像に対して、その分類されたクラスに対応して「動物」、「風景」又は「人」のキーワードが付与される。この対象画像へのキーワードの付与も、上記クラス分類結果の付加と同様に、対象画像のファイルヘッダ(例えばExif情報)に追記するような形式で、画像と一体的に移動・削除されるように付加することが望ましい。また、ここでは、判り易く説明するために、クラス分類結果とキーワードは同一の用語を用いて説明しているものであり、分類結果は「0001」、「0002」等、互いに区別できるものであれば何でも良い。
【0026】
これにより、CPU11は、図示しない指示入力部のユーザ操作によって任意の画像の表示指示又はキーワード検索による画像の表示指示がなされると、例えば表示制御手段として機能する出力制御回路20に、該当する画像及び当該画像に付与されているキーワードをメモリ12より読み出させて、出力部13に例えば表示出力させることが可能となる(ステップS19)。
【0027】
一方、例えば動物好きのユーザでは、デジタルカメラ10で撮影する画像も動物を撮影したものが多くなるというように、ユーザの趣味や趣向によって画像が偏る。
【0028】
図7は、動物の撮影枚数が多い場合のクラス分類結果の例を示しており、図8は、この図7のクラス分類結果における分類頻度をグラフに表わした図である。この場合には、図8より、「動物」のクラス分類頻度Zがα=40以上となる。従って、上記ステップS16にて分類頻度がα以上であるクラスが存在すると判別されるので、CPU11は、上記ステップS17にて、クラス分類修正回路19Aに、そのクラスに対してクラス分類修正処理を実施させる。
【0029】
クラス分類修正回路19Aも、クラス分類処理回路16と同様に、例えば図3に示したような学習データにより、予め設定されたクラス分類を学習している。そして、この予め学習した結果に基づいて、図9に示すように、「動物」のクラス内に、「犬」、「猫」、「鳥」の分類境界を加え、メモリ12内の「動物」にクラス分類されている全ての画像のそれぞれを対象画像として、再度クラス分類を行うクラス分類修正を実施し、そのクラス分類修正結果を当該対象画像に付加する。このクラス分類修正結果の付加は、既に対象画像に付加されている第一階層のクラス分類を第二階層のクラス分類に更新するよりは、当該対象画像を様々なキーワードによって検索できるようになるので、第一階層のクラス分類に第二階層のクラス分類を追記する方式とすることが好ましい。
【0030】
図10は、この図9のクラス分類修正結果における分類頻度をグラフにした図である。この場合、図10より、「犬」のクラス分類頻度Zがα=40以上であるため、更にこのクラスに対してクラス分類修正処理が施されることなる。すなわち、クラス分類修正回路19Aは、予め学習した結果(図3)に基づいて、図11に示すように、「犬」のクラス内に、「チワワ」、「ブルドッグ」、「柴犬」の分類境界を加え、メモリ12内の「犬」にクラス分類された画像それぞれを対象画像として、再度クラス分類を行うクラス分類修正を実施し、そのクラス分類修正結果を当該対象画像に付加する。このクラス分類修正結果の付加も、既に対象画像に付加されている第一及び第二階層のクラス分類に該第三階層のクラス分類を追記する方式とすることが好ましい。
【0031】
図12は、この図11のクラス分類修正結果における分類頻度をグラフにした図である。なおこの場合、図12より、「チワワ」のクラス分類頻度Zがα=40以上であるが、本実施形態では、三階層分しか階層化して学習していないため、それ以上のクラス分類修正は行わない。勿論、更に下位の階層のクラス分類を、図示しない指示入力部によってユーザが設定したり、図示しない通信部によりインターネット上からダウンロードして設定したりすることで、更なるクラス分類修正を行えるように構成しても良い。
【0032】
このようにしてクラス分類の修正が行われたならば、CPU11は、上記ステップS18にて、クラス分類修正回路19Aに、各クラスに対応するキーワードを付与させることとなる。例えば、図11の例では、「チワワ」にクラス分類された画像には「動物」「犬」「チワワ」の3つのキーワードが付与される。また、「チワワ」、「ブルドッグ」、「柴犬」の何れにもクラス分類されなかった「犬」にクラス分類された画像には、「動物」「犬」の2つのキーワードが付与される。
【0033】
以上のように、クラス分類頻度Zがα未満である場合のクラス分類は、第一階層のクラスに分類され、クラス分類頻度Zがα以上である場合は、下位に存在する階層が解放され、順にクラス分類の修正が行われる。そして、各画像に、その分類されたクラスに対応するキーワードが付与される。
【0034】
なお、上記ステップS19での画像とキーワードの出力部13への表示出力は、例えば図13に示すようにして行われる。すなわち、出力部13は、例えば画像表示部13Aとキーワード表示部13Bとから構成される。
【0035】
ここで、キーワード表示部13Bには、分類された最下位層のクラスに相当するキーワードのみが表示される。例えば、図11の例では、画像がチワワを撮影したものであれば、キーワードとしては「動物」「犬」「チワワ」が付加されているが、出力制御回路20は、その内の「チワワ」を読み出して、キーワード表示部13Bに表示させる。また、画像がキリンを撮影したものであれば、キーワードとしては「動物」のみが付加されており、これが最下位層のクラスに相当するキーワードであるので、出力制御回路20は、その「動物」を読み出して、キーワード表示部13Bに表示させる。
【0036】
また、キーワード表示部13Bには、そのような最下位層からn階層分のクラスに相当するn個のキーワード(例えばn=2で「犬」「チワワ」)を表示させるよいにしても良いし、分類さたれた全階層分のクラスに相当する全てのキーワード(例えば「動物」「犬」「チワワ」)を表示させるようにしても良い。
【0037】
あるいは、それら3種類のキーワード表示形態の中から、ユーザが図示しない指示入力部より選択できるようにしても良い。
【0038】
また、画像が複数のクラスに分類されている場合には、出力制御回路20は、それぞれのクラスに相当するキーワードを読み出して、キーワード表示部13Bに表示させる。例えば、子供とチワワを撮影した画像の場合、最下位層から2階層分のクラスに相当する2個のキーワードを表示する表示形態が選択されていれば、図13の例のように、キーワード表示部13Bには、「人」、「犬」、「チワワ」が表示されることとなる。
【0039】
なお、出力部13は、一つの液晶ディスプレイ上に画像表示部13Aとキーワード表示部13Bとをウィンドウとして表示しても構わない。
【0040】
あるいは、独立した表示部又はウィンドウとして画像とキーワードを並べて表示するのではなく、画像とキーワードを切り替え表示するような表示形態としても良い。
【0041】
以上のように、本第1実施形態によれば、画像から抽出された特徴量に対して付与されたクラス分類の頻度解析を行い、さらに、頻度の高い分類を付与された画像にはより詳細な分類となるようにクラス分類を修正することで、ユーザの趣味や撮影被写体の収集傾向に応じたキーワード付与を行うことが可能となる。
【0042】
[変形例]
本変形例においては、図14に示すように、クラス分類処理回路16は、CPU11及び画像枚数測定回路17に接続されている。画像枚数測定回路17は、CPU11及び分類頻度計測回路18に接続されている。分類頻度計測回路18は、CPU11及びキーワード付与回路19のクラス分類修正回路19Aに接続されている。その他の構成は、上記第1実施形態と同様である。
【0043】
但し、上記第1実施形態では、メモリ12に蓄積されている画像に対して、クラス分類処理回路16よりクラス分類結果の付加、クラス分類修正回路19Aよりクラス分類修正を実施するようにしていたが、本変形例は、画像入力部14で読み出した対象画像を順次後段の回路へ入力していくことで、クラス分類結果付加、クラス分類修正等の処理を該画像に対して実施するようにするものである。そのため、本変形例では、画像枚数測定回路17、分類頻度計測回路18及びクラス分類修正回路19Aは、それぞれ、ある程度の容量(例えば、画像100枚分以上)を持った内部メモリを備えている。
【0044】
すなわち、上記ステップS12において、CPU11は、特徴量抽出回路15に、入力された対象画像から特徴量(ベクトル)を抽出させ、その抽出した特徴量と対象画像とをクラス分類処理回路16へ入力させる。
【0045】
次に、上記ステップS13において、CPU11は、クラス分類処理回路16に、抽出した特徴量(ベクトル)の特徴空間でのクラス分類を行わせ、そのクラス分類結果を、特徴量抽出回路15から入力された対象画像に付加させて、該クラス分類結果が付加された対象画像を画像枚数測定回路17へ入力させる。
【0046】
画像枚数測定回路17は、この入力されたクラス分類結果が付加された対象画像を内部メモリに蓄積していくと共に、その蓄積された対象画像の枚数を計数する機能を備える。而して、上記ステップS14において、CPU11は、この画像枚数測定回路17の計数結果により、所定数枚、ここでは100の倍数枚の対象画像を処理したかどうか判別する。まだ100の倍数枚の対象画像を処理していない場合には、上記ステップS11に戻り、次の対象画像に対する処理を実施する。
【0047】
そして、上記ステップS14にて100の倍数枚の対象画像を処理したと判別した場合には、上記ステップS15において、CPU11は、画像枚数測定回路17の内部メモリに蓄積されているクラス分類結果が付加された画像を、分類頻度計測回路18の内部メモリに転送させ、該分類頻度計測回路18に、それらの画像から各クラスの分類頻度Zを計測させる。
【0048】
次に、上記ステップS16において、CPU11は、分類頻度計測回路18の内部メモリ蓄積されているクラス分類結果が付加された画像を、クラス分類修正回路19Aの内部メモリに転送させ、該クラス分類修正回路19Aに、クラス毎に分類頻度がある所定の値α以上であるか否かを判定させる。そして、分類頻度がα以上であるクラスが存在する場合は、CPU11は、クラス分類修正回路19Aに、そのクラスに対してクラス分類修正処理を実施させる(ステップS17)。分類頻度がα以上でないクラスには、このステップS17の処理はスキップされ、CPU11は、クラス分類修正回路19Aに、各クラスに対応するキーワードを付与させ、キーワードを付与した画像を、メモリ12に記憶されている対応画像と置換して蓄積する(ステップS18)。
【0049】
図6の例では、クラスによる撮影枚数の偏りが無く、上記ある所定の値α=40とすると、分類頻度Zがα以上となるクラスは存在しないため、クラス分類修正は行われない。従って、図4A又は図4Bにおける第一階層のクラスに分類されたままとなり、クラス分類修正回路19Aの内部メモリに蓄積されているクラス分類済みの各画像に対して、その分類されたクラスに対応して「動物」、「風景」又は「人」のキーワードが付与される。この対象画像へのキーワードの付与は、上記第1実施形態のように、クラス分類結果の付加と同様に、対象画像のファイルヘッダ(例えばExif情報)に追記するような形式で、画像と一体的に移動・削除されるように付加するようにしても良いが、上記クラス分類結果をこのキーワードに置換するようにしても良い。
【0050】
また、図8の例では、「動物」のクラス分類頻度Zがα=40以上となるため、クラス分類修正回路19Aにて、上記第1実施形態で説明したように、そのクラスに対してクラス分類修正処理が実施され、そのクラス分類の修正が行われた各画像に対して、その修正された分類されたクラスに対応して、例えば、図11の例では、「チワワ」にクラス分類された画像には「動物」「犬」「チワワ」の3つのキーワードが付与され、また、「チワワ」、「ブルドッグ」、「柴犬」の何れにもクラス分類されなかった「犬」にクラス分類された画像には、「動物」「犬」の2つのキーワードが付与される。
【0051】
こうして、クラス分類修正回路19Aは、その内部メモリに記憶した各画像に対してキーワードを付与し、それらキーワードを付与した画像を、メモリ12に記憶されている対応画像と置換することで、メモリ12に蓄積する。
【0052】
以上のように、本変形例によっても、上記第1実施形態と同様に、画像から抽出された特徴量に対して付与されたクラス分類の頻度解析を行い、さらに、頻度の高い分類を付与された画像にはより詳細な分類となるようにクラス分類を修正することで、ユーザの趣味や撮影被写体の収集傾向に応じたキーワード付与を行うことが可能となる。
【0053】
[第2実施形態]
図15に示すように、本発明の第2実施形態に係るキーワード付与装置が適用されたデジタルカメラ10は、キーワード付与回路19が、上記第1実施形態におけるクラス分類修正回路19Aに代えて、クラス分類選択回路19Bを備えている。
【0054】
また、上記第1実施形態では、クラス分類処理回路16は第一階層のクラス分類を行うのみであり、頻度が高くなるとキーワード付与回路19のクラス分類修正回路19Aでクラス分類を修正するものとしていた。これに対して、本実施形態では、クラス分類処理回路16は、キーワード付与対象画像について、上記第1実施形態のようにして予め学習した階層の全てのクラス分類を行ってしまい、キーワード付与回路19の例えばクラス分類選択手段として機能するクラス分類選択回路19Bが、頻度に応じた階層のクラス分類を選択して、キーワードを付与するようにしている。
【0055】
従って、クラス分類処理回路16は、キーワード付与対象画像が、例えばチワワを撮影した画像であれば、「動物」「犬」「チワワ」のクラス分類結果を付与し、0歳の赤ちゃんを撮影した画像であれば、「人」「赤ちゃん」「0歳」のクラス分類結果を付与することとなる。
【0056】
そして、キーワード付与回路19のクラス分類選択回路19Bは、分類頻度計測回路18で計測されたクラス毎の分類頻度Zに従って、それぞれの画像について、クラス分類の内の何れを最下位層とするかを選択し、その選択結果に従ったキーワードを当該画像に付加する。従って、例えば上記チワワを撮影した画像では、「チワワ」のクラス分類が最下位層として選択されるので、「動物」「犬」「チワワ」のキーワードが付与されることとなり、上記0歳の赤ちゃんを撮影した画像であれば、「人」「赤ちゃん」「0歳」のクラス分類結果が付与されるが、第一階層の「人」のクラス分類頻度Zがα=40以上ではないので、第一階層が最下位層であるとして選択され、「人」のキーワードのみが付与されることとなる。
【0057】
以上のように、本第2実施形態によれば、画像から抽出された特徴量に対して複数階層のクラス分類を行って分類を付与し、その付与されたクラス分類の頻度解析を行い、さらに、頻度の高い分類が付与された画像ほどより詳細な分類となるようにクラス分類を選択することで、ユーザの趣味や撮影被写体の収集傾向に応じたキーワード付与を行うことが可能となる。
【0058】
なお、本第2実施形態においても、メモリ12に蓄積された画像に対してクラス分類を付加し、該クラス分類が付加されたメモリ12の蓄積画像に対してキーワードを付与するのではなく、上記第1実施形態の変形例として説明したように、メモリ12から読み出した処理途中の対象画像にクラス分類を付与し、結果としてのキーワードが付与された画像をメモリ12に置換保存するというような変形が可能なことは言うまでもない。
【0059】
以上実施形態に基づいて本発明を説明したが、本発明は上述した実施形態に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。
【0060】
例えば、クラス分類頻度は、既にクラス分類済みの全画像における特徴量の個数に対する各クラスの特徴量の個数の割合としたが、単純に、各クラスの特徴量の個数(画像枚数)としても良い。この場合のある所定の値αは、全体の撮影画像枚数に関わらず一定の値としても良いし、ユーザが設定しても良い。
【0061】
また、第1実施形態におけるクラス分類修正回路19A又は第2実施形態におけるクラス分類処理回路16は、第一階層から最下位層(図4A及び図4Bの例では第三階層)まで、全てのクラスを予め学習設定するものとしたが、例えば第一階層のみを予め学習設定しておき、第二階層以下はユーザが設定またはインターネット上からダウンロードして設定するように構成しても良い。
【0062】
さらに、予め人間によって正しいキーワードを付与された画像(学習データ)を用いてラス分類を学習する例を説明したが、予め学習データから作成した判別式を学習する等、学習の手法は限定しない。
【0063】
また、所定枚数(例えば100枚)のキーワード付与対象画像をクラス分類する毎に分類頻度を計測するものとしたが、予め決められた枚数以上、対象画像をクラス分類したならば、それ以降の対象画像をクラス分類する毎に分類頻度を計測するようにしても良い。後者の場合、上記ステップS14の判断を、撮影枚数が予め決められた枚数以上か否かを判別するように修正すれば良い。
【0064】
また、デジタルカメラ10に適用した場合を例に説明したが、画像入力部14乃至キーワード付与回路19の機能を実現するソフトウェアのプログラムをコンピュータに供給し、当該コンピュータがこのプログラムを実行することによって、コンピュータの記録媒体上に蓄積した画像に対してキーワード付与を行う機能をコンピュータに実行させることも可能である。
【符号の説明】
【0065】
10…デジタルカメラ、 11…CPU、 12…メモリ、 13…出力部、 13A…画像表示部、 13B…キーワード表示部、 14…画像入力部、 15…特徴量抽出回路、 16…クラス分類処理回路、 17…画像枚数測定回路、 18…分類頻度計測回路、 19…キーワード付与回路、 19A…クラス分類修正回路、 19B…クラス分類選択回路、 20…出力制御回路。
【技術分野】
【0001】
本発明は、画像の特徴量を抽出し、特徴量によって画像を識別しキーワードを自動的に付与するキーワード付与装置、及び、コンピュータをそのようなキーワード付与装置として機能させるためのプログラムに関する。
【背景技術】
【0002】
近年、メモリ等の記録媒体の大容量化及び低価格化に伴い、デジタルカメラで撮影した画像がデジタルカメラ内に、大量に蓄積されるようになってきている。また、そのような撮影した画像は、パーソナルコンピュータ等の外部機器に転送して蓄積され、更には、該外部機器内には、そのようなユーザがデジタルカメラで撮影した画像だけでなく、インターネット等を介して収集した画像も蓄積されることとなっている。
【0003】
そこで、各画像にキーワードを付しておき、キーワード検索を行うことによって、デジタルカメラ内或いは外部機器内に大量に蓄積されている画像の中から、ユーザが所望の画像を容易に検索できるようにすることが行われている。このキーワードは、ユーザが画像を撮影又は収集する毎に付与するのであれば、それほど手間はかからないが、既に撮影又は収集されて蓄積されている大量の画像に対して、逐一キーワードを付与していくという操作は非常に煩雑であり、時間がかかってしまうものであった。
【0004】
そこで、例えば、特許文献1は、キーワード付与の対象となる画像に類似する類似画像を検索抽出し、その抽出された類似画像に付与されているキーワードを対象画像にも付与することで、自動的にキーワードを付与することができる手法を提案している。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第3683481号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、ユーザが撮影や収集する画像は、ユーザの趣味や趣向に強く依存し、偏る傾向があるため、特定のキーワードが偏って付与される可能性が高い。この場合、同じキーワードが付与された画像ばかりが膨大な量になり、キーワードを用いて画像の検索や整理を行うことは困難になってしまう。
【0007】
本発明は、上記の点に鑑みてなされたもので、ユーザの趣味や趣向に沿って、類似した画像に対して分類し易いキーワードを各画像に付与することが可能なキーワード付与装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明のキーワード付与装置の一態様は、
入力画像から特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段と、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段と、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段と、
を具備することを特徴とする。
また、本発明のプログラムの一態様は、コンピュータを、
入力画像から特徴量を抽出する特徴量抽出手段、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段、
として機能させるためのプログラムであることを特徴とする。
【発明の効果】
【0009】
本発明によれば、クラス分類結果と頻度とを考慮してキーワードを付与するので、頻度が高い類似画像には別のキーワードを付与することができるようになり、ユーザの趣味や趣向に沿って、類似した画像に対して分類し易いキーワードを各画像に付与することが可能なキーワード付与装置及びプログラムを提供することができる。
【図面の簡単な説明】
【0010】
【図1】図1は、本発明の第1実施形態に係るキーワード付与装置が適用されたデジタルカメラの構成を示す図である。
【図2】図2は、第1実施形態に係るキーワード付与装置が適用されたデジタルカメラの動作を説明するためのフローチャートを示す図である。
【図3】図3は、特徴空間における学習データの分布の例を示す図である。
【図4A】図4Aは、図3のクラス分類に対応する分類木の例を表わした図である。
【図4B】図4Bは、図3のクラス分類に対応する分類木の別の例を表わした図である。
【図5】図5は、ユーザが撮影した画像に対するクラス分類結果の例を示す図である。
【図6】図6は、図5の例における分類頻度を示す図である。
【図7】図7は、動物好きのユーザが撮影した画像に対するクラス分類結果の例を示す図である。
【図8】図8は、図7の例における分類頻度を示す図である。
【図9】図9は、図7の例のクラス分類結果に対しクラス分類修正を行った結果を示す図である。
【図10】図10は、図9のクラス分類修正結果における分類頻度を示す図である。
【図11】図11は、図9の例のクラス分類修正結果に対し更にクラス分類修正を行った結果を示す図である。
【図12】図12は、図11のクラス分類修正結果における分類頻度を示す図である。
【図13】図13は、表示出力例を示す図である。
【図14】図14は、本発明の第1実施形態の変形例に係るキーワード付与装置が適用されたデジタルカメラの構成を示す図である。
【図15】図15は、本発明の第2実施形態に係るキーワード付与装置が適用されたデジタルカメラの構成を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明を実施するための形態を図面を参照して説明する。
[第1実施形態]
図1に示すように、本発明の第1実施形態に係るキーワード付与装置が適用されたデジタルカメラ10は、当該デジタルカメラ10全体を制御するCPU11と、撮影した画像を記録しておくメモリ12と、該メモリ12に記録された画像や所謂スルー画を表示するための液晶モニタ等の出力部13と、を備える。なお、画像撮影のための構成については、周知であるので、その説明及び図示は省略する。
【0012】
デジタルカメラ10は、更に、画像入力部14、特徴量抽出回路15、クラス分類処理回路16、画像枚数測定回路17、分類頻度計測回路18、キーワード付与回路19、及び出力制御回路20を備える。ここで、キーワード付与回路19は、クラス分類修正回路19Aを有している。
【0013】
画像入力部14は、CPU11、メモリ12及び特徴量抽出回路15に接続されている。特徴量抽出回路15は、CPU11及びクラス分類処理回路16に接続されている。クラス分類処理回路16は、CPU11、メモリ12及び画像枚数測定回路17に接続されている。画像枚数測定回路17は、CPU11に接続されている。分類頻度計測回路18は、CPU11、メモリ12及びキーワード付与回路19のクラス分類修正回路19Aに接続されている。キーワード付与回路19のクラス分類修正回路19Aは、CPU11及びメモリ12に接続されている。出力制御回路20は、CPU11、メモリ12及び出力部13に接続されている。
【0014】
以下、このような構成における動作を、図2のフローチャートに沿って説明する。
【0015】
CPU11は、画像入力部14に、メモリ12からキーワード付与の対象となる画像を読み出させ、その読み出した対象画像を、例えば特徴量抽出手段として機能する特徴量抽出回路15へ入力させる(ステップS11)。次に、CPU11は、特徴量抽出回路15に、入力された画像から特徴量(ベクトル)を抽出させ、その抽出した特徴量を、例えばクラス分類手段として機能するクラス分類処理回路16へ入力させる(ステップS12)。
【0016】
次に、CPU11は、クラス分類処理回路16に、抽出した特徴量(ベクトル)の特徴空間でのクラス分類を行わせ、そのクラス分類結果をメモリ12の当該対象画像に付加させると共に、画像枚数測定回路17へ終了信号を入力させる(ステップS13)。ここで、対象画像へのクラス分類結果の付加は、テーブルに記録することで対象画像に関連付けるものであっても良いが、パーソナルコンピュータ等の外部機器への対象画像の移動等を考慮して、対象画像のファイルヘッダ(例えばExif情報)に追記するような形式で、画像と一体的に移動・削除されるように付加することが望ましい。
【0017】
ここで、クラス分類について、詳細に説明する。
クラス分類処理回路16は、予め設定されたクラス分類を学習している。その学習過程では、先ず、予め人間によって正しいキーワードを付与された画像(学習データ)を用意し、これらの画像から特徴量(ベクトル)を抽出して、クラス分類処理回路16に入力する。ここで、特徴量は、色相、彩度、輝度、形状、大きさ、位置、など画像自体に含まれる様々の特徴量や、Exif情報に含まれるISO感度等の撮影情報のような画像に付加されている様々の特徴量の中から、学習データの分類に適した如何なる特徴量を用いても良い。なお、上記特徴量抽出回路15は、この学習過程で採用した特徴量を抽出するものとなっている。そして、クラス分類処理回路16では、入力された画像(学習データ)の特徴量(ベクトル)を、図3に示すように特徴空間に配置し、同じキーワードを付与された画像が特徴空間で同じクラスに分類されるよう、分類境界を形成する。このクラス分類には如何なる手法を用いても良いが、例えばk−近傍法を用いる。図3において×印が各学習データに対応し、閉領域が各キーワードに対応するクラスの分類境界を表す。なお、図3の特徴空間は、簡略化のために2次元空間として示しているだけであり、実際にはN次元空間である。ここでNは任意の自然数を表している。
【0018】
また、人間が画像に付与するキーワードは、例えば、図4A或いは図4Bに示すような階層構造を持っており、上位の階層のキーワードは特徴空間においてより大きな領域を占め、下位の階層のキーワードの領域を包含する。なお、これら図4A或いは図4Bに示す分類木は一例に過ぎず、キーワードや階層数はこれに限定されないことは勿論である。
【0019】
クラス分類処理回路16は、CPU11の制御の下、上記特徴量抽出回路15から入力されたキーワード付与の対象画像の特徴量(ベクトル)を、このようにして学習したクラスの分類境界によりクラス分類を行う。すなわち、対象画像の特徴量(ベクトル)が特徴空間において何れかの閉領域に含まれる場合、その画像を閉領域に対応するクラスに分類する。なお、初期状態では、最上位層(第一階層)のクラスでの分類を行う。クラス分類処理回路16は、1枚のキーワード付与の対象画像の処理が終了すると、終了信号を画像枚数測定回路17に入力する。
【0020】
画像枚数測定回路17は、クラス分類処理回路16から入力される終了信号により、何枚のキーワード付与の対象画像が処理されたかを測定している。CPU11は、この画像枚数測定回路17の測定結果により、所定数枚、ここでは100の倍数枚の対象画像を処理したかどうか判別する(ステップS14)。まだ100の倍数枚の対象画像を処理していない場合には、上記ステップS11に戻り、次の対象画像に対する処理を実施する。
【0021】
このようにして、ユーザが撮影した複数枚の対象画像がクラス分類されていく。その結果、図5に示すように、ユーザが撮影した画像に対するクラス分類結果が得られることとなる。
【0022】
なお、1枚の画像から抽出される特徴量(ベクトル)は1つとは限らず、複数の特徴量(ベクトル)が抽出されることもある。そして、抽出された複数の特徴量(ベクトル)は、同一のクラスに分類される場合もあれば、複数のクラスに分類される場合もある。なお、後者の場合は、1枚の画像に複数のキーワードが同時に付与されることになる。
【0023】
そして、上記ステップS14において、100の倍数枚の対象画像を処理したと判別した場合には、CPU11は、例えば分類頻度計測手段として機能する分類頻度計測回路18に、メモリ12に蓄積されているクラス分類済みの画像から、各クラスの分類頻度Zを計測させる(ステップS15)。例えば、分類頻度計測回路18では、既にクラス分類済みの全画像における全体の特徴量の数をm[個]、クラス内の特徴量の数をn[個]とし、
Z = 100 × n / m
により、クラス毎に分類頻度Z[%]を計測する。図5のクラス分類頻度をグラフに表わしたものを図6に示す。こうして計測された各クラスの分類頻度は、例えばキーワード付与手段として機能するキーワード付与回路19の例えばクラス分類修正手段として機能するクラス分類修正回路19Aに入力される。
【0024】
次に、CPU11は、キーワード付与回路19のクラス分類修正回路19Aに、クラス毎に分類頻度がある所定の値α以上であるか否かを判定させる(ステップS16)。このαの値は、全クラスの分類頻度の平均値よりも大きい値が好適である。分類頻度がα以上であるクラスが存在する場合は、CPU11は、クラス分類修正回路19Aに、そのクラスに対してクラス分類修正処理を実施させる(ステップS17)。分類頻度がα以上でないクラスには、このステップS17の処理はスキップされ、CPU11は、クラス分類修正回路19Aに、各クラスに対応するキーワードを付与させる(ステップS18)。
【0025】
図6の例では、クラスによる撮影枚数の偏りが無く、上記ある所定の値α=40とすると、分類頻度Zがα以上となるクラスは存在しないため、クラス分類修正は行われない。従って、図4A又は図4Bにおける第一階層のクラスに分類されたままとなり、メモリ12に蓄積されているクラス分類済みの各画像に対して、その分類されたクラスに対応して「動物」、「風景」又は「人」のキーワードが付与される。この対象画像へのキーワードの付与も、上記クラス分類結果の付加と同様に、対象画像のファイルヘッダ(例えばExif情報)に追記するような形式で、画像と一体的に移動・削除されるように付加することが望ましい。また、ここでは、判り易く説明するために、クラス分類結果とキーワードは同一の用語を用いて説明しているものであり、分類結果は「0001」、「0002」等、互いに区別できるものであれば何でも良い。
【0026】
これにより、CPU11は、図示しない指示入力部のユーザ操作によって任意の画像の表示指示又はキーワード検索による画像の表示指示がなされると、例えば表示制御手段として機能する出力制御回路20に、該当する画像及び当該画像に付与されているキーワードをメモリ12より読み出させて、出力部13に例えば表示出力させることが可能となる(ステップS19)。
【0027】
一方、例えば動物好きのユーザでは、デジタルカメラ10で撮影する画像も動物を撮影したものが多くなるというように、ユーザの趣味や趣向によって画像が偏る。
【0028】
図7は、動物の撮影枚数が多い場合のクラス分類結果の例を示しており、図8は、この図7のクラス分類結果における分類頻度をグラフに表わした図である。この場合には、図8より、「動物」のクラス分類頻度Zがα=40以上となる。従って、上記ステップS16にて分類頻度がα以上であるクラスが存在すると判別されるので、CPU11は、上記ステップS17にて、クラス分類修正回路19Aに、そのクラスに対してクラス分類修正処理を実施させる。
【0029】
クラス分類修正回路19Aも、クラス分類処理回路16と同様に、例えば図3に示したような学習データにより、予め設定されたクラス分類を学習している。そして、この予め学習した結果に基づいて、図9に示すように、「動物」のクラス内に、「犬」、「猫」、「鳥」の分類境界を加え、メモリ12内の「動物」にクラス分類されている全ての画像のそれぞれを対象画像として、再度クラス分類を行うクラス分類修正を実施し、そのクラス分類修正結果を当該対象画像に付加する。このクラス分類修正結果の付加は、既に対象画像に付加されている第一階層のクラス分類を第二階層のクラス分類に更新するよりは、当該対象画像を様々なキーワードによって検索できるようになるので、第一階層のクラス分類に第二階層のクラス分類を追記する方式とすることが好ましい。
【0030】
図10は、この図9のクラス分類修正結果における分類頻度をグラフにした図である。この場合、図10より、「犬」のクラス分類頻度Zがα=40以上であるため、更にこのクラスに対してクラス分類修正処理が施されることなる。すなわち、クラス分類修正回路19Aは、予め学習した結果(図3)に基づいて、図11に示すように、「犬」のクラス内に、「チワワ」、「ブルドッグ」、「柴犬」の分類境界を加え、メモリ12内の「犬」にクラス分類された画像それぞれを対象画像として、再度クラス分類を行うクラス分類修正を実施し、そのクラス分類修正結果を当該対象画像に付加する。このクラス分類修正結果の付加も、既に対象画像に付加されている第一及び第二階層のクラス分類に該第三階層のクラス分類を追記する方式とすることが好ましい。
【0031】
図12は、この図11のクラス分類修正結果における分類頻度をグラフにした図である。なおこの場合、図12より、「チワワ」のクラス分類頻度Zがα=40以上であるが、本実施形態では、三階層分しか階層化して学習していないため、それ以上のクラス分類修正は行わない。勿論、更に下位の階層のクラス分類を、図示しない指示入力部によってユーザが設定したり、図示しない通信部によりインターネット上からダウンロードして設定したりすることで、更なるクラス分類修正を行えるように構成しても良い。
【0032】
このようにしてクラス分類の修正が行われたならば、CPU11は、上記ステップS18にて、クラス分類修正回路19Aに、各クラスに対応するキーワードを付与させることとなる。例えば、図11の例では、「チワワ」にクラス分類された画像には「動物」「犬」「チワワ」の3つのキーワードが付与される。また、「チワワ」、「ブルドッグ」、「柴犬」の何れにもクラス分類されなかった「犬」にクラス分類された画像には、「動物」「犬」の2つのキーワードが付与される。
【0033】
以上のように、クラス分類頻度Zがα未満である場合のクラス分類は、第一階層のクラスに分類され、クラス分類頻度Zがα以上である場合は、下位に存在する階層が解放され、順にクラス分類の修正が行われる。そして、各画像に、その分類されたクラスに対応するキーワードが付与される。
【0034】
なお、上記ステップS19での画像とキーワードの出力部13への表示出力は、例えば図13に示すようにして行われる。すなわち、出力部13は、例えば画像表示部13Aとキーワード表示部13Bとから構成される。
【0035】
ここで、キーワード表示部13Bには、分類された最下位層のクラスに相当するキーワードのみが表示される。例えば、図11の例では、画像がチワワを撮影したものであれば、キーワードとしては「動物」「犬」「チワワ」が付加されているが、出力制御回路20は、その内の「チワワ」を読み出して、キーワード表示部13Bに表示させる。また、画像がキリンを撮影したものであれば、キーワードとしては「動物」のみが付加されており、これが最下位層のクラスに相当するキーワードであるので、出力制御回路20は、その「動物」を読み出して、キーワード表示部13Bに表示させる。
【0036】
また、キーワード表示部13Bには、そのような最下位層からn階層分のクラスに相当するn個のキーワード(例えばn=2で「犬」「チワワ」)を表示させるよいにしても良いし、分類さたれた全階層分のクラスに相当する全てのキーワード(例えば「動物」「犬」「チワワ」)を表示させるようにしても良い。
【0037】
あるいは、それら3種類のキーワード表示形態の中から、ユーザが図示しない指示入力部より選択できるようにしても良い。
【0038】
また、画像が複数のクラスに分類されている場合には、出力制御回路20は、それぞれのクラスに相当するキーワードを読み出して、キーワード表示部13Bに表示させる。例えば、子供とチワワを撮影した画像の場合、最下位層から2階層分のクラスに相当する2個のキーワードを表示する表示形態が選択されていれば、図13の例のように、キーワード表示部13Bには、「人」、「犬」、「チワワ」が表示されることとなる。
【0039】
なお、出力部13は、一つの液晶ディスプレイ上に画像表示部13Aとキーワード表示部13Bとをウィンドウとして表示しても構わない。
【0040】
あるいは、独立した表示部又はウィンドウとして画像とキーワードを並べて表示するのではなく、画像とキーワードを切り替え表示するような表示形態としても良い。
【0041】
以上のように、本第1実施形態によれば、画像から抽出された特徴量に対して付与されたクラス分類の頻度解析を行い、さらに、頻度の高い分類を付与された画像にはより詳細な分類となるようにクラス分類を修正することで、ユーザの趣味や撮影被写体の収集傾向に応じたキーワード付与を行うことが可能となる。
【0042】
[変形例]
本変形例においては、図14に示すように、クラス分類処理回路16は、CPU11及び画像枚数測定回路17に接続されている。画像枚数測定回路17は、CPU11及び分類頻度計測回路18に接続されている。分類頻度計測回路18は、CPU11及びキーワード付与回路19のクラス分類修正回路19Aに接続されている。その他の構成は、上記第1実施形態と同様である。
【0043】
但し、上記第1実施形態では、メモリ12に蓄積されている画像に対して、クラス分類処理回路16よりクラス分類結果の付加、クラス分類修正回路19Aよりクラス分類修正を実施するようにしていたが、本変形例は、画像入力部14で読み出した対象画像を順次後段の回路へ入力していくことで、クラス分類結果付加、クラス分類修正等の処理を該画像に対して実施するようにするものである。そのため、本変形例では、画像枚数測定回路17、分類頻度計測回路18及びクラス分類修正回路19Aは、それぞれ、ある程度の容量(例えば、画像100枚分以上)を持った内部メモリを備えている。
【0044】
すなわち、上記ステップS12において、CPU11は、特徴量抽出回路15に、入力された対象画像から特徴量(ベクトル)を抽出させ、その抽出した特徴量と対象画像とをクラス分類処理回路16へ入力させる。
【0045】
次に、上記ステップS13において、CPU11は、クラス分類処理回路16に、抽出した特徴量(ベクトル)の特徴空間でのクラス分類を行わせ、そのクラス分類結果を、特徴量抽出回路15から入力された対象画像に付加させて、該クラス分類結果が付加された対象画像を画像枚数測定回路17へ入力させる。
【0046】
画像枚数測定回路17は、この入力されたクラス分類結果が付加された対象画像を内部メモリに蓄積していくと共に、その蓄積された対象画像の枚数を計数する機能を備える。而して、上記ステップS14において、CPU11は、この画像枚数測定回路17の計数結果により、所定数枚、ここでは100の倍数枚の対象画像を処理したかどうか判別する。まだ100の倍数枚の対象画像を処理していない場合には、上記ステップS11に戻り、次の対象画像に対する処理を実施する。
【0047】
そして、上記ステップS14にて100の倍数枚の対象画像を処理したと判別した場合には、上記ステップS15において、CPU11は、画像枚数測定回路17の内部メモリに蓄積されているクラス分類結果が付加された画像を、分類頻度計測回路18の内部メモリに転送させ、該分類頻度計測回路18に、それらの画像から各クラスの分類頻度Zを計測させる。
【0048】
次に、上記ステップS16において、CPU11は、分類頻度計測回路18の内部メモリ蓄積されているクラス分類結果が付加された画像を、クラス分類修正回路19Aの内部メモリに転送させ、該クラス分類修正回路19Aに、クラス毎に分類頻度がある所定の値α以上であるか否かを判定させる。そして、分類頻度がα以上であるクラスが存在する場合は、CPU11は、クラス分類修正回路19Aに、そのクラスに対してクラス分類修正処理を実施させる(ステップS17)。分類頻度がα以上でないクラスには、このステップS17の処理はスキップされ、CPU11は、クラス分類修正回路19Aに、各クラスに対応するキーワードを付与させ、キーワードを付与した画像を、メモリ12に記憶されている対応画像と置換して蓄積する(ステップS18)。
【0049】
図6の例では、クラスによる撮影枚数の偏りが無く、上記ある所定の値α=40とすると、分類頻度Zがα以上となるクラスは存在しないため、クラス分類修正は行われない。従って、図4A又は図4Bにおける第一階層のクラスに分類されたままとなり、クラス分類修正回路19Aの内部メモリに蓄積されているクラス分類済みの各画像に対して、その分類されたクラスに対応して「動物」、「風景」又は「人」のキーワードが付与される。この対象画像へのキーワードの付与は、上記第1実施形態のように、クラス分類結果の付加と同様に、対象画像のファイルヘッダ(例えばExif情報)に追記するような形式で、画像と一体的に移動・削除されるように付加するようにしても良いが、上記クラス分類結果をこのキーワードに置換するようにしても良い。
【0050】
また、図8の例では、「動物」のクラス分類頻度Zがα=40以上となるため、クラス分類修正回路19Aにて、上記第1実施形態で説明したように、そのクラスに対してクラス分類修正処理が実施され、そのクラス分類の修正が行われた各画像に対して、その修正された分類されたクラスに対応して、例えば、図11の例では、「チワワ」にクラス分類された画像には「動物」「犬」「チワワ」の3つのキーワードが付与され、また、「チワワ」、「ブルドッグ」、「柴犬」の何れにもクラス分類されなかった「犬」にクラス分類された画像には、「動物」「犬」の2つのキーワードが付与される。
【0051】
こうして、クラス分類修正回路19Aは、その内部メモリに記憶した各画像に対してキーワードを付与し、それらキーワードを付与した画像を、メモリ12に記憶されている対応画像と置換することで、メモリ12に蓄積する。
【0052】
以上のように、本変形例によっても、上記第1実施形態と同様に、画像から抽出された特徴量に対して付与されたクラス分類の頻度解析を行い、さらに、頻度の高い分類を付与された画像にはより詳細な分類となるようにクラス分類を修正することで、ユーザの趣味や撮影被写体の収集傾向に応じたキーワード付与を行うことが可能となる。
【0053】
[第2実施形態]
図15に示すように、本発明の第2実施形態に係るキーワード付与装置が適用されたデジタルカメラ10は、キーワード付与回路19が、上記第1実施形態におけるクラス分類修正回路19Aに代えて、クラス分類選択回路19Bを備えている。
【0054】
また、上記第1実施形態では、クラス分類処理回路16は第一階層のクラス分類を行うのみであり、頻度が高くなるとキーワード付与回路19のクラス分類修正回路19Aでクラス分類を修正するものとしていた。これに対して、本実施形態では、クラス分類処理回路16は、キーワード付与対象画像について、上記第1実施形態のようにして予め学習した階層の全てのクラス分類を行ってしまい、キーワード付与回路19の例えばクラス分類選択手段として機能するクラス分類選択回路19Bが、頻度に応じた階層のクラス分類を選択して、キーワードを付与するようにしている。
【0055】
従って、クラス分類処理回路16は、キーワード付与対象画像が、例えばチワワを撮影した画像であれば、「動物」「犬」「チワワ」のクラス分類結果を付与し、0歳の赤ちゃんを撮影した画像であれば、「人」「赤ちゃん」「0歳」のクラス分類結果を付与することとなる。
【0056】
そして、キーワード付与回路19のクラス分類選択回路19Bは、分類頻度計測回路18で計測されたクラス毎の分類頻度Zに従って、それぞれの画像について、クラス分類の内の何れを最下位層とするかを選択し、その選択結果に従ったキーワードを当該画像に付加する。従って、例えば上記チワワを撮影した画像では、「チワワ」のクラス分類が最下位層として選択されるので、「動物」「犬」「チワワ」のキーワードが付与されることとなり、上記0歳の赤ちゃんを撮影した画像であれば、「人」「赤ちゃん」「0歳」のクラス分類結果が付与されるが、第一階層の「人」のクラス分類頻度Zがα=40以上ではないので、第一階層が最下位層であるとして選択され、「人」のキーワードのみが付与されることとなる。
【0057】
以上のように、本第2実施形態によれば、画像から抽出された特徴量に対して複数階層のクラス分類を行って分類を付与し、その付与されたクラス分類の頻度解析を行い、さらに、頻度の高い分類が付与された画像ほどより詳細な分類となるようにクラス分類を選択することで、ユーザの趣味や撮影被写体の収集傾向に応じたキーワード付与を行うことが可能となる。
【0058】
なお、本第2実施形態においても、メモリ12に蓄積された画像に対してクラス分類を付加し、該クラス分類が付加されたメモリ12の蓄積画像に対してキーワードを付与するのではなく、上記第1実施形態の変形例として説明したように、メモリ12から読み出した処理途中の対象画像にクラス分類を付与し、結果としてのキーワードが付与された画像をメモリ12に置換保存するというような変形が可能なことは言うまでもない。
【0059】
以上実施形態に基づいて本発明を説明したが、本発明は上述した実施形態に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。
【0060】
例えば、クラス分類頻度は、既にクラス分類済みの全画像における特徴量の個数に対する各クラスの特徴量の個数の割合としたが、単純に、各クラスの特徴量の個数(画像枚数)としても良い。この場合のある所定の値αは、全体の撮影画像枚数に関わらず一定の値としても良いし、ユーザが設定しても良い。
【0061】
また、第1実施形態におけるクラス分類修正回路19A又は第2実施形態におけるクラス分類処理回路16は、第一階層から最下位層(図4A及び図4Bの例では第三階層)まで、全てのクラスを予め学習設定するものとしたが、例えば第一階層のみを予め学習設定しておき、第二階層以下はユーザが設定またはインターネット上からダウンロードして設定するように構成しても良い。
【0062】
さらに、予め人間によって正しいキーワードを付与された画像(学習データ)を用いてラス分類を学習する例を説明したが、予め学習データから作成した判別式を学習する等、学習の手法は限定しない。
【0063】
また、所定枚数(例えば100枚)のキーワード付与対象画像をクラス分類する毎に分類頻度を計測するものとしたが、予め決められた枚数以上、対象画像をクラス分類したならば、それ以降の対象画像をクラス分類する毎に分類頻度を計測するようにしても良い。後者の場合、上記ステップS14の判断を、撮影枚数が予め決められた枚数以上か否かを判別するように修正すれば良い。
【0064】
また、デジタルカメラ10に適用した場合を例に説明したが、画像入力部14乃至キーワード付与回路19の機能を実現するソフトウェアのプログラムをコンピュータに供給し、当該コンピュータがこのプログラムを実行することによって、コンピュータの記録媒体上に蓄積した画像に対してキーワード付与を行う機能をコンピュータに実行させることも可能である。
【符号の説明】
【0065】
10…デジタルカメラ、 11…CPU、 12…メモリ、 13…出力部、 13A…画像表示部、 13B…キーワード表示部、 14…画像入力部、 15…特徴量抽出回路、 16…クラス分類処理回路、 17…画像枚数測定回路、 18…分類頻度計測回路、 19…キーワード付与回路、 19A…クラス分類修正回路、 19B…クラス分類選択回路、 20…出力制御回路。
【特許請求の範囲】
【請求項1】
入力画像から特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段と、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段と、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段と、
を具備することを特徴とするキーワード付与装置。
【請求項2】
前記キーワード付与手段は、前記分類頻度計測手段で計測した頻度に応じて、前記クラス分類手段で分類したクラス分類を修正するクラス分類修正手段を含む請求項1に記載のキーワード付与装置。
【請求項3】
前記クラス分類は、階層化されており、
前記クラス分類修正手段は、前記分類頻度計測手段で計測した頻度が所定の値よりも高いクラスに対して、前記クラス分類手段で分類したクラス分類よりも細かい分類のクラス分類を含む階層でクラス分類を行うことを特徴とする請求項2に記載のキーワード付与装置。
【請求項4】
前記キーワード付与手段は、前記分類頻度計測手段で計測した頻度が前記所定の値よりも高いクラスが存在しない場合は、前記クラス分類手段で分類したクラス分類に対応するキーワードを前記入力画像に付与することを特徴とする請求項3に記載のキーワード付与装置。
【請求項5】
前記キーワード付与手段は、前記クラス分類修正手段でクラス分類が修正された場合、既にクラス分類済みの前記入力画像以外の画像に対しても、クラス分類を修正し、キーワードを更新することを特徴とする請求項2乃至4の何れかに記載のキーワード付与装置。
【請求項6】
前記クラス分類は、階層化されており、
前記クラス分類手段は、前記特徴量抽出手段で抽出した特徴量に対して各階層についてのクラス分類を行い、
前記キーワード付与手段は、前記分類頻度計測手段で計測した頻度に応じて、前記クラス分類手段で分類したクラス分類の内の何れの階層のクラス分類を使用するかを選択するクラス分類選択手段を含むことを特徴とする請求項1に記載のキーワード付与装置。
【請求項7】
前記頻度は、前記クラス分類手段で分類したクラス分類に属する特徴量の個数、又は、既にクラス分類済みの全画像における特徴量の個数に対する前記クラス分類手段で分類したクラス分類に属する特徴量の個数の割合、の何れかであることを特徴とする請求項1乃至6の何れかに記載のキーワード付与装置。
【請求項8】
前記入力画像を、前記キーワード付与手段で付与されたキーワードと共に表示させる表示制御手段を更に具備することを特徴とする請求項1乃至7の何れかに記載のキーワード付与装置。
【請求項9】
コンピュータを、
入力画像から特徴量を抽出する特徴量抽出手段、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段、
として機能させるためのプログラム。
【請求項1】
入力画像から特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段と、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段と、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段と、
を具備することを特徴とするキーワード付与装置。
【請求項2】
前記キーワード付与手段は、前記分類頻度計測手段で計測した頻度に応じて、前記クラス分類手段で分類したクラス分類を修正するクラス分類修正手段を含む請求項1に記載のキーワード付与装置。
【請求項3】
前記クラス分類は、階層化されており、
前記クラス分類修正手段は、前記分類頻度計測手段で計測した頻度が所定の値よりも高いクラスに対して、前記クラス分類手段で分類したクラス分類よりも細かい分類のクラス分類を含む階層でクラス分類を行うことを特徴とする請求項2に記載のキーワード付与装置。
【請求項4】
前記キーワード付与手段は、前記分類頻度計測手段で計測した頻度が前記所定の値よりも高いクラスが存在しない場合は、前記クラス分類手段で分類したクラス分類に対応するキーワードを前記入力画像に付与することを特徴とする請求項3に記載のキーワード付与装置。
【請求項5】
前記キーワード付与手段は、前記クラス分類修正手段でクラス分類が修正された場合、既にクラス分類済みの前記入力画像以外の画像に対しても、クラス分類を修正し、キーワードを更新することを特徴とする請求項2乃至4の何れかに記載のキーワード付与装置。
【請求項6】
前記クラス分類は、階層化されており、
前記クラス分類手段は、前記特徴量抽出手段で抽出した特徴量に対して各階層についてのクラス分類を行い、
前記キーワード付与手段は、前記分類頻度計測手段で計測した頻度に応じて、前記クラス分類手段で分類したクラス分類の内の何れの階層のクラス分類を使用するかを選択するクラス分類選択手段を含むことを特徴とする請求項1に記載のキーワード付与装置。
【請求項7】
前記頻度は、前記クラス分類手段で分類したクラス分類に属する特徴量の個数、又は、既にクラス分類済みの全画像における特徴量の個数に対する前記クラス分類手段で分類したクラス分類に属する特徴量の個数の割合、の何れかであることを特徴とする請求項1乃至6の何れかに記載のキーワード付与装置。
【請求項8】
前記入力画像を、前記キーワード付与手段で付与されたキーワードと共に表示させる表示制御手段を更に具備することを特徴とする請求項1乃至7の何れかに記載のキーワード付与装置。
【請求項9】
コンピュータを、
入力画像から特徴量を抽出する特徴量抽出手段、
前記特徴量抽出手段で抽出した特徴量に対してクラス分類を行うクラス分類手段、
前記クラス分類手段で分類したクラス分類の頻度を計測する分類頻度計測手段、
前記クラス分類手段で分類したクラス分類と、前記分類頻度計測手段で計測した頻度と、に基づいて前記入力画像にキーワードを付与するキーワード付与手段、
として機能させるためのプログラム。
【図1】
【図2】
【図3】
【図4A】
【図4B】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4A】
【図4B】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2012−58926(P2012−58926A)
【公開日】平成24年3月22日(2012.3.22)
【国際特許分類】
【出願番号】特願2010−200247(P2010−200247)
【出願日】平成22年9月7日(2010.9.7)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】
【公開日】平成24年3月22日(2012.3.22)
【国際特許分類】
【出願日】平成22年9月7日(2010.9.7)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】
[ Back to top ]