説明

半教師トピックモデル学習装置、半教師トピックモデル学習方法及びプログラム

【課題】付加情報(言語情報)が関連付けられた信号が少量しか利用できない場合においても、信号と付加情報の関係性を精度良く学習することができる。
【解決手段】半教師トピックモデル学習装置10は、完全蓄積信号及び不完全蓄積信号のそれぞれから完全蓄積信号特徴及び不完全蓄積信号特徴を抽出する蓄積信号特徴抽出部1と、蓄積付加情報のそれぞれから蓄積付加情報特徴を抽出する蓄積付加情報特徴抽出部2と、完全蓄積信号特徴集合と不完全蓄積信号特徴集合と蓄積付加情報特徴集合とから蓄積潜在変数を抽出する蓄積潜在変数抽出部3と、完全蓄積信号特徴集合と不完全蓄積信号特徴集合と蓄積付加情報特徴集合と蓄積潜在変数集合とからトピックモデルを抽出するトピックモデル学習部4とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、半教師トピックモデル学習装置、半教師トピックモデル学習方法及びプログラムに関する。
【背景技術】
【0002】
近年、所望の画像を与えられた言語情報に基づいて検索する画像検索技術、及び、与えられた画像に対してその画像を説明する言語情報を自動的に付与する画像認識技術は、ディジタルカメラ・携帯電話などの撮像装置の普及、インターネット上での画像共有の一般化などに伴い、非常に重要な技術となってきている。また、画像検索と画像認識とを同一の枠組の下で実現する画像認識検索技術が数多く開発されている(例えば、非特許文献1参照)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】中山、原田、國吉、大津”画像・単語間概念対応の確率構造学習を利用した超高速画像認識・検索方法”、電子情報通信学会技術報告、PRMU2007-147、2007年12月
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1に記載された技術では、実際に検索又は認識を行う前に、画像と言語情報との関連性を学習しておく必要があるが、この学習の際に、同時共起する画像と言語情報との組が数多く必要となる。しかし、大量の画像に手動で言語情報を付与することは多くの労力を伴うため、言語情報が関連付けられている画像を大量に召集することは困難である。言語情報が関連付けられた画像が十分に用意できない場合には、画像と言語情報の関係性を精度良く学習することができないため、結果として画像認識及び画像検索の信頼性が損なわれてしまう、という問題がある。
【0005】
本発明は上記の点に鑑みてなされたものであり、その目的は、言語情報(付加情報)が関連付けられた画像(信号)が少量しか利用できない場合においても、画像(信号)と言語情報(付加情報)の関係性を精度良く学習することができる半教師トピックモデル学習装置、半教師トピックモデル学習方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、与えられた信号と、その信号を説明する情報である付加情報との関係性を学習する半教師トピックモデル学習装置であって、付加情報が予め付与された信号の集合である完全蓄積信号集合の要素である完全蓄積信号、及び付加情報が与えられていない信号の集合である不完全蓄積信号集合の要素である不完全蓄積信号のそれぞれから、各信号の特性を表現するベクトルである蓄積信号特徴を抽出する蓄積信号特徴抽出部と、前記完全蓄積信号に付与された付加情報の集合である蓄積付加情報集合の要素である蓄積付加情報のそれぞれから、蓄積付加情報の特性を表現するベクトルである蓄積付加情報特徴を抽出する蓄積付加情報特徴抽出部と、前記完全蓄積信号の蓄積信号特徴の集合である完全蓄積信号特徴集合と、前記不完全蓄積信号の蓄積信号特徴の集合である不完全蓄積信号特徴集合と、前記蓄積付加情報特徴の集合である蓄積付加情報特徴集合とから、信号と付加情報の関係性を記述するための変数である蓄積潜在変数を抽出する蓄積潜在変数抽出部と、前記完全蓄積信号特徴集合と、前記不完全蓄積信号特徴集合と、前記蓄積付加情報特徴集合と、前記蓄積潜在変数の集合である蓄積潜在変数集合とから、信号と付加情報との関係性を記述するモデルであるトピックモデルを抽出するトピックモデル学習部とを備えることを特徴とする半教師トピックモデル学習装置である。
【0007】
また、本発明の一態様は、上記の半教師トピックモデル学習装置において、前記蓄積潜在変数抽出部は、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積付加情報特徴集合とから、蓄積潜在変数が存在する多次元ベクトル空間である潜在変数空間を生成する潜在変数空間生成部と、前記完全蓄積信号特徴集合と前記蓄積付加情報特徴集合と前記潜在変数空間とを用いて、前記完全蓄積信号特徴集合に対応する蓄積潜在変数集合である完全蓄積潜在変数集合を抽出する完全蓄積潜在変数集合抽出部と、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記潜在変数空間とを用いて、不完全蓄積信号特徴集合に対応する蓄積潜在変数集合である不完全蓄積潜在変数集合を抽出し、当該不完全蓄積潜在変数集合と前記完全蓄積潜在変数集合とを合わせて蓄積潜在変数集合全体を形成する蓄積潜在変数集合抽出部とを備えることを特徴とする。
【0008】
また、本発明の一態様は、上記の半教師トピックモデル学習装置において、前記トピックモデル学習部は、前記蓄積潜在変数集合から、蓄積潜在変数そのものの確率的構造を記述するモデルである潜在変数モデルを抽出する潜在変数モデル学習部と、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積潜在変数集合とから、信号と潜在変数との関係性を記述するモデルである信号・潜在変数関係モデルを抽出する信号・潜在変数関係モデル学習部と、前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、付加情報と潜在変数との関係性を記述するモデルである付加情報・潜在変数関係モデルを抽出する付加情報・潜在変数関係モデル学習部とを備え、前記潜在変数モデルと前記信号・潜在変数関係モデルと前記付加情報・潜在変数関係モデルとを統合してトピックモデルとすることを特徴とする。
【0009】
また、本発明の一態様は、上記の半教師トピックモデル学習装置において、前記トピックモデル学習部は、前記付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、前記不完全蓄積信号特徴集合に対応する潜在変数の分布を考慮して前記付加情報・潜在変数関係モデルを更新する付加情報・潜在変数関係モデル更新部と、前記付加情報・潜在変数関係モデルが更新した付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合とから、当該蓄積付加情報特徴集合の情報を一定程度保持するように付加情報・潜在変数関係モデルを補正する付加情報・潜在変数関係モデル補正部とを更に備えることを特徴とする。
【0010】
また、本発明の一態様は、上記の半教師トピックモデル学習装置において、前記潜在変数モデル学習部は、各蓄積潜在変数をパラメータとする確率密度関数の重ね合わせで潜在変数モデルを抽出し、前記信号・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ蓄積信号特徴をパラメータとする確率密度関数に基づいて、信号・潜在変数関係モデルを抽出し、前記付加情報・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ付加情報特徴をパラメータとする確率密度関数に基づいて、付加情報・潜在変数関係モデルを抽出することを特徴とする。
【0011】
また、本発明の一態様は、与えられた信号と、その信号を説明する情報である付加情報との関係性を学習する半教師トピックモデル学習装置において用いられる半教師トピックモデル学習方法であって、蓄積信号特徴抽出部が、付加情報が予め付与された信号の集合である完全蓄積信号集合の要素である完全蓄積信号、及び付加情報が与えられていない信号の集合である不完全蓄積信号集合の要素である不完全蓄積信号のそれぞれから、各信号の特性を表現するベクトルである蓄積信号特徴を抽出するステップと、蓄積付加情報特徴抽出部が、前記完全蓄積信号に付与された付加情報の集合である蓄積付加情報集合の要素である蓄積付加情報のそれぞれから、蓄積付加情報の特性を表現するベクトルである蓄積付加情報特徴を抽出するステップと、蓄積潜在変数抽出部が、前記完全蓄積信号の蓄積信号特徴の集合である完全蓄積信号特徴集合と、前記不完全蓄積信号の蓄積信号特徴の集合である不完全蓄積信号特徴集合と、前記蓄積付加情報特徴の集合である蓄積付加情報特徴集合とから、信号と付加情報の関係性を記述するための変数である蓄積潜在変数を抽出するステップと、トピックモデル学習部が、前記完全蓄積信号特徴集合と、前記不完全蓄積信号特徴集合と、前記蓄積付加情報特徴集合と、前記蓄積潜在変数の集合である蓄積潜在変数集合とから、信号と付加情報との関係性を記述するモデルであるトピックモデルを抽出するステップとを含むことを特徴とする半教師トピックモデル学習方法である。
【0012】
また、本発明の一態様は、上記の半教師トピックモデル学習方法において、前記蓄積潜在変数抽出部は、潜在変数空間生成部が、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積付加情報特徴集合とから、蓄積潜在変数が存在する多次元ベクトル空間である潜在変数空間を生成するステップと、完全蓄積潜在変数集合抽出部が、前記完全蓄積信号特徴集合と前記蓄積付加情報特徴集合と前記潜在変数空間とを用いて、前記完全蓄積信号特徴集合に対応する蓄積潜在変数集合である完全蓄積潜在変数集合を抽出するステップと、蓄積潜在変数集合抽出部が、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記潜在変数空間とを用いて、不完全蓄積信号特徴集合に対応する蓄積潜在変数集合である不完全蓄積潜在変数集合を抽出し、当該不完全蓄積潜在変数集合と前記完全蓄積潜在変数集合とを合わせて蓄積潜在変数集合全体を形成するステップとを含むことを特徴とする。
【0013】
また、本発明の一態様は、上記の半教師トピックモデル学習方法において、前記トピックモデル学習部は、潜在変数モデル学習部が、前記蓄積潜在変数集合から、蓄積潜在変数そのものの確率的構造を記述するモデルである潜在変数モデルを抽出するステップと、信号・潜在変数関係モデル学習部が、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積潜在変数集合とから、信号と潜在変数との関係性を記述するモデルである信号・潜在変数関係モデルを抽出するステップと、付加情報・潜在変数関係モデル学習部が、前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、付加情報と潜在変数との関係性を記述するモデルである付加情報・潜在変数関係モデルを抽出するステップとを含み、前記潜在変数モデルと前記信号・潜在変数関係モデルと前記付加情報・潜在変数関係モデルとを統合してトピックモデルとすることを特徴とする。
【0014】
また、本発明の一態様は、上記の半教師トピックモデル学習方法において、前記トピックモデル学習部は、付加情報・潜在変数関係モデル更新部が、前記付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、前記不完全蓄積信号特徴集合に対応する潜在変数の分布を考慮して前記付加情報・潜在変数関係モデルを更新するステップと、付加情報・潜在変数関係モデル補正部が、前記付加情報・潜在変数関係モデルが更新した付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合とから、当該蓄積付加情報特徴集合の情報を一定程度保持するように付加情報・潜在変数関係モデルを補正するステップとを更に含むことを特徴とする。
【0015】
また、本発明の一態様は、上記の半教師トピックモデル学習方法において前記潜在変数モデル学習部は、各蓄積潜在変数をパラメータとする確率密度関数の重ね合わせで潜在変数モデルを抽出し、前記信号・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ蓄積信号特徴をパラメータとする確率密度関数に基づいて、信号・潜在変数関係モデルを抽出し、前記付加情報・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ付加情報特徴をパラメータとする確率密度関数に基づいて、付加情報・潜在変数関係モデルを抽出することを特徴とする。
【0016】
また、本発明の一態様は、与えられた信号と、その信号を説明する情報である付加情報との関係性を学習する半教師トピックモデル学習装置としてのコンピュータに、蓄積信号特徴抽出部が、付加情報が予め付与された信号の集合である完全蓄積信号集合の要素である完全蓄積信号、及び付加情報が与えられていない信号の集合である不完全蓄積信号集合の要素である不完全蓄積信号のそれぞれから、各信号の特性を表現するベクトルである蓄積信号特徴を抽出するステップと、蓄積付加情報特徴抽出部が、前記完全蓄積信号に付与された付加情報の集合である蓄積付加情報集合の要素である蓄積付加情報のそれぞれから、蓄積付加情報の特性を表現するベクトルである蓄積付加情報特徴を抽出するステップと、蓄積潜在変数抽出部が、前記完全蓄積信号の蓄積信号特徴の集合である完全蓄積信号特徴集合と、前記不完全蓄積信号の蓄積信号特徴の集合である不完全蓄積信号特徴集合と、前記蓄積付加情報特徴の集合である蓄積付加情報特徴集合とから、信号と付加情報の関係性を記述するための変数である蓄積潜在変数を抽出するステップと、トピックモデル学習部が、前記完全蓄積信号特徴集合と、前記不完全蓄積信号特徴集合と、前記蓄積付加情報特徴集合と、前記蓄積潜在変数の集合である蓄積潜在変数集合とから、信号と付加情報との関係性を記述するモデルであるトピックモデルを抽出するステップとを実行させることを特徴とするプログラムである。
【発明の効果】
【0017】
本発明によれば、蓄積潜在変数抽出部により、付加情報(言語情報)が関連付けられた信号と付加情報が関連付けられていない信号の双方からの、信号と付加情報の関係性を記述するための蓄積潜在変数の抽出することにより、付加情報が関連付けられた信号が少量しか利用できない場合においても、信号と付加情報の関係性を精度良く学習することができる。すなわち、付加情報が関連付けられていない信号を、信号と付加情報との関係性を学習する際に、同時に利用することにより、付加情報が関連付けられた信号のみを少数利用する場合に比べて、高い精度で信号と付加情報の関係性を学習することができる。
【図面の簡単な説明】
【0018】
【図1】本実施形態による半教師トピックモデル学習装置の機能構成を示すブロック図である。
【図2】本実施形態による蓄積潜在変数抽出部の機能構成を示すブロック図である。
【図3】本実施形態によるトピックモデル学習部の機能構成を示すブロック図である。
【図4】本実施形態による半教師トピックモデル学習処理の手順を示すフローチャートである。
【図5】本実施形態による蓄積潜在変数抽出部における蓄積潜在変数抽出処理の手順を示すフローチャートである。
【図6】本実施形態によるトピックモデル学習部におけるトピックモデル学習処理の手順を示すフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
まず、以下で用いる語を次のように定義する。
付加情報とは、対象とする信号を説明する情報(テキストラベル)であり、対象とする信号と異なる種類の信号を広く一般的に指すものとする。ここで用いられる信号の種類としては、たとえば静止画像、動画像(映像)、音響信号(音声、音楽、環境音など)、テキスト、生体信号(脳波、筋電信号など)、地理情報(GPS取得情報、所在地名など)、機器情報(カメラ型番、符号化コーデックなど)など、様々なものが含まれる。以下では、対象とする信号として画像、付加情報としてテキストの場合を例に説明を行うため「蓄積画像」という表現を用いるが、前述のような信号に置き換えることも可能であるため、これを「蓄積信号」と読み替えても良い。完全蓄積画像(信号)とは、付加情報が予め付与された画像(信号)である。不完全蓄積画像(信号)とは、付加情報が付与されていない画像(信号)である。また、完全蓄積画像(信号)集合G={g,g,…,g}は、N(Nは1以上の整数)枚の完全蓄積画像の集合である。不完全蓄積画像(信号)集合G={gN+1,gN+2,…,gN+Nx}は、Nx(Nxは1以上の整数)枚の不完全蓄積画像の集合である。なお、多くの場合N≪Nx(NはNxより十分に小さい)である。また、完全蓄積画像集合Gと不完全蓄積画像集合Gとを合わせて蓄積画像(信号)集合Gとする。蓄積付加情報集合W1={w,w,…,w}は、画像(信号)に付与された付加情報の集合である。
【0020】
図1は、本実施形態による半教師トピックモデル学習装置10の機能構成を示すブロック図である。
半教師トピックモデル学習装置10は、完全蓄積画像集合Gと不完全蓄積画像集合Gと蓄積付加情報集合W1とを入力とし、画像と付加情報との関係性を記述するモデルである画像(信号)・付加情報関係モデル(トピックモデル)を出力(学習)する、例えばコンピュータ等から構築される装置である。半教師トピックモデル学習装置10は、蓄積信号特徴抽出部1と、蓄積付加情報特徴抽出部2と、蓄積潜在変数抽出部3と、トピックモデル学習部4とを含んで構成される。
【0021】
蓄積信号特徴抽出部1は、完全蓄積画像集合Gと不完全蓄積画像集合Gとを入力とし、完全蓄積画像集合Gの要素である完全蓄積画像と不完全蓄積画像集合Gの要素である不完全蓄積画像のそれぞれから、各画像の特性を表現するベクトルである蓄積画像(信号)特徴を抽出する。そして、蓄積信号特徴抽出部1は、完全蓄積画像(信号)特徴の集合である完全蓄積画像(信号)特徴集合と不完全蓄積画像(信号)特徴の集合である不完全蓄積画像(信号)特徴集合とを蓄積潜在変数抽出部3に出力する。完全蓄積画像特徴は完全蓄積画像の蓄積画像特徴であり、不完全蓄積画像特徴は不完全蓄積画像の蓄積画像特徴である。
【0022】
具体的には、蓄積信号特徴抽出部1は、蓄積画像が静止画像であれば、まず、各画像について、SURF(Speeded−up robust features;例えばH. Bay, A. Ess, T. Tuytelaars, and L. Van Gool,“Speeded-up robust features (SURF),” CVIU, vol. 110, no. 3, pp. 346-359, 2008.参照)を用いて画像の特徴点を検出する。続いて、蓄積信号特徴抽出部1は、特徴点について計算した局所特徴量を量子化し、量子化した各特徴量をヒストグラムとして表現する。これにより、蓄積信号特徴抽出部1は、完全蓄積画像特徴集合X={x,x,…,x}と不完全蓄積画像特徴集合X={xN+1,xN+2,…,xN+Nx}を求める。画像特徴集合の要素x(n=1,2,3,…,Nx)は、ヒストグラムである。
【0023】
また、蓄積画像が動画像であれば、「時系列アクティブ探索(TAS)法(特許第3065314号明細書)」のように時系列信号から生成したヒストグラムを特徴量として利用しても良い。また、蓄積画像の代わりに音響信号を用いる場合には、MFCC(Mel-frequency cepstral coefficients)やchroma特徴量などを用いることができる。また、地理情報であれば、GPSで取得した経度、緯度、時刻等の情報をそのまま特徴量として利用することができる。テキストの場合は、後述の蓄積負荷情報特徴抽出部2の説明で述べる。
【0024】
なお、本実施形態では、蓄積信号特徴抽出部1は、局所特徴量の量子化ヒストグラムにより蓄積画像特徴を求めているが、これに換えて、例えば、色ヒストグラム、画像中の各小領域のデジタルコサイン変換の低周波成分、Haar waveletの低周波成分もしくは高周波成分、高次局所自己相関特徴(例えば、N. Otsu and T. Kurita “A new scheme for practical flexible and intelligent vision systems,” Proc. IAPR Workshop on Computer Vision, pp.431-435, 1988.参照)などを用いることもできる。また、特徴点の抽出と局所特徴量の計算には上述のSURFを用いているが、これに換えて、例えばSIFT(例えば、D. Lowe, “Distinctive image features from scale-invariant keypoints,” International Journal of Computer Vision, Vol.60, No.2, pp.91-110, 2004.参照)などの他の方法を用いることもできる。
【0025】
蓄積付加情報特徴抽出部2は、蓄積付加情報集合W1を入力とし、蓄積付加情報集合W1の要素である蓄積付加情報のそれぞれから、蓄積付加情報の特性を表現するベクトルである蓄積付加情報特徴を抽出し、この蓄積付加情報特徴の集合である蓄積付加情報特徴集合Yを蓄積潜在変数抽出部3に出力する。蓄積付加情報特徴集合Yの抽出方法は、特に限定されるものではないが、本実施形態では、以下の3つの実施例について説明する。
【0026】
[第1の実施例]
蓄積付加情報特徴は、テキストラベルに含まれる単語の有無を表現する2値ベクトルである。すなわち、蓄積付加情報特徴は、考慮すべき単語の総数と同数の次元を持つベクトルであり、ベクトルの各次元が単語に対応する。便宜的に、単語を、上記ベクトルにおいて対応する次元のインデックスを用いて表現する。蓄積付加情報特徴抽出部2は、蓄積付加情報に単語iが含まれている場合には蓄積付加情報特徴の第i次元を1とし、そうではない場合には0とする。
【0027】
[第2の実施例]
蓄積付加情報特徴として単語共起ベクトルY={y,y,・・・,y}を用いる。蓄積付加情報特徴抽出部2は、単語共起ベクトルyの第d番目の要素yn,dを、テキストラベルwに含まれるd番目の単語の個数とする。
【0028】
[第3の実施例]
LSA(Latent Semantic Analysis)を使う。第1または第2の実施例の方法で導出したベクトルを列ベクトルとする行列Wを考え、蓄積付加情報特徴抽出部2は、この行列Wに特異値分解を行うことで、W=UΣV(VはVの転置行列)を満たす正規直交行列U、Vと対角行列Σを得る。Σの対角成分にはWの特異値が並ぶ。このとき、Σの値が左上から降順(値の大きい順)となるように、UとVの列が適切に並びかえられているものとする。次に、蓄積付加情報特徴抽出部2は、予め定められたDyについて、Σの左上Dy×Dyの部分行列ΣDyと、Uの左Dy列までを取り出した部分行列UDyとを用いて、蓄積付加情報特徴y(n=1,2,・・・,N)をy=UDyΣDyにより得る。
【0029】
蓄積潜在変数抽出部3は、完全蓄積画像特徴集合Xと、不完全蓄積画像特徴集合Xと、蓄積付加情報特徴集合Yとを入力とし、これらの特徴集合から、画像(信号)と付加情報の関係性を記述するための変数の集合である蓄積潜在変数集合Z={z,z,・・・,zNx+N}を抽出し、この蓄積潜在変数集合をトピックモデル学習部4へ出力する。蓄積潜在変数抽出部3における処理の詳細については後述する。
【0030】
トピックモデル学習部4は、完全蓄積画像特徴集合Xと、不完全蓄積画像特徴集合Xと、蓄積付加情報特徴集合Yと、蓄積潜在変数集合Zとを入力とし、これらの集合から、画像と付加情報との関係性を記述するモデルであるトピックモデルを学習(抽出)し、このトピックモデルを出力する。トピックモデル学習部4における処理の詳細については後述する。
【0031】
次に、蓄積潜在変数抽出部3における処理の詳細について説明する。図2は、本実施形態による蓄積潜在変数抽出部3の機能構成を示すブロック図である。
蓄積潜在変数抽出部3は、関数f:RDx→RDz(Dx次元実数ベクトルの集合からDz次元実数ベクトルの集合を生成する関数)と、関数fxy:RDx×RDy→RDz(Dx次元実数ベクトルの集合とDy次元実数ベクトルの集合とからDz次元実数ベクトルの集合を生成する関数)の組(f,fxy)を、(X,Y)から求めると共に、これらの関数を用いて(X,Y)からZを生成する。ここで、Xは、完全蓄積画像特徴集合Xと不完全蓄積画像特徴集合Xを合わせた蓄積画像特徴集合である。また、Dxは蓄積画像特徴の次元であり、Dyは蓄積付加情報特徴の次元であり、Dzは蓄積潜在変数の次元である。本実施形態では、多変量解析の一種である正準相関分析を改良した方法を用いて蓄積潜在変数集合の抽出を行う。蓄積潜在変数抽出部3は、潜在変数空間生成部31と、完全蓄積潜在変数集合抽出部32と、蓄積潜在変数集合抽出部33とを含んで構成される。
【0032】
潜在変数空間生成部31は、完全蓄積画像特徴集合Xと、不完全蓄積画像特徴集合Xと、蓄積付加情報特徴集合Yとから、蓄積潜在変数が存在する多次元ベクトル空間である潜在変数空間を生成する。潜在変数空間の生成方法は、特に限定されるものではないが、本実施形態においては、潜在変数空間生成部31は、次式(1)で与えられる一般化固有値問題を解くことによって導出する。一般化固有値問題は、式(1)を満たす固有値λおよび固有ベクトルaを求める問題である。
【0033】
【数1】

【0034】
ここで、aは(Dx+Dy)次元のベクトルである。ただし、数式(1)におけるBは次式(2)で表される。
【0035】
【数2】

【0036】
また、数式(1)におけるCは次式(3)で表される。
【0037】
【数3】

【0038】
ただし、は、(ベクトルもしくは行列の)転置を意味する。またIは、d×dの単位行列を表す。なお、式中の文字上部にハット(^)が付いた文字は、文中において文字の前にハット(^)を記載して示す。B及びCを構成する各要素ハット(^)S(C)xx、ハット(^)S(C)yy、ハット(^)S(C)xy、ハット(^)S(C)yx、ハット(^)Sxx、及びハット(^)Syyは、次式(4)から(9)にて表される。
【0039】
【数4】

【0040】
【数5】

【0041】
【数6】

【0042】
【数7】

【0043】
【数8】

【0044】
【数9】

【0045】
ここで、βは予め与えられた実数である。なお、一般化固有値問題の解法については、参考文献として、Hardoon, Szedmak and Shawe-Taylor ”Canonical correlation analysis: An overview with applications to learning methods,”Neural Computation, Vol.16, Issue 12, pp.2639-2664, December 2004がある。
【0046】
数式(1)に示す一般化固有値問題を解き、予め定められた数の固有値と固有ベクトルとの組、もしくは固有値の和が予め定められた閾値を上回る最少数の固有値と固有ベクトルとの組を求める、もしくはBartlett検定を用いた方法により決定された数の固有値と固有ベクトルの数を求めることで、潜在変数空間を決定することができる。なお、Bartlett検定については、参考文献として、M.S. Bartlett “THE STATISTICAL SIGNIFICANCE OF CANONICAL CORRELATIONS,”Biometrika, Vol.32 pp.29-37, 1941. がある。
【0047】
但し、Dzは、取り出した固有値及び固有ベクトルの数であり、Dz≦min(Dx、Dy)を満たす。各固有ベクトルa(d=1,2,・・・,Dz)は、先頭のDx次元ベクトルax,dと後続のDy次元ベクトルay,dとに分解することができる。これにより、潜在変数空間生成部31は潜在変数空間を分解した固有ベクトルを列として持つ行列(A,A)を出力する。ここで、A={ax,1,ax,2,ax,3,…,ax,Dx}であり、A={ay,1,ay,2,ay,3,…,ay,Dy}である。
【0048】
完全蓄積潜在変数集合抽出部32は、完全蓄積画像特徴集合Xと、蓄積付加情報特徴集合Yと、潜在変数空間Aとを用いて、完全蓄積画像特徴集合Xに対応する蓄積潜在変数集合である完全蓄積潜在変数集合Zを抽出する。具体的には、まず、完全蓄積潜在変数集合抽出部32は、次式(10)によりfxyを定める。なお、式中の文字上部に〜が付いた文字は、文中において文字の前に〜を記載して示す。
【0049】
【数10】

【0050】
ただし、Λは、式(1)の解のうちd番目に大きい固有値λ(d=1,2,…,Dz)をd番目の対角成分とする対角行列である。また、M及びMは、M=Λを満たし、かつスペクトルノルムが1より小さいDz次元正方行列である。〜Λは次式(11)で表される。
【0051】
【数11】

【0052】
そして、完全蓄積潜在変数集合抽出部32は、次式(12)から完全蓄積潜在変数集合Zの各要素z(n=1,2,…N)を算出することにより、完全蓄積潜在変数集合Zを抽出する。
【0053】
【数12】

【0054】
蓄積潜在変数集合抽出部33は、完全蓄積画像特徴集合Xと、不完全蓄積画像特徴集合Xと、潜在変数空間Aとを用いて、不完全蓄積画像特徴集合Xに対応する蓄積潜在変数集合である不完全蓄積潜在変数集合Zを抽出する。そして、蓄積潜在変数集合抽出部33は、完全蓄積潜在変数集合Zと不完全蓄積潜在変数集合Zとを合わせて蓄積潜在変数集合Z全体を形成する。具体的には、まず、蓄積潜在変数集合抽出部33は、次式(13)によりfを定める。
【0055】
【数13】

【0056】
そして、蓄積潜在変数集合抽出部33は、次式(14)から不完全蓄積潜在変数集合Zの各要素z(n=N+1,N+2,…N+Nx)を算出することにより、不完全蓄積潜在変数集合Zを抽出する。
【0057】
【数14】

【0058】
そして、蓄積潜在変数集合抽出部33は、完全蓄積潜在変数集合Zと不完全蓄積潜在変数集合Zとを合わせて蓄積潜在変数集合Zとし、この蓄積潜在変数集合Zを出力する。
【0059】
次に、トピックモデル学習部4における処理の詳細について説明する。図3は、本実施形態によるトピックモデル学習部4の機能構成を示すブロック図である。
トピックモデル学習部4は、潜在変数モデル学習部41と、信号・潜在変数関係モデル学習部42と、初期付加情報・潜在変数関係モデル学習部43と、付加情報・潜在変数関係モデル更新部44と、付加情報・潜在変数関係モデル補正部45と、収束判定部46とを含んで構成される。
【0060】
潜在変数モデル学習部41は、蓄積潜在変数集合Zを入力とし、この蓄積潜在変数そのものの確率的構造を記述するモデルである潜在変数モデルを学習(抽出)し、この潜在変数モデルを出力する。潜在変数モデルの学習方法は、特に限定されるものではないが、本実施形態では、以下の3つの実施例について説明する。いずれも、潜在変数モデルとして、蓄積潜在変数zの生起確率p(z)を採用する。
【0061】
[第1の実施例]
潜在変数モデル学習部41は、蓄積潜在変数集合Zを用いた次式(15)の多点近似によって、潜在変数モデルp(z)を算出する。ここで、Kz(z)はzをパラメータとする確率密度関数である。Kzとして、たとえばディラックのデルタ関数や正規分布などが利用できる。つまり、潜在変数モデル学習部41は、蓄積潜在変数zをパラメータとする確率密度関数の重ね合わせで潜在変数モデルp(z)を抽出する。
【0062】
【数15】

【0063】
[第2の実施例]
潜在変数モデル学習部41は、正準相関分析の確率的な構造を考慮し、潜在変数モデルp(z)を次式(16)により算出する。ただし、関数Nは第一引数を平均、第二引数を共分散行列とする正規分布である。
【0064】
【数16】

【0065】
[第3の実施例]
潜在変数モデル学習部41は、次式(17)に示す混合正規分布によって、潜在変数モデルp(z)を算出する。
【0066】
【数17】

【0067】
ただし、Mzは混合する分布の数、ωはm番目の分布の重み(Σm=1Mz ω=1)、 ̄zはm番目の分布の平均、Σzmはm番目の分布の分散を表す。Mzを予め定めておくと、ω、 ̄z、ΣzmはEMアルゴリズムで求められる。
【0068】
信号・潜在変数関係モデル学習部42は、蓄積画像特徴集合Xと蓄積潜在変数集合Zとを入力とし、これらの集合を用いて蓄積画像と蓄積潜在変数との関係性を記述するモデルである信号・潜在変数関係モデルを学習(抽出)し、この信号・潜在変数関係モデルを出力する。信号・潜在変数関係モデルの学習方法は特に限定されるものではないが、本実施形態では、以下の2つの実施例について説明する。いずれも、信号・潜在変数関係モデルとして、蓄積潜在変数zが与えられたときの蓄積画像特徴xの条件付生起確率p(x|z)を採用する。
【0069】
[第1の実施例]
信号・潜在変数関係モデル学習部42は、蓄積潜在変数集合の各要素zについて、信号・潜在変数関係モデルp(x|z)を次式(18)により算出する。つまり、信号・潜在変数関係モデル学習部42は、各蓄積潜在変数zに対して個別に、かつ蓄積画像特徴xをパラメータとする確率密度関数に基づいて信号・潜在変数関係モデルを抽出する。
【0070】
【数18】

【0071】
ただし、〜zは、蓄積画像特徴xを蓄積潜在変数抽出部3により変換した蓄積潜在変数であり、Kx(z)はzをパラメータとする確率密度関数である。Kxとして、例えば、ディラックのデルタ関数や正規分布などが利用できる。
【0072】
[第2の実施例]
信号・潜在変数関係モデル学習部42は、正準相関分析の確率的な構造を考慮し、信号・潜在変数関係モデルp(x|z)を次式(19)により算出する。
【0073】
【数19】

【0074】
初期付加情報・潜在変数関係モデル学習部43は、蓄積付加情報特徴集合Yと蓄積潜在変数集合Zとを入力とし、これら集合を用いて付加情報と蓄積潜在変数との関係性を記述するモデルである初期付加情報・潜在変数関係モデルを学習(抽出)し、この初期付加情報・潜在変数関係モデルを出力する。初期付加情報・潜在変数関係モデルの学習方法は特に限定されるものではないが、本実施例では、以下の3つの実施例について述べる。いずれも、初期付加情報・潜在変数関係モデルとして、蓄積潜在変数zが与えられたときの付加情報特徴yの条件付生起確率p(y|z)を採用する。
【0075】
[第1の実施例]
信号・潜在変数関係モデル学習部42と同様の方法が利用できる。
【0076】
[第2の実施例]
初期付加情報・潜在変数関係モデル学習部43は、蓄積潜在変数集合の各要素zについて、初期付加情報・潜在変数関係モデルp(y|z)を次式(20)から(23)により算出する。つまり、初期付加情報・潜在変数関係モデル学習部43は、各蓄積潜在変数zに対して個別に、かつ付加情報をパラメータとする確率密度関数に基づいて付加情報・潜在変数関係モデルを抽出する。
【0077】
【数20】

【0078】
【数21】

【0079】
【数22】

【0080】
【数23】

【0081】
ここで、μは0≦μ≦1を満たす定数であり、yn,dは蓄積付加情報特徴yの第d要素である。また、Ky(y)はyをパラメータとする確率密度関数であり、例えば、クロネッカーのデルタ関数、多項分布などが利用できる。すなわち、上記の関係式は、まず、各テキストラベルが独立に生起することを仮定し(式(20))、各テキストラベルの生起確率を、各サンプルnでのテキストラベルの経験分布(式(21)のKy(y−yn,d)に相当)と全サンプルでのテキストラベルの経験分布(式(21)のM/Mに相当)とを混合比μで混合して生成することを意味する。
【0082】
[第3の実施例]
初期付加情報・潜在変数関係モデル学習部43は、正準相関分析の確率的な構造を考慮し、初期付加情報・潜在変数関係モデルp(y|z)を次式(24)により算出する。
【0083】
【数24】

【0084】
付加情報・潜在変数関係モデル更新部44は、初期付加情報・潜在変数関係モデル(もしくは付加情報・潜在変数関係モデル補正部45により補正された付加情報・潜在変数関係モデル)と、蓄積付加情報特徴集合Yと、蓄積潜在変数集合Zとから、不完全蓄積画像特徴集合に対応する蓄積潜在変数の分布を考慮して(初期)付加情報・潜在変数関係モデルを更新し、新たな付加情報・潜在変数関係モデルとして出力する。
【0085】
以下、表記の簡略化のために、次式(25)に示す行列表記を導入する。
【0086】
【数25】

【0087】
m,nは行列Pの(m,n)成分であり、次式(26)により表される。
【0088】
【数26】

【0089】
また、Fn,dは行列Fの(n,d)成分であり、次式(27)により表される。
【0090】
【数27】

【0091】
ここで、行列Fが付加情報・潜在変数関係モデルである。また、初期付加情報・潜在変数関係モデル学習部43により求めた初期付加情報・潜在変数関係モデルをF(0)とし、k回目に更新した付加情報・潜在変数関係モデルをF(k)とする。付加情報・潜在変数関係モデル更新部44は、次式(28)により付加情報・潜在変数関係モデルを更新し、F(k)を新たな付加情報・潜在変数関係モデルとして出力する。
【0092】
【数28】

【0093】
蓄積画像が大量にある場合、上記の行列Pが大きくなり過ぎる問題が生じることがある。これを回避するために、以下のような方法を取ることもできる。
【0094】
まず、式(26)にて計算された行列Pの各要素のうち小さい値を取る要素を強制的に0に書き換える。書き換える要素を選択する基準としては、例えば、行列Pの各行についてあらかじめ定められた数の要素を選択する、あらかじめ定められた閾値を下回る要素を選択する、などの方法が考えられる。多くの実施形態において、行列Pの各要素は潜在変数空間内の2つのベクトルの距離によって決定されることから、この場合には、書き換えずにそのまま残す要素を決定することは、潜在変数空間内での近傍探索もしくは範囲探索を行うことと等価となる。
【0095】
次に、0に置き換えずに残した要素のみを保持する新しい行列Pハットを考え、これを行列Pの代わりに用いて式(28)を計算する。
【0096】
元の行列Pがその保持に蓄積画像の数の2乗程度の領域を必要とするのに対し、新しい行列Pハットは、その保持に必要な領域を蓄積画像の数とほぼ同じオーダまで削減することができる。
【0097】
付加情報・潜在変数関係モデル補正部45は、付加情報・潜在変数関係モデル更新部44で更新した付加情報・潜在変数関係モデルと、蓄積付加情報特徴集合Yとから、与えられている蓄積付加情報特徴の情報を一定程度(所定の値)保持するように付加情報・潜在変数関係モデルを補正し、新たな付加情報・潜在変数関係モデルとして出力する。付加情報・潜在変数関係モデルFは、次式(29)で記述できる。
【0098】
【数29】

【0099】
ここで、F(k)は、完全蓄積画像に対応するN×Dy行列の付加情報・潜在変数関係モデルであり、F(k)は、不完全蓄積画像に対応するNx×Dy行列の付加情報・潜在変数関係モデルを表す。付加情報・潜在変数関係モデル補正部45は、次式(30)により、付加情報・潜在変数関係モデルFのうち、完全蓄積画像に対する付加情報・潜在変数関係モデルを補正する。
【0100】
【数30】

【0101】
ここで、Tは(n,n)成分をt(0<t≦1,n=1,2,・・・,N)とする対角行列であり、与えられている付加情報をどの程度重視して、付加情報・潜在変数関係モデルを補正するかを決定するための正則化パラメータである。なお、行列Tの値は予め自由に定めておくことができる。
【0102】
収束判定部46は、付加情報・潜在変数関係モデル更新部44と付加情報・潜在変数関係モデル補正部45とにより補正された付加情報・潜在変数関係モデルと、補正前の付加情報・潜在変数関係モデル(付加情報・潜在変数関係モデル補正部45の1つ前の出力)とを比較する。そして、収束判定部46は、付加情報・潜在変数関係モデルが収束していると判定すれば、付加情報・潜在変数関係モデルを出力して処理を終了し、一方、収束していないと判定すれば、付加情報・潜在変数関係モデル更新部44へ処理を移行し、再び付加情報・潜在変数関係モデルの更新・補正処理を繰り返す。このとき、収束判定部46は、補正後の付加情報・潜在変数関係モデルF(k+1)と補正前の付加情報・潜在変数関係モデルF(k―1)の行列ノルムを算出し、この行列ノルムの差が所定の閾値以内であれば収束していると判定し、閾値より大きければ収束していないと判定する。
【0103】
トピックモデル学習部4は、潜在変数モデルと、信号・潜在変数関係モデルと、付加情報・潜在変数関係モデルとを統合してトピックモデルとし、このトピックモデルを出力する。
【0104】
次に、図4から6を参照して、本実施形態による半教師トピックモデル学習装置1における半教師トピックモデル学習処理について説明する。図4は、半教師トピックモデル学習処理の手順を示すフローチャートである。
まず、ステップS1において、蓄積信号特徴抽出部1が、完全蓄積画像集合及び不完全蓄積画像集合の要素である画像それぞれから各画像の特徴を抽出し、完全蓄積画像特徴集合X及び不完全蓄積画像特徴集合Xを生成する。次に、ステップS2において、蓄積付加情報特徴抽出部2が、蓄積付加情報集合の要素である蓄積付加情報それぞれから蓄積付加情報特徴を抽出し、蓄積付加情報特徴集合Yを生成する。次に、ステップS3において、蓄積潜在変数抽出部3が、完全蓄積画像特徴集合Xと不完全蓄積画像特徴集合Xと蓄積付加情報特徴集合Yとから、蓄積潜在変数集合Zを抽出する。最後に、ステップS4において、トピックモデル学習部4が、完全蓄積画像特徴集合Xと、不完全蓄積画像特徴集合Xと、蓄積付加情報特徴集合Yと、及び蓄積潜在変数集合Zとに基づいて、画像・付加情報関係モデルであるトピックモデルを抽出する。
【0105】
図5は、本実施形態による蓄積潜在変数抽出部3における蓄積潜在変数抽出処理の手順を示すフローチャートである。
まず、ステップS31において、潜在変数空間生成部31が、完全蓄積画像特徴集合Xと不完全蓄積画像特徴集合Xと蓄積付加情報特徴集合Yとから、潜在変数空間wを生成する。次に、ステップS32において、完全蓄積潜在変数集合抽出部32が、完全蓄積画像特徴集合Xと蓄積付加情報特徴集合Yと潜在変数空間wとを用いて、完全蓄積潜在変数集合Zを抽出する。最後に、ステップS33において、蓄積潜在変数集合抽出部33が、完全蓄積画像特徴集合Xと不完全蓄積画像特徴集合Xと潜在変数空間wとを用いて、不完全蓄積潜在変数集合Zを抽出して、蓄積潜在変数集合Z全体を形成する。
【0106】
図6は、本実施形態によるトピックモデル学習部4におけるトピックモデル学習処理の手順を示すフローチャートである。
まず、ステップS41において、潜在変数モデル学習部41が、蓄積潜在変数集合Zから潜在変数モデルp(z)を学習する。次に、ステップS42において、信号・潜在変数関係モデル学習部42が、蓄積画像特徴集合Xと蓄積潜在変数集合Zから信号・潜在変数関係モデルp(x|z)を学習する。次に、ステップS43において、初期付加情報・潜在変数関係モデル学習部43が、蓄積付加情報特徴集合Yと蓄積潜在変数集合Zとから初期付加情報・潜在変数関係モデルp(y|z)を学習する。
【0107】
次に、ステップS44において、付加情報・潜在変数関係モデル更新部44が、初期付加情報・潜在変数関係モデルp(y|z)もしくは、付加情報・潜在変数関係モデル補正部45により補正された付加情報・潜在変数関係モデルを更新する。次に、ステップS45において、付加情報・潜在変数関係モデル補正部45が、付加情報・潜在変数関係モデルを補正する。そして、ステップS46において、収束判定部46が、補正後の付加情報・潜在変数関係モデルと補正前の付加情報・潜在変数関係モデルとを比較し、収束したか否かを判定する。収束したと判定した場合には、収束判定部46は、この補正後の付加情報・潜在変数関係モデルを出力して処理を終了する。一方、収束していないと判定した場合には、ステップS44へ処理を移行する。
【0108】
このように、本実施形態によれば、蓄積潜在変数抽出部3により、付加情報が関連付けられた画像と付加情報が関連付けられていない画像の双方からの、画像と付加情報の関係性を記述するための蓄積潜在変数の抽出することにより、付加情報が関連付けられた画像が少量しか利用できない場合においても、画像と付加情報の関係性を精度良く学習することができる。すなわち、付加情報が関連付けられていない画像を、画像と付加情報との関係性を学習する際に、同時に利用することにより、付加情報が関連付けられた画像のみを少数利用する場合に比べて、高い精度で画像と付加情報の関係性を学習することができる。
また、付加情報・潜在変数関係モデル更新部44及び付加情報・潜在変数関係モデル補正部45において、付加情報・潜在変数関係モデルが収束するまで更新及び補正をすることにより、より高精度な付加情報・潜在変数関係モデルを出力することができる。
【0109】
また、図4から6に示す各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、半教師トピックモデル学習処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0110】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0111】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
例えば、本実施形態では、蓄積画像集合と蓄積付加情報集合を入力しているが、半教師トピックモデル学習装置10が記憶部を備え、この記憶部に蓄積画像集合及び蓄積付加情報集合を予め記憶しておいてもよい。
【符号の説明】
【0112】
1… 蓄積信号特徴抽出部 2…蓄積付加情報特徴抽出部 3…蓄積潜在変数抽出部 4…トピックモデル学習部 10…半教師トピックモデル学習装置 31…潜在変数空間生成部 32…完全蓄積潜在変数集合抽出部 33…蓄積潜在変数集合抽出部 41…潜在変数モデル学習部 42…信号・潜在変数関係モデル学習部 43…初期付加情報・潜在変数関係モデル学習部 44…付加情報・潜在変数関係モデル更新部 45…付加情報・潜在変数モデル補正部 46…収束判定部

【特許請求の範囲】
【請求項1】
与えられた信号と、その信号を説明する情報である付加情報との関係性を学習する半教師トピックモデル学習装置であって、
付加情報が予め付与された信号の集合である完全蓄積信号集合の要素である完全蓄積信号、及び付加情報が与えられていない信号の集合である不完全蓄積信号集合の要素である不完全蓄積信号のそれぞれから、各信号の特性を表現するベクトルである蓄積信号特徴を抽出する蓄積信号特徴抽出部と、
前記完全蓄積信号に付与された付加情報の集合である蓄積付加情報集合の要素である蓄積付加情報のそれぞれから、蓄積付加情報の特性を表現するベクトルである蓄積付加情報特徴を抽出する蓄積付加情報特徴抽出部と、
前記完全蓄積信号の蓄積信号特徴の集合である完全蓄積信号特徴集合と、前記不完全蓄積信号の蓄積信号特徴の集合である不完全蓄積信号特徴集合と、前記蓄積付加情報特徴の集合である蓄積付加情報特徴集合とから、信号と付加情報の関係性を記述するための変数である蓄積潜在変数を抽出する蓄積潜在変数抽出部と、
前記完全蓄積信号特徴集合と、前記不完全蓄積信号特徴集合と、前記蓄積付加情報特徴集合と、前記蓄積潜在変数の集合である蓄積潜在変数集合とから、信号と付加情報との関係性を記述するモデルであるトピックモデルを抽出するトピックモデル学習部と
を備えることを特徴とする半教師トピックモデル学習装置。
【請求項2】
前記蓄積潜在変数抽出部は、
前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積付加情報特徴集合とから、蓄積潜在変数が存在する多次元ベクトル空間である潜在変数空間を生成する潜在変数空間生成部と、
前記完全蓄積信号特徴集合と前記蓄積付加情報特徴集合と前記潜在変数空間とを用いて、前記完全蓄積信号特徴集合に対応する蓄積潜在変数集合である完全蓄積潜在変数集合を抽出する完全蓄積潜在変数集合抽出部と、
前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記潜在変数空間とを用いて、不完全蓄積信号特徴集合に対応する蓄積潜在変数集合である不完全蓄積潜在変数集合を抽出し、当該不完全蓄積潜在変数集合と前記完全蓄積潜在変数集合とを合わせて蓄積潜在変数集合全体を形成する蓄積潜在変数集合抽出部と
を備えることを特徴とする請求項1に記載の半教師トピックモデル学習装置。
【請求項3】
前記トピックモデル学習部は、
前記蓄積潜在変数集合から、蓄積潜在変数そのものの確率的構造を記述するモデルである潜在変数モデルを抽出する潜在変数モデル学習部と、
前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積潜在変数集合とから、信号と潜在変数との関係性を記述するモデルである信号・潜在変数関係モデルを抽出する信号・潜在変数関係モデル学習部と、
前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、付加情報と潜在変数との関係性を記述するモデルである付加情報・潜在変数関係モデルを抽出する付加情報・潜在変数関係モデル学習部と
を備え、
前記潜在変数モデルと前記信号・潜在変数関係モデルと前記付加情報・潜在変数関係モデルとを統合してトピックモデルとする
ことを特徴とする請求項1又は2に記載の半教師トピックモデル学習装置。
【請求項4】
前記トピックモデル学習部は、
前記付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、前記不完全蓄積信号特徴集合に対応する潜在変数の分布を考慮して前記付加情報・潜在変数関係モデルを更新する付加情報・潜在変数関係モデル更新部と、
前記付加情報・潜在変数関係モデルが更新した付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合とから、当該蓄積付加情報特徴集合の情報を一定程度保持するように付加情報・潜在変数関係モデルを補正する付加情報・潜在変数関係モデル補正部と
を更に備えることを特徴とする請求項3に記載の半教師トピックモデル学習装置。
【請求項5】
前記潜在変数モデル学習部は、各蓄積潜在変数をパラメータとする確率密度関数の重ね合わせで潜在変数モデルを抽出し、
前記信号・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ蓄積信号特徴をパラメータとする確率密度関数に基づいて、信号・潜在変数関係モデルを抽出し、
前記付加情報・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ付加情報特徴をパラメータとする確率密度関数に基づいて、付加情報・潜在変数関係モデルを抽出する
ことを特徴とする請求項3又は4に記載の半教師トピックモデル学習装置。
【請求項6】
与えられた信号と、その信号を説明する情報である付加情報との関係性を学習する半教師トピックモデル学習装置において用いられる半教師トピックモデル学習方法であって、
蓄積信号特徴抽出部が、付加情報が予め付与された信号の集合である完全蓄積信号集合の要素である完全蓄積信号、及び付加情報が与えられていない信号の集合である不完全蓄積信号集合の要素である不完全蓄積信号のそれぞれから、各信号の特性を表現するベクトルである蓄積信号特徴を抽出するステップと、
蓄積付加情報特徴抽出部が、前記完全蓄積信号に付与された付加情報の集合である蓄積付加情報集合の要素である蓄積付加情報のそれぞれから、蓄積付加情報の特性を表現するベクトルである蓄積付加情報特徴を抽出するステップと、
蓄積潜在変数抽出部が、前記完全蓄積信号の蓄積信号特徴の集合である完全蓄積信号特徴集合と、前記不完全蓄積信号の蓄積信号特徴の集合である不完全蓄積信号特徴集合と、前記蓄積付加情報特徴の集合である蓄積付加情報特徴集合とから、信号と付加情報の関係性を記述するための変数である蓄積潜在変数を抽出するステップと、
トピックモデル学習部が、前記完全蓄積信号特徴集合と、前記不完全蓄積信号特徴集合と、前記蓄積付加情報特徴集合と、前記蓄積潜在変数の集合である蓄積潜在変数集合とから、信号と付加情報との関係性を記述するモデルであるトピックモデルを抽出するステップと
を含むことを特徴とする半教師トピックモデル学習方法。
【請求項7】
前記蓄積潜在変数抽出部は、
潜在変数空間生成部が、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積付加情報特徴集合とから、蓄積潜在変数が存在する多次元ベクトル空間である潜在変数空間を生成するステップと、
完全蓄積潜在変数集合抽出部が、前記完全蓄積信号特徴集合と前記蓄積付加情報特徴集合と前記潜在変数空間とを用いて、前記完全蓄積信号特徴集合に対応する蓄積潜在変数集合である完全蓄積潜在変数集合を抽出するステップと、
蓄積潜在変数集合抽出部が、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記潜在変数空間とを用いて、不完全蓄積信号特徴集合に対応する蓄積潜在変数集合である不完全蓄積潜在変数集合を抽出し、当該不完全蓄積潜在変数集合と前記完全蓄積潜在変数集合とを合わせて蓄積潜在変数集合全体を形成するステップと
を含むことを特徴とする請求項6に記載の半教師トピックモデル学習方法。
【請求項8】
前記トピックモデル学習部は、
潜在変数モデル学習部が、前記蓄積潜在変数集合から、蓄積潜在変数そのものの確率的構造を記述するモデルである潜在変数モデルを抽出するステップと、
信号・潜在変数関係モデル学習部が、前記完全蓄積信号特徴集合と前記不完全蓄積信号特徴集合と前記蓄積潜在変数集合とから、信号と潜在変数との関係性を記述するモデルである信号・潜在変数関係モデルを抽出するステップと、
付加情報・潜在変数関係モデル学習部が、前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、付加情報と潜在変数との関係性を記述するモデルである付加情報・潜在変数関係モデルを抽出するステップと
を含み、
前記潜在変数モデルと前記信号・潜在変数関係モデルと前記付加情報・潜在変数関係モデルとを統合してトピックモデルとする
ことを特徴とする請求項6又は7に記載の半教師トピックモデル学習方法。
【請求項9】
前記トピックモデル学習部は、
付加情報・潜在変数関係モデル更新部が、前記付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合と前記蓄積潜在変数集合とから、前記不完全蓄積信号特徴集合に対応する潜在変数の分布を考慮して前記付加情報・潜在変数関係モデルを更新するステップと、
付加情報・潜在変数関係モデル補正部が、前記付加情報・潜在変数関係モデルが更新した付加情報・潜在変数関係モデルと前記蓄積付加情報特徴集合とから、当該蓄積付加情報特徴集合の情報を一定程度保持するように付加情報・潜在変数関係モデルを補正するステップと
を更に含むことを特徴とする請求項8に記載の半教師トピックモデル学習方法。
【請求項10】
前記潜在変数モデル学習部は、各蓄積潜在変数をパラメータとする確率密度関数の重ね合わせで潜在変数モデルを抽出し、
前記信号・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ蓄積信号特徴をパラメータとする確率密度関数に基づいて、信号・潜在変数関係モデルを抽出し、
前記付加情報・潜在変数関係モデル学習部は、各蓄積潜在変数に対して個別に、かつ付加情報特徴をパラメータとする確率密度関数に基づいて、付加情報・潜在変数関係モデルを抽出する
ことを特徴とする請求項8又は9に記載の半教師トピックモデル学習方法。
【請求項11】
与えられた信号と、その信号を説明する情報である付加情報との関係性を学習する半教師トピックモデル学習装置としてのコンピュータに、
蓄積信号特徴抽出部が、付加情報が予め付与された信号の集合である完全蓄積信号集合の要素である完全蓄積信号、及び付加情報が与えられていない信号の集合である不完全蓄積信号集合の要素である不完全蓄積信号のそれぞれから、各信号の特性を表現するベクトルである蓄積信号特徴を抽出するステップと、
蓄積付加情報特徴抽出部が、前記完全蓄積信号に付与された付加情報の集合である蓄積付加情報集合の要素である蓄積付加情報のそれぞれから、蓄積付加情報の特性を表現するベクトルである蓄積付加情報特徴を抽出するステップと、
蓄積潜在変数抽出部が、前記完全蓄積信号の蓄積信号特徴の集合である完全蓄積信号特徴集合と、前記不完全蓄積信号の蓄積信号特徴の集合である不完全蓄積信号特徴集合と、前記蓄積付加情報特徴の集合である蓄積付加情報特徴集合とから、信号と付加情報の関係性を記述するための変数である蓄積潜在変数を抽出するステップと、
トピックモデル学習部が、前記完全蓄積信号特徴集合と、前記不完全蓄積信号特徴集合と、前記蓄積付加情報特徴集合と、前記蓄積潜在変数の集合である蓄積潜在変数集合とから、信号と付加情報との関係性を記述するモデルであるトピックモデルを抽出するステップと
を実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate