説明

クエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラム

【課題】歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できるクエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラムを提供する。
【解決手段】歌詞に合った画像を検索するためのクエリ抽出装置100であって、クエリ抽出対象となる歌詞を複数に区分し、それらの区分から優先的にキーワード群が選択される優先区分を決定し、1または2以上の他の区分の情報も参照して、優先区分の歌詞に合った画像を検索するためのキーワード群を選択する。これにより、優先区分にあったキーワードが優先的に選択され、かつ他の区分も参照して画像検索用クエリを抽出するため、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌詞に合った画像を検索するためのクエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラムに関する。
【背景技術】
【0002】
従来、画像と楽曲を同期させて再生する装置が知られている。特許文献1記載の情報再生装置は、デジタルカメラで撮影した画像のスライドショー再生時に、その再生する画像の撮影時期に見合うBGMを再生することで映像鑑賞効果をさらに高めている。そして、画像を主体として、音楽を検索して自動でBGMを付与させている。音楽は、曲の発売日、または、曲の人気ランキングの最高となった期間などの日付と、撮影時期をマッチングさせて検索している。
【0003】
特許文献2記載の音楽配信サーバは、楽曲を再生させる際に、サーバのデータベースに記憶されている楽曲を選択し、該当楽曲に同期させて表示させるべき歌詞・解説・画像などの項目を指定している。そして、サーバにおいて、該当楽曲と、該当楽曲のヘッダに同期再生のための時間間隔を書き込んで端末に送信することで楽曲とその他情報を同期させて再生させている。
【0004】
特許文献3記載の携帯情報端末は、楽曲再生時に、音声認識によって歌詞を抽出し、その抽出された歌詞から所定のルールに基づいてキーワードを抽出している。そして、キーワードに基づいて、ローカルストレージやインターネット上のWEBページから画像を検索し、楽曲再生時に画像を表示させている。
【0005】
所定のルールとは、例えば、ある設定期間内の歌詞単語の中で最も多く使用された単語を抽出キーワードとするようなルールや、ある設定期間内の歌詞単語の中で最も大きく発声された単語を抽出キーワードとするようなルール、ある設定期間内の複数の単語の中からランダムに選択した単語をキーワードとするようなルールである。
【0006】
特許文献3記載の携帯情報端末は、インターネット上のウェブページを検索先として画像検索を行う場合、キーワードを用いてインターネット上の検索エンジンなどを用いて画像検索を行う。また、インターネット上のウェブページを検索先とする場合、好ましくない画像が検索されるのを防ぐためのフィルタリング処理、あるいは、例えば所望のジャンル等の画像のみが検索されるようなフィルタリング処理を行うことも可能となっている。
【0007】
なお、フィルタリング処理は、インターネットを経由して画像検索を行う際だけでなく、例えば、キーワードを抽出する際に行っても良いとしている。この場合、好ましくない画像が検索されてしまう可能性が高いキーワードを抽出しないようなフィルタリング処理や、逆に、例えば所望のジャンル等の画像が検索される可能性が高いキーワードのみを抽出するようなフィルタリング処理を行うことも可能となっている。
【0008】
特許文献4記載の画像提示装置は、楽曲から歌詞を抽出し、抽出された歌詞の出現時間を特定し、あらかじめ複数の視覚効果と視覚効果の表示に要する時間情報を対応させている。そして、抽出された歌詞に基づいて視覚効果を決定し、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付与している。
【0009】
視覚効果データベースは、単語と視覚効果とを対応づけて保持している。視覚効果は、抽出された歌詞中の単語が視覚効果データベースに存在するか探索し、単語が存在した場合には、その単語に対応する視覚効果とその視覚効果の所要時間とを視覚効果データベースから取得する。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2006−164229号公報
【特許文献2】特開2002−73049号公報
【特許文献3】特開2008−8954号公報
【特許文献4】特開2006−154626号公報
【非特許文献】
【0011】
【非特許文献1】S.Xu et al., “Automatic Generation of Music Slide Show using Personal Photos”,IEEE ISM 2008, pp.214-219
【非特許文献2】R.Cai et al., “Automated Music Video Generation Using Web Image Resource”, IEEE ICASSP 2007, Vol.2, pp.737-740
【非特許文献3】舟澤ほか: “歌詞の印象に基づく楽曲検索のための楽曲自動分類に関する検討”, 第71回情処全大, 5R-2, 2009
【発明の概要】
【発明が解決しようとする課題】
【0012】
しかしながら、上記の文献記載の技術では、画像と同期させようとする部分以外の単語をクエリとすることができない。特許文献1〜4記載の従来技術では、歌詞全体や段落の雰囲気に合う画像を表示させることができず、基本的に歌詞の一部の単語しか利用することができない。たとえば、楽曲と同期再生させる際に、同期再生対象となる部分の歌詞以外の部分(たとえば前後の歌詞)を考慮することや、歌詞全体から受ける印象を画像検索に考慮することができない。その結果、画像検索において、歌詞と同期させて再生するために不適切な画像が抽出される問題がある。
【0013】
本発明は、このような事情に鑑みてなされたものであり、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できるクエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0014】
(1)上記の目的を達成するため、本発明の画像検索用クエリの抽出装置は、歌詞に合った画像を検索するためのクエリ抽出装置であって、クエリ抽出対象となる歌詞を複数に区分し、それらの区分から、優先的にキーワード群が選択される優先区分を決定し、1または2以上の他の区分の情報も参照して、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴としている。これにより、1つの区分にあったキーワードが優先的に選択され、かつ他の区分も参照して画像検索用クエリを抽出するため、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できる。
【0015】
(2)また、本発明のクエリ抽出装置は、前記クエリ抽出対象となる歌詞の1つの行を前記優先区分として、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴としている。これにより、行ごとに適合する画像を検索できる。
【0016】
(3)また、本発明のクエリ抽出装置は、前記クエリ抽出対象となる歌詞の段落を前記他の区分として参照し、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴としている。これにより、段落を考慮した画像を検索できる。
【0017】
(4)また、本発明のクエリ抽出装置は、前記クエリ抽出対象となる歌詞の全体または一部分の印象情報を前記他の区分の情報として参照し、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴としている。これにより、印象情報を考慮した画像を検索できる。
【0018】
(5)また、本発明のクエリ抽出装置は、2以上の互いに異なる区分の情報を、前記他の区分の情報として参照し、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴としている。これにより、たとえば、段落と印象情報のいずれも考慮した画像が検索できる。
【0019】
(6)また、本発明のクエリ抽出装置は、Web検索結果に基づいて算出された重要度の高さを基準として、前記画像検索用のキーワード群として選択することを特徴としている。これにより、Web上の情報を反映させて画像検索に効果のあるキーワードを選択できる。
【0020】
(7)また、本発明のクエリ抽出装置は、Web上の画像検索において1以上のヒット数があり、キーワード数が最大となるキーワード群をキーワード群の集合から選択する過程を繰り返すことで、前記優先区分の歌詞に合った画像を検索するためのキーワード群として選択することを特徴としている。これにより、Web上の情報を反映させて画像検索に効果のあるキーワードを選択できる。
【0021】
(8)また、本発明のクエリ抽出装置は、前記優先区分から選ばれたキーワード群のべき集合から1つのキーワード群を選択し、さらに他の区分から選ばれたキーワード群のべき集合と前記選択されたキーワード群の組合せの集合から前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴としている。これにより、各区分のキーワード群を隈なく参照でき、1つの区分から優先的にキーワードを選択できる。
【0022】
(9)また、本発明のクエリ抽出装置は、前記優先区分または他の区分の歌詞から分解された単語の集合から、(ユニークな画像投稿者数)/{log(検索ヒット数)}が多いものをキーワードとして抽出することを特徴としている。これにより、Web上の情報を参照して実質的に画像検索に効果的なキーワードを抽出できる。
【0023】
(10)また、本発明のクエリ抽出装置は、前記優先区分の歌詞に合った画像を検索するために選択されたキーワード群をクエリとしてWeb上で画像検索し、検索の結果得られた画像と前記クエリ抽出対象となる歌詞に対応する楽曲とを同期させて再生することを特徴としている。これにより、楽曲に合わせて、歌詞に適した画像を同期再生することができる。
【0024】
(11)また、本発明のクエリ抽出装置は、歌詞に合った画像を検索するためのクエリ抽出装置であって、クエリ抽出対象となる歌詞を形態素に分解する形態素解析部と、前記分解された形態素から、キーワードを抽出するキーワード抽出部と、区分された前記クエリ抽出対象となる歌詞について、優先的にキーワード群が選択される優先区分から分解抽出されたキーワード群のべき集合から1の要素を選択し、他の区分から分解抽出されたキーワード群のべき集合の各要素と前記選択された要素との組合せのうちから前記優先区分の歌詞に合った画像を検索するためのクエリとして1の組合せを抽出するクエリ抽出部とを備えることを特徴としている。これにより、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できる。
【0025】
(12)また、本発明のクエリ抽出装置は、歌詞に合った画像を検索するためのクエリ抽出装置であって、クエリ抽出対象となる歌詞を形態素に分解する形態素解析部と、前記分解された形態素から、キーワードを抽出するキーワード抽出部と、区分された前記クエリ抽出対象となる歌詞について、優先的にキーワード群が選択される優先区分から分解抽出されたキーワード群のべき集合から1の要素を選択し、他の区分の印象情報からなるキーワード群のべき集合の各要素と前記選択された要素との組合せのうちから1の組合せを抽出するクエリ抽出部とを備えることを特徴としている。これにより、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できる。
【0026】
(13)また、本発明のクエリ抽出方法は、歌詞に合った画像を検索するためのクエリ抽出方法であって、クエリ抽出対象となる歌詞を複数に区分するステップと、それらの区分から、優先的にキーワード群が選択される優先区分を決定するステップと、1または2以上の他の区分の情報も参照して、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択するステップとを含むことを特徴としている。これにより、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できる。
【0027】
(14)また、本発明のクエリ抽出プログラムは、歌詞に合った画像を検索するためにコンピュータに実行させるクエリ抽出プログラムであって、クエリ抽出対象となる歌詞を複数の区分する処理と、それらの区分から、優先的にキーワード群が選択される優先区分を決定する処理と、1または2以上の他の区分の情報も参照して、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択する処理とを含むことを特徴としている。これにより、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できる。
【発明の効果】
【0028】
本発明によれば、歌詞の一部分に合っており、かつその他の部分との適合性もある画像を検索できる。
【図面の簡単な説明】
【0029】
【図1】第1の実施形態のクエリ抽出システムの構成を示す図である。
【図2】第1の実施形態のクエリ抽出装置の構成を示すブロック図である。
【図3】第1の実施形態のクエリ抽出装置の動作の一例を示すフローチャートである。
【図4】第1の実施形態のクエリ抽出動作を示すフローチャートである。
【図5】第1の実施形態の動作例を示す概念図である。
【図6】第1の実施形態の動作例を示す概念図である。
【図7】第2の実施形態のクエリ抽出システムの構成を示す図である。
【発明を実施するための形態】
【0030】
次に、本発明の実施の形態について、図面を参照しながら説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては同一の参照番号を付し、重複する説明は省略する。
【0031】
[第1の実施形態]
本発明では、歌詞の雰囲気に適した画像を抽出するために、歌詞および、推定印象からキーワード候補を抽出する。さらに、最適なクエリ(キーワード群)をキーワード候補から抽出することで、歌詞の雰囲気に適した画像を自動で抽出し、不要な画像の検索を回避する。
【0032】
(システム構成)
図1は、クエリ抽出システム50の構成を示す図である。クエリ抽出システム50は、クエリ抽出装置100、楽曲データベース200および画像検索サーバ300から構成されている。
【0033】
クエリ抽出装置100は、たとえばPCや携帯端末であり、歌詞に基づいて歌詞に合った画像を検索するためのクエリを抽出する。クエリ抽出対象となる歌詞を複数に区分し、それらの区分から優先的にキーワード群が選択される優先区分を決定し、1または2以上の他の区分の情報も参照して、優先区分の歌詞に合った画像を検索するためのキーワード群を抽出する。
【0034】
楽曲データベース200は、楽曲ファイル、歌詞情報、歌詞同期情報、タイトル、アーティスト情報、楽曲印象情報を格納する。楽曲印象情報は、事前のアンケート調査、またはアンケート調査に基づく解析結果などを含み、既存のプログラムなどを用いた情報収集、解析により取得することが可能である。たとえば、あらかじめ所定の楽曲について印象情報を一般ユーザから収集しておき、収集したデータをもとに印象領域を分ける空間を定義する。そして、新たな楽曲の印象は、歌詞に基づいてその空間でどの印象領域に位置するかで決定することができる。なお、歌詞の行や段落の範囲は楽曲データベース200においてあらかじめ指定されているものとする。
【0035】
画像検索サーバ300は、端末からの要求に応じて画像を検索する。たとえば、GOOGLEAPIやFLICKR(登録商標)などの画像検索APIによる要求を受けて画像を検索する。
【0036】
(クエリ抽出装置の構成)
次に、クエリ抽出装置100の構成を説明する。図2は、クエリ抽出装置100の構成を示すブロック図である。図2に示すように、クエリ抽出装置は、楽曲提示部110、形態素解析部120、キーワード抽出部130、クエリ抽出部140、印象情報収集部150、画像抽出部160および再生部170を備えている。
【0037】
楽曲提示部110は、楽曲データベースに格納される楽曲や、クエリ抽出対象となる楽曲を提示する。ユーザは提示された集合を指定することができる。
【0038】
形態素解析部120は、指定された楽曲の歌詞情報から1行単位で形態素解析を実施する。ただし、必ずしも1行単位である必要はなく、1段落単位で行ってもよい。形態素解析は、たとえばMecabなどのオープンソース形態素解析エンジンを用いることで行うことができる。なお、形態素解析部120は、すべての行に対して形態素解析が実施されるまで処理を繰り返す。
【0039】
キーワード抽出部130は、形態素解析部120によって得られた形態素群からキーワードを抽出する。たとえば、全名詞をキーワードとして抽出することができる。また、名詞に限定する必要はなく、たとえば、形容詞や動詞などを組み合わせて抽出することもできる。キーワード抽出部130は、優先区分または他の区分の歌詞から分解された単語の集合から、(ユニークな画像投稿者数)/{log(検索ヒット数)}が多いものをキーワードとして抽出する。キーワード抽出部130は、歌詞の全ての行に対して単語を抽出し、各キーワードに対し、歌詞中の出現行、段落番号などをデータベース(図示せず)に記憶させる。
【0040】
また、キーワード抽出部130が抽出可能なキーワードは歌詞のみに限定される必要はなく、たとえば、既存の印象解析プログラムなどを用いることで、楽曲歌詞に対する印象に基づいたキーワードを用いることができる。楽曲データベース200にあらかじめ上記印象キーワードが保持されていれば、楽曲データベース200から情報を読み込む。
【0041】
キーワード抽出部130は、たとえば、キーワードの集合を(1)行に出現する名詞、(2)行を含む段落に出現する名詞、(3)楽曲全体の推定印象語などで構成することができる。キーワード抽出部130は、抽出されたキーワードを用いて、各行から画像検索の検索要求(クエリ)の候補となるキーワード(群)を抽出する。その結果、行単位での画像表示が可能となる。
【0042】
クエリ抽出部140は、キーワード抽出部によって抽出されたキーワードから、行単位で画像を表示させるために、各行から画像検索の検索要求(クエリ)となるキーワード(群)を抽出する。図2に示すように、クエリ抽出部140は、さらに集合特定部142および選択部145を備えている。
【0043】
集合特定部142は、キーワード群の集合について画像検索用のクエリ抽出を行う対象の集合を特定している。たとえば、歌詞の行のみを「優先区分」として特定する場合やこれまでに選択したキーワード群と段落等の「他の区分」との組合せを特定する。
【0044】
選択部145は、歌詞の1つの行(優先区分)から優先的に選択されるように、その行の歌詞に合った画像を検索するためのキーワード群を抽出する。その際には、歌詞の段落から選ばれたキーワード群の集合や歌詞の全体または一部分の印象情報(他の区分の情報)も参照することができる。
【0045】
たとえば、選択部145は、行から選ばれたキーワード群のべき集合から1つのキーワード群を選択し、さらに段落から選ばれたキーワード群のべき集合と選択されたキーワード群の組合せの集合から行の歌詞に合った画像を検索するためのキーワード群を選択する。歌詞の行から分解抽出されたキーワード群のべき集合から1の要素を選択し、歌詞の印象情報からなるキーワード群のべき集合の各要素と選択された要素との組合せのうちから1の組合せを選択してもよい。上記の「他の区分」の情報は、単一の区分からの情報であってもよいし、2以上の互いに異なる区分の情報であってもよい。
【0046】
選択部145は、Web検索結果に基づいて算出された重要度の高さを基準として、キーワード群(キーワード群の集合の要素)を画像検索用のものとして選択する。たとえば、Web上の画像検索において1以上のヒット数があり、キーワード数が最大となるキーワード群をキーワード群の集合から選択する過程を繰り返すことで、画像検索用のキーワード群として選択することができる。
【0047】
印象情報収集部150は、楽曲データベース200から楽曲の印象情報を収集する。楽曲を特定する情報に基づいて楽曲データベース200に印象情報を要求することで印象情報を収集できる。
【0048】
画像抽出部160は、クエリ抽出処理によって得られたW‘maxに基づいて画像検索を行う。たとえば、GOOGLEAPIやFLICKR(登録商標)などの画像検索APIを用いて画像を検索することができる。画像抽出部160は、APIによって抽出された画像から、同期再生させるための画像を抽出する。
【0049】
たとえば、最も人気のある画像を抽出することなどができる。必ずしも1画像のみを抽出する必要はなく、複数の画像を抽出することができる。画像抽出部160は、基本的にすべての歌詞の行に対して画像(群)を抽出する。また、クエリ抽出部140で、W‘maxを抽出する際に同時に画像抽出を行うことで、画像抽出部160でのAPIを使用しないこととしてもよい。
【0050】
再生部170は、選択された画像検索用のキーワード群をクエリとしてWeb上で画像検索し、検索の結果得られた画像とクエリ抽出対象となる歌詞に対応する楽曲とを同期させて再生する。すなわち、再生部170は、画像抽出部160から得られた画像(群)と歌詞同期情報に基づいて、時系列で同期をさせて楽曲を再生させる。このとき、画像をどのタイミングで表示させるかを表す歌詞同期情報を楽曲データベース200などから読み込んで再生させる。
【0051】
(クエリ抽出装置の動作)
図3は、クエリ抽出装置100の動作の一例を示すフローチャートである。図3に示すように、まず、クエリ抽出装置100は、楽曲データベース200に格納される楽曲を指定可能に提示する(ステップS1)。ユーザから楽曲の指定を受けたら、歌詞の行単位で形態素解析を行い、単語を抽出する(ステップS2)。そして全行の単語抽出が終了したか否かを判定する(ステップS3)。全行が終了していないと判定されたときには、ステップS2に戻る。
【0052】
全行について単語抽出が終了したと判定されたときには、抽出された単語の集合からキーワードの集合を抽出する(ステップS4)。キーワード抽出基準の一例については後述する。このように抽出されたキーワードの集合を用いてクエリを抽出する(ステップS5)。クエリ抽出動作およびクエリ抽出基準の一例については後述する。次に、抽出されたクエリを用いて画像を検索し、最適な画像を抽出する(ステップS6)。そして、抽出された画像を楽曲に同期させて再生する(ステップS7)。
【0053】
(クエリ抽出動作)
上記ステップS5のクエリ抽出動作の一例について説明する。図4は、クエリ抽出動作を示すフローチャートである。クエリ抽出の過程で、キーワード群を抽出する主な対象がキーワード群集合N1、N2、・・・、Ni、・・・、Nnと変わるものとする。iはn以下の自然数である。
【0054】
クエリ抽出動作では、まずi=1か否かを判定する(ステップT1)。i=1であると判定された場合には、キーワード群集合N1のべき集合を、キーワード群の抽出対象として特定する(ステップT2)一方、i=1でないと判定された場合には、これまでのクエリ抽出の過程で選ばれたキーワード群とキーワード群集合Niとのべき集合との組合せを、キーワード群の抽出対象として特定する(ステップT3)。
【0055】
次に、後述の基準を参照して、抽出対象となるキーワード群の集合から一つのキーワード群を選択する(ステップT4)。そして、i=nか否かを判定する(ステップT5)。i=nでないと判定された場合には、iを1増加させ(ステップT6)、ステップT1に戻る。i=nであると判定された場合には、クエリ抽出の動作を終了する。
【0056】
このようにして、歌詞に出現しない印象情報や、歌詞の前後関係を考慮して歌詞特徴に基づくクエリを自動抽出することができる。また、クエリ自体は、キーワード抽出によってえられたキーワードから必ずしも抽出する必要はなく、たとえば楽曲の印象情報や、段落に含まれるキーワードから、Wの値に基づいてクエリを抽出することができる。なお、以上の動作はプログラムにより実行される。
【0057】
(キーワード抽出基準)
キーワード抽出によって得られたキーワードをそのまま利用した場合には、意図しない画像が多く得られることがあるため、検索に適したキーワードを抽出する必要がある。たとえば、キーワードを基に画像検索APIなどを用いてキーワードを入力し、パラメータとして検索結果画像群に含まれるユニークな画像投稿者ID数(UF)と検索ヒット数(DF)を取得し、式(1)によって重要度を計算する。
【数1】

【0058】
この式を用いてWの値が高いほど重要度が高いと判断できる。最終的にWの降順などで閾値以上のWを有するものをキーワードとして抽出する。たとえば、UF=10、DF=40としたときのWの値を閾値と設定することができる。ただし、これは一例であり、閾値の選び方はこの限りではない。たとえば、GOOGLEAPIやFLICKR(登録商標)などの画像検索APIを用いてパラメータを計算することができる。このようにして、歌詞から各行ごとのキーワードを抽出する。
【0059】
(クエリ抽出基準)
クエリ抽出部140は、入力されたキーワード群から、画像検索に最適なクエリ群を抽出するための組み合わせを計算することができる。以下に、クエリ抽出基準の一例を示す。
【0060】
(1)キーワード群集合N1のべき集合P(N1)={W1,1,W1,2,…,W1,x}において,DF(W1,i)≧1を満たし、かつ、|W1,i|が最大となるようなWmaxを選出する。ここで|W|とは、単語集合Wを構成する要素数(名詞数)を示す。Wmaxが複数ある場合、UF(Wmax)が最大のものを選出する。こうして選出したWmaxを行クエリ集合Qlineとする。
【0061】
(2)キーワード群集合N2のべき集合P(N2)={W2,1,W2,2,…,W2,y}の各要素にQlineを加えた集合P’(N2)={W2,1∪Qline,W2,2∪Qline,・・・,W2,y∪Qline}={W’2,1,W’2,2,・・・,W‘2,y}において、1と同様の処理により、W’maxを選出する。なお、さらにW’maxの要素全てを用いて画像検索APIを用いてAND検索を行ってもよい。
【0062】
(動作例)
次に、具体的に歌詞から画像が検索され、楽曲と画像が同期再生される例を説明する。図5および図6は、動作例を示す概念図である。図5および図6に示す例では、歌詞411の第1行および第2行についてそれぞれ画像を検索、抽出し、抽出された画像を歌詞の行ごとに表示している。
【0063】
まず、図5に示すように、クエリ抽出装置100は、歌詞411の第1行「君と桜の花が舞い散る頃には」を形態素解析し、行キーワード413(キーワード群集合N1)として「君」、「桜」および「花」を抽出する。一方で、段落・印象キーワード414(キーワード群集合N2)として、第1段落から「僕」、「電車」および「東京」を、歌詞全体からの楽曲印象語から「男」、「夏」、「昼」、「晴れ」、「元気」および「恋愛」を抽出する。
【0064】
そして、「君」、「桜」および「花」の行キーワード413のべき集合から画像検索によるヒット数が1件以上であって語数の多いキーワード群を選択する。そして、その選択結果のキーワード群と段落・印象キーワード414の組合せのべき集合から画像検索によるヒット数が1件以上であって語数の多いキーワード群を選択する。その結果、抽出クエリ415として、たとえば「桜」、「昼」および「晴れ」というキーワード群を抽出することができる。そして、WEBサイトで画像検索を行い、最適な画像418を抽出することができる。そして、再生時には画面表示416として画像418と歌詞の行417を同期再生することができる。
【0065】
図6についても同様に、歌詞411の第2行「僕たちは別々だろう」を形態素解析し、行キーワード413(キーワード群集合N1)として「僕」および「別々」を抽出する。段落・印象キーワード414(キーワード群集合N2)としては第1行と同じ集合を使うことができる。
【0066】
そして、「僕」および「別々」の行キーワード423のべき集合から画像検索によるヒット数が1件以上であって語数の多いキーワード群を選択する。そして、その選択結果のキーワード群と段落・印象キーワード414の組合せのべき集合から画像検索によるヒット数が1件以上であって語数の多いキーワード群を選択する。その結果、抽出クエリ425として、たとえば「男」、「電車」、「夏」および「恋愛」というキーワード群を抽出することができる。そして、WEBサイトで画像検索を行い、最適な画像428を抽出することができる。そして、再生時には画面表示426として画像428と歌詞の行427を同期再生することができる。このような動作を繰り返すことで、歌詞の各行に合った画像を抽出して楽曲と同期再生することができる。
【0067】
[第2の実施形態]
上記の実施形態では、クエリ抽出装置はPCや携帯端末であるが、サーバであってもよい。図7は、クエリ抽出装置600がサーバとして機能するクエリ抽出システム550の構成を示す図である。図7に示すように、クエリ抽出システム550は、クエリ抽出装置600、端末700、楽曲データベース200、画像検索サーバ300を備えている。本実施形態では、クエリ抽出装置600がサーバとしてクエリを抽出、画像検索し、端末700はその結果を受け取る。そして、端末700は、抽出された画像を楽曲と同期させて再生する。このようなシステムは端末700の処理能力が低い場合には有効である。
【0068】
なお、以上の実施形態では、「優先区分」を単一の行としているが、2行や、3行としてもよいし、半分の行としてもよい。また、「他の区分」を歌詞全体や段落としているが、歌詞の番の区分としてもよいし半分の段落としてもよいし、行としてもよい。また、以上の実施形態では、楽曲データベース200はクエリ抽出装置の外部の装置であるが、クエリ抽出装置の内部に設けられていてもよい。
【符号の説明】
【0069】
50 クエリ抽出システム
100 クエリ抽出装置
110 楽曲提示部
120 形態素解析部
130 キーワード抽出部
140 クエリ抽出部
142 集合特定部
145 選択部
150 印象情報収集部
160 画像抽出部
170 再生部
200 楽曲データベース
300 画像検索サーバ
411 歌詞
413 行キーワード
414 段落・印象キーワード
415 抽出クエリ
416 画面表示
417 行
418 画像
423 行キーワード
425 抽出クエリ
426 画面表示
427 行
428 画像
550 クエリ抽出システム
600 クエリ抽出装置
700 端末


【特許請求の範囲】
【請求項1】
歌詞に合った画像を検索するためのクエリ抽出装置であって、
クエリ抽出対象となる歌詞を複数に区分し、
それらの区分から、優先的にキーワード群が選択される優先区分を決定し、
1または2以上の他の区分の情報も参照して、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴とするクエリ抽出装置。
【請求項2】
前記クエリ抽出対象となる歌詞の1つの行を前記優先区分として、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴とする請求項1記載のクエリ抽出装置。
【請求項3】
前記クエリ抽出対象となる歌詞の段落を前記他の区分として参照し、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴とする請求項1または請求項2記載のクエリ抽出装置。
【請求項4】
前記クエリ抽出対象となる歌詞の全体または一部分の印象情報を前記他の区分の情報として参照し、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴とする請求項1から請求項3のいずれかに記載のクエリ抽出装置。
【請求項5】
2以上の互いに異なる区分の情報を、前記他の区分の情報として参照し、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴とする請求項1から請求項4のいずれかに記載のクエリ抽出装置。
【請求項6】
Web検索結果に基づいて算出された重要度の高さを基準として、前記画像検索用のキーワード群として選択することを特徴とする請求項1から請求項5のいずれかに記載のクエリ抽出装置。
【請求項7】
Web上の画像検索において1以上のヒット数があり、キーワード数が最大となるキーワード群をキーワード群の集合から選択する過程を繰り返すことで、前記優先区分の歌詞に合った画像を検索するためのキーワード群として選択することを特徴とする請求項6記載のクエリ抽出装置。
【請求項8】
前記優先区分から選ばれたキーワード群のべき集合から1つのキーワード群を選択し、
さらに他の区分から選ばれたキーワード群のべき集合と前記選択されたキーワード群の組合せの集合から前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択することを特徴とする請求項1から請求項7のいずれかに記載のクエリ抽出装置。
【請求項9】
前記優先区分または他の区分の歌詞から分解された単語の集合から、(ユニークな画像投稿者数)/{log(検索ヒット数)}が多いものをキーワードとして抽出することを特徴とする請求項1から請求項8のいずれかに記載のクエリ抽出装置。
【請求項10】
前記優先区分の歌詞に合った画像を検索するために選択されたキーワード群をクエリとしてWeb上で画像検索し、
検索の結果得られた画像と前記クエリ抽出対象となる歌詞に対応する楽曲とを同期させて再生することを特徴とする請求項1から請求項9のいずれかに記載のクエリ抽出装置。
【請求項11】
歌詞に合った画像を検索するためのクエリ抽出装置であって、
クエリ抽出対象となる歌詞を形態素に分解する形態素解析部と、
前記分解された形態素から、キーワードを抽出するキーワード抽出部と、
区分された前記クエリ抽出対象となる歌詞について、優先的にキーワード群が選択される優先区分から分解抽出されたキーワード群のべき集合から1の要素を選択し、他の区分から分解抽出されたキーワード群のべき集合の各要素と前記選択された要素との組合せのうちから前記優先区分の歌詞に合った画像を検索するためのクエリとして1の組合せを抽出するクエリ抽出部とを備えることを特徴とするクエリ抽出装置。
【請求項12】
歌詞に合った画像を検索するためのクエリ抽出装置であって、
クエリ抽出対象となる歌詞を形態素に分解する形態素解析部と、
前記分解された形態素から、キーワードを抽出するキーワード抽出部と、
区分された前記クエリ抽出対象となる歌詞について、優先的にキーワード群が選択される優先区分から分解抽出されたキーワード群のべき集合から1の要素を選択し、他の区分の印象情報からなるキーワード群のべき集合の各要素と前記選択された要素との組合せのうちから1の組合せを抽出するクエリ抽出部とを備えることを特徴とするクエリ抽出装置。
【請求項13】
歌詞に合った画像を検索するためのクエリ抽出方法であって、
クエリ抽出対象となる歌詞を複数に区分するステップと、
それらの区分から、優先的にキーワード群が選択される優先区分を決定するステップと、
1または2以上の他の区分の情報も参照して、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択するステップとを含むことを特徴とするクエリ抽出方法。
【請求項14】
歌詞に合った画像を検索するためにコンピュータに実行させるクエリ抽出プログラムであって、
クエリ抽出対象となる歌詞を複数の区分する処理と、
それらの区分から、優先的にキーワード群が選択される優先区分を決定する処理と、
1または2以上の他の区分の情報も参照して、前記優先区分の歌詞に合った画像を検索するためのキーワード群を選択する処理とを含むことを特徴とするクエリ抽出プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−48729(P2011−48729A)
【公開日】平成23年3月10日(2011.3.10)
【国際特許分類】
【出願番号】特願2009−197920(P2009−197920)
【出願日】平成21年8月28日(2009.8.28)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】