説明

Webページに対して適合する画像を提示するシステム

【課題】入力される文書テキストの意味内容に適合する画像を効率よく出力するシステムを提供すること。
【解決手段】画像提示装置10において、抽出する画像データを記憶する画像データベース21は、画像データが表す画像を文章に表現した場合に文章の中で意味を持つ最小単位である形態素と画像との関連の強さを数値化した意味特徴量データを画像データごとに記憶している。そして、画像提示装置10は、ユーザが入力したテキストデータを取得し、そのテキストデータの中の形態素及び形態素の使用回数の集合であるバグオブワードを作成し、画像の意味特徴量データ及び入力したテキストデータのバグオブワードに基づいて、テキストデータと画像データとの適合度を計算し、適合度の高い画像データを抽出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像を提示するシステムに関する。特に、Webページに対して適合する画像を提示するシステムに関する。
【背景技術】
【0002】
従来、Web上の文書であるWebページの作成において、Webページの背景画像等は作成者が指定することができる。そこで、Webページの作成者は、画像データベース等に対して、画像に付与されたタグ等を手がかりにした手作業による検索を行い、探し出した画像を指定することにより、Webページを特徴付け、多くの読者を惹きつけることができるような内容としている。
【0003】
Webページの作成における文書を特徴付ける関連技術として、SGML(Standard Generalized Markup Language)のような構造化文書において、スタイルシートによる情報から表示出力を得る際に、構造的に重要な箇所及びユーザにとって重要なキーワードを、ユーザの色の好みに従って変換し提示する技術が提示されている(特許文献1参照)。
【特許文献1】特開2005−73081号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1の技術では、スタイルシートの指示により行われ、構造化文書において利用できる技術であり、構造化されていない文書では利用できない。また、ユーザの好みは反映されているが、文書が表現する意味内容は反映されていない。
【0005】
一方、ブログやSNS(Social Networking Service)の日記のような記事は、タイトルと本文で構成されていることが一般的であり、殆ど構造化されていない非構造化の文書である。また、その記事の意味内容を反映した背景画像、挿絵、記事エントリーアイコン等を用いることで、より読者を惹きつける内容にすることが出来ると考えられる。そこで、投稿される記事について、構造化された文書であるか否かに関わらず、記事の意味内容に適合した、背景画像等に使う画像を効率よく検索することが出来るシステムが求められている。
【0006】
本発明は、入力される文書テキストの意味内容に適合する画像を効率よく出力するシステムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明では、以下のような解決手段を提供する。
【0008】
(1) 画像データを抽出し、ユーザに提示する画像提示システムにおいて、前記画像データが表す画像を文章に表現した場合に前記文章の中で意味を持つ最小単位である形態素と前記画像との関連の強さを数値化した意味特徴量データを前記画像データごとに記憶する画像データベースと、前記ユーザが入力したテキストデータを取得するテキスト取得部と、前記テキスト取得部が取得した前記テキストデータを解析して得られた形態素及び該形態素が前記テキストデータの中で使用される回数の集合であるバグオブワードを作成するバグオブワード作成部と、前記意味特徴量データ及び前記バグオブワードに基づいて、前記テキストデータと前記画像データとの適合度を計算する適合度計算部と、前記適合度計算部の計算結果に基づいて、前記画像データベースの中から前記適合度の高い画像データを抽出する画像データ抽出部と、を備えることを特徴とする画像提示システム。
【0009】
(1)の構成によれば、画像提示システムにおいて、抽出する画像データを記憶する画像データベースは、画像データが表す画像を文章に表現した場合に文章の中で意味を持つ最小単位である形態素と画像との関連の強さを数値化した意味特徴量データを画像データごとに記憶している。そして、画像提示システムは、ユーザが入力したテキストデータを取得し、そのテキストデータの中の形態素及び形態素の使用回数の集合であるバグオブワードを作成し、画像の意味特徴量データ及び入力したテキストデータのバグオブワード、に基づいて、テキストデータと画像データとの適合度を計算し、適合度の高い画像データを抽出する。
【0010】
このことにより、画像データベースが、画像ごとに意味特徴量データを記憶し、画像提示システムは、ユーザが入力したテキストデータのバグオブワード及び画像の意味特徴量データに基づいて、テキストデータと画像との適合度を計算し、適合度の高い画像データを抽出するので、入力される文書テキストの意味内容に適合する画像を効率よく出力することができる。
【0011】
(2) (1)に記載の画像提示システムにおいて、前記画像データベースは、前記画像の雰囲気の特徴度を数値化した雰囲気特徴量データを、前記画像データごとにさらに記憶し、前記画像提示システムは、前記ユーザの情報と共に、前記ユーザの嗜好を数値化した嗜好パラメータを記憶するユーザデータベースをさらに備え、前記適合度計算部は、前記意味特徴量データ及び前記バグオブワード、並びに、前記雰囲気特徴量データ及び前記嗜好パラメータに基づいて、前記テキストデータ及び前記ユーザと前記画像データとの適合度を計算することを特徴とする画像提示システム。
【0012】
(2)の構成によれば、画像データベースは、画像の雰囲気の特徴度を数値化した雰囲気特徴量データを画像データごとにさらに記憶し、画像提示システムは、テキストデータを入力するユーザの情報を記憶すると共に、ユーザの嗜好を数値化した嗜好パラメータを記憶するユーザデータベースをさらに備える。そして、画像提示システムは、画像の意味特徴量データ及び入力したテキストデータのバグオブワード、並びに、画像の雰囲気特徴量データ及びテキストデータを作成したユーザの嗜好パラメータに基づいて、テキストデータ及びユーザと画像データとの適合度を計算し、適合度の高い画像データを抽出する。
【0013】
このことにより、画像提示システムは、画像データベースとして、画像ごとに意味特徴量データと、雰囲気特徴量データを記憶し、ユーザデータベースとして、嗜好パラメータを記憶し、ユーザが入力したテキストデータのバグオブワード及び画像の意味特徴量データ、並びに、テキストデータを作成したユーザの嗜好パラメータ及び画像の雰囲気特徴量データに基づいて、画像の適合度を計算し、適合度の高い画像データを抽出するので、入力される文書テキストの意味内容と、ユーザの好みとに適合する画像を効率よく出力することができる。
【0014】
(3) (2)に記載の画像提示システムにおいて、前記画像の前記意味特徴量データの初期値は、予め手作業により作成し、前記画像の前記雰囲気特徴量データの初期値は、全ユーザの平均値によって与えられ、前記提示された前記画像に対する前記ユーザの選択に応じて、事後確率最大化法により、前記ユーザが選択した画像の前記意味特徴量データ及び前記ユーザの前記嗜好パラメータを更新することを特徴とする画像提示システム。
【0015】
(3)の構成によれば、画像の意味特徴量データの初期値は、予め手作業により作成し、画像の雰囲気特徴量データの初期値は、全ユーザの平均値によって与えられ、提示された画像に対するユーザの選択に応じて、事後確率最大化法により、ユーザが選択した画像の意味特徴量データ及びユーザの嗜好パラメータを更新するので、適合度の計算結果がより的確になり、さらに適合度の高い画像データを抽出することが可能となる。したがって、入力される文書テキストの意味内容と、ユーザの好みとに適合する画像をさらに効率よく出力することができる。
【0016】
(4) 画像データを抽出し、ユーザに提示する方法において、前記ユーザが入力したテキストデータを取得するステップと、前記テキストデータを解析して得られた形態素及び該形態素が前記テキストデータの中で使用される回数の集合であるバグオブワードを作成するステップと、前記画像データが表す画像を文章に表現した場合に前記文章の中で意味を持つ最小単位である形態素と前記画像との関連の強さを数値化した意味特徴量データ及び前記バグオブワードに基づいて、前記テキストデータと前記画像データとの適合度を計算するステップと、前記計算の結果に基づいて、前記適合度の高い画像データを抽出するステップと、を含む方法。
【0017】
(4)の構成によれば、本発明の方法は、ユーザが入力したテキストデータを取得し、テキストデータを解析して得られた形態素及び該形態素がテキストデータの中で使用される回数の集合であるバグオブワードを作成し、画像データが表す画像を文章に表現した場合に文章の中で意味を持つ最小単位である形態素と画像との関連の強さを数値化した意味特徴量データ及び取得したテキストデータのバグオブワードに基づいて、テキストデータと画像データとの適合度を計算し、計算の結果に基づいて、適合度の高い画像データを抽出する。したがって、本発明の方法は、入力される文書テキストの意味内容に適合する画像を効率よく出力することができる。
【0018】
(5) 画像データを抽出し、ユーザに提示するコンピュータ・プログラムにおいて、前記ユーザが入力したテキストデータを取得するステップと、前記テキストデータを解析して得られた形態素及び該形態素が前記テキストデータの中で使用される回数の集合であるバグオブワードを作成するステップと、前記画像データが表す画像を文章に表現した場合に前記文章の中で意味を持つ最小単位である形態素と前記画像との関連の強さを数値化した意味特徴量データ及び前記バグオブワードに基づいて、前記テキストデータと前記画像データとの適合度を計算するステップと、前記計算の結果に基づいて、前記適合度の高い画像データを抽出するステップと、をコンピュータに実行させるコンピュータ・プログラム。
【0019】
(5)の構成によれば、本発明のコンピュータ・プログラムは、ユーザが入力したテキストデータを取得し、テキストデータを解析して得られた形態素及び該形態素がテキストデータの中で使用される回数の集合であるバグオブワードを作成し、画像データが表す画像を文章に表現した場合に文章の中で意味を持つ最小単位である形態素と画像との関連の強さを数値化した意味特徴量データ及び取得したテキストデータのバグオブワードに基づいて、テキストデータと画像データとの適合度を計算し、計算の結果に基づいて、適合度の高い画像データを抽出する。したがって、本発明のコンピュータ・プログラムは、コンピュータに、入力される文書テキストの意味内容に適合する画像を効率よく出力させることができる。
【発明の効果】
【0020】
本発明によれば、入力される文書テキストの意味内容に適合する画像を効率よく出力するシステムを提供することができる。
【発明を実施するための最良の形態】
【0021】
以下、本発明の実施形態について図を参照しながら説明する。
【0022】
[実施例1]
本発明の1つの実施の形態として、画像提示装置10を例に挙げて説明する。
この画像提示装置10は、テキスト取得部11と、バグオブワード作成部12と、適合度計算部13と、画像データ抽出部14と、画像データベース21と、ユーザデータベース22とを備えている。そして、ユーザが入力したテキストデータを解析し、バグオブワードを作成し、画像の意味特徴量データ及びバグオブワード、並びに画像の雰囲気特徴量データ及びユーザの嗜好パラメータに基づいて、画像の適合度を計算し、適合度の高い画像データを抽出する。したがって、入力される文書テキストの意味内容と、ユーザの好みとに適合する画像を効率よく出力する。以下、本発明の実施形態について、図に従って説明する。
【0023】
図1は、本発明の機能を構成する構成部と、構成部が処理するデータとの関連を示す図である。
【0024】
テキスト取得部11は、ユーザが作成したテキストデータを取得する。
【0025】
バグオブワード作成部12は、ユーザが作成したテキストデータについて形態素解析を行い、意味特徴量に対応したバグオブワードwを作成する。バグオブワードwは次の様に表すことができる。
w={w,w,w,w,w,・・・}
【0026】
適合度計算部13は、テキストデータ及びユーザと、画像データとの適合度を計算する。画像Iがもつ意味特徴量データをW、後述する学習過程で得られる雰囲気特徴量データをE、対象とするユーザの嗜好を表す嗜好パラメータをuとすると、画像Iの適合度Sは、次の式で求めることができる。
=λF(W,w)+(1−λ)G(E,u)
【0027】
ここで、F()及びG()はスコアリング関数で、例えばF()に関しては、類似文検索で通常用いられるようなスコア(TFIDFによる各次元の重み付けをした内積)を用いる。
【0028】
G()は、次のような離散確率分布やガウス分布の組み合わせで表現することができる。すなわち、、嗜好パラメータu及び画像の雰囲気特徴量Eを、次の様に表す。
u={p,p,p,p,μ,σ,μ,σ,p,p,μ,σ
,p10,p11
={EI,0,EI,1,EI,2,EI,3,EI,4,EI,5,EI,6,EI,7
I,8,EI,9,EI,10,EI,11
そうすると、G(E,u)は、次の式で求めることができ、これを対数確率と考えることができる。
G(E,u)=log{P(EI,0,p)*P(EI,1,p
*P(EI,2,p)*P(EI,3,p
*N(EI,4,μ,σ
*N(EI,5,μ,σ
*P(EI,6,p)*P(EI,7,p
*N(EI,8,p)*P(EI,9,p
*P(EI,10,p10)*P(EI,11,p11)}
【0029】
上記式でP(x,p)は、pは二値の特徴量に対して、0ではなく1を選択する確率とする。つまり、P(x,p)は、次の式で求めることができる。
P(x,p)=p*x+(1−p)*(1−x)
【0030】
また、N(x,μ,σ)は、平均μ、分散σの正規分布であり、次の式で求めることができる。
【0031】
【数1】

【0032】
λは、意味特徴と雰囲気特徴のどちらをより重視するかを決める重み係数である。これは経験的に決定する。以上のような条件で、適合度を計算し、適合度の高い画像を抽出する。
【0033】
上述の式について、具体的な数値により適合度計算の例を示す。
画像の意味特徴量は語彙に対する重みベクトルで与えられ、その画像を文書にした場合の文書中のキーワードとの関連の強さを表現する。意味特徴量は、初期値を手作業で与えられ、後述する学習によって変化する。
例えば、画像1が、室内の25メートルの競泳用プールで泳ぐ人を表した画像とする。そうすると、例えば、画像1の意味特徴量であるW1は、語彙と重みにより、次の様に表される。
={プール=1.2,水泳=0.5,泳ぎ=0.5,泳ぐ=0.5,
25=0.3,メートル=0.3,室内=0.2,温水=0.2}
また、画像2が、桜の下を歩く人を表した画像とする。そうすると、例えば、画像2の意味特徴量であるW2は、同様に、次の様に表される。
={桜=1.5,花見=1.1,卒業=0.3,入学=0.2,別れ=0.2,出会い=0.2,団子=0.1,散る=0.1,花びら=0.1,季節=0.1}
【0034】
画像の雰囲気特徴量は、写真であるか、水彩風であるか、ポップアート風であるか、アニメ風であるか、コントラストの強さ、モノカラーか、画像の製作者がAであるか、画像の製作者がBであるか等で表される。その値は、手作業で付与されるか、画像データから直接計算される。これらは二値の特徴の場合と、連続値の特徴の場合がある。例えば、写真であるか否かは、1か0の二値の特徴で、コントラストの強さは0.0〜1.0の連続値の特徴で表される。
例えば、雰囲気特徴量データの例として、インデックスを、次の様にする。
0:写真,1:水彩風,2:ポップアート風,3:アニメ風,4:コントラスト,
5:濃淡,6:カラー,7:人物を含む,8:抽象度,9:製作者A,
10:製作者B,11:製作者C
【0035】
そして、例えば、画像1の雰囲気特徴量であるE1を次のように表す。
=[0,1,0,0,0.3,0.6,1,0,0.1,1,0,0]
同様に、例えば、画像2の雰囲気特徴量であるE2を次のように表す。
=[1,0,0,0,0.4,0.8,1,0,0.2,0,1,0]
【0036】
例えば、ユーザが入力したテキストデータが、「久しぶりにプールに行ってきました。泳ぎを忘れてしまったようです。25メートルが長く感じられました。」であるとする。
この場合の、バグオブワードwは、形態素と重みにより、次の様に表される。
w={久しぶり=1,プール=1,行く=1,くる=1,泳ぎ=1,忘れる=1,
しまう=1,25=1,メートル=1,長い=1,感じる=1}
ここで、重みは入力テキストデータの中の出現回数である。
【0037】
また、ユーザの嗜好パラメータuは、例えば、次の様な値とする。
u={p=0.1,p=0.3,p=0.5,p=0.1,
μ=0.4,σ=0.3,μ=0.4,σ=0.6,
=0.3,p=0.1,μ=0.6,σ=0.3,
=0.3,p10=0.1,p11=0.6}
そして、意味特徴量と雰囲気特徴量の重み付けは、λ=0.5とする。
【0038】
この場合の、上記例の画像1の適合度を求める。
F(W,w)=1.2(プール)+0.5(泳ぎ)+0.3(メートル)=2.0
G(E,u)=log{P(0,0.1)*P(1,0.3)*P(0,0.5)
*P(0,0.1)*N(0.3,0.4,0.3)
*N(0.6,0.4,0.6)*P(1,0.3)
*P(0,0.1)*N(0.1,0.6,0.3)
*P(1,0.3)*P(0,0.1)
*P(0,0.6)}
=log{(1−0.1)*(0.3)*(1−0.5)
*(1−0.1)*(0.39)*(0.38)
*(0.3)*(1−0.1)*(0.26)
*(0.3)*(1−0.1)*(1−0.6)}
=log(0.00013)
=−3.9
【0039】
したがって、適合度Sは、次の様に求めることができる。
=λF(W,w)+(1−λ)G(E,u)
=0.5*2.0+(1−0.5)*(−3.9)
=−1.0
【0040】
同様にして、画像2との適合度を求める。
F(W,w)=0
G(E,u)=log{P(1,0.1)*P(0,0.3)*P(0,0.5)
*P(0,0.1)*N(0.4,0.4,0.3)
*N(0.8,0.4,0.6)*P(1,0.3)
*P(0,0.1)*N(0.2,0.6,0.3)
*P(0,0.3)*P(1,0.1)
*P(0,0.6)}
=log{(0.1)*(1−0.3)*(1−0.5)
*(1−0.1)*(0.40)*(0.35)
*(0.3)*(1−0.1)*(0.31)
*(1−0.3)*(0.1)*(1−0.6)}
=log(0.0000103)
=−5.0
【0041】
したがって、適合度Sは、次の様に求めることができる。
=λF(W,w)+(1−λ)G(E,u)
=0.5*0+(1−0.5)*(−5.0)
=−2.5
【0042】
画像データ抽出部は、求めた適合度に基づき、適合度の高い画像データを抽出する。
例えば、上述の例によると、画像1との適合度は、−1.0であるのに対し、画像2との適合度は、−2.5であるので、適合度の高い画像1を抽出する。
【0043】
図2は、本発明のハードウェア構成の一例を示す図である。画像提示装置10は、制御部101を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU_A1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、ハードディスク1070、並びにキーボード及びマウス1100等の入力手段や表示装置1022を備える。
【0044】
BIOS1060は、画像提示装置10の起動時にCPU1010が実行するブートプログラムや、ハードウェアに依存するプログラム等を格納する。
【0045】
ハードディスク1070は、画像提示装置10が機能するための各種プログラム及び本発明の機能を実行するプログラムを記憶しており、さらに必要に応じて各種データベースを構成可能である。
【0046】
表示装置1022は、ユーザにデータの入力を受付ける画面を表示したり、画像提示装置10による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
【0047】
ここで、入力手段は、ユーザによる入力の受付けを行うものであり、キーボード及びマウス1100等により構成する。
【0048】
また、通信I/F1040は、画像提示装置10を専用ネットワーク又は公共ネットワークを介して画像データベース21、ユーザデータベース22等と接続できるようにするためのネットワーク・アダプタである。
【0049】
図3は、本発明の処理内容を示すフローチャートである。
【0050】
まず、ステップS11において、CPU1010は、テキストデータを取得する。具体的には、通信I/F1040を介してテキストデータを受信し、ハードディスク1070に記憶する。
【0051】
次に、ステップS12において、CPU1010は、テキストデータを解析し、バグオブワードを作成する。具体的には、テキストデータを解析し、形態素を求め、それぞれの出現回数をカウントし、記憶する。
【0052】
次に、ステップS13において、CPU1010は、適合度を計算する。具体的には、通信I/F1040を介して取得した画像の意味特徴量データ及び雰囲気特徴量データと、ユーザデータベースから取得したユーザの嗜好パラメータとから上述の計算を行う。なお、ユーザの嗜好パラメータは、ローカルな記憶手段、例えば、パソコンのハードディスクに記憶しているとしてもよい。
【0053】
次に、ステップS14において、CPU1010は、適合度を比較し、前回の適合度よりも高いか否かを判断する。具体的には、記憶した前回の適合度と、今回計算した適合度とを比較する。前回の適合度よりも低いと判断した場合は、ステップS16へ行く。前回の適合度よりも高いと判断した場合、又は初回の場合は、次へ行く。
【0054】
次に、ステップS15において、CPU1010は、今回の適合度をメインメモリ1050に記憶する。
【0055】
次に、ステップS16において、CPU1010は、終了か否かを判断する。具体的には、対象となる画像データの全てについて適合度の計算を行った場合は終了となる。終了と判断した場合には、その後処理を終了する。終了ではないと判断した場合には、次へ行く。
【0056】
次に、ステップS17において、CPU1010は、次の画像を取得し、ステップS13へ行き、次の画像の適合度を計算する。
【0057】
[実施例2]
本発明の1つの実施の形態として、画像提示装置10において学習機能を有する場合を例に挙げて説明する。
【0058】
図4は、本発明の機能と、処理するデータとの関連を示す図である。
すなわち、図4は、提示された画像の中からユーザが選択を行うことにより画像の意味情報とユーザの嗜好とを学習し、画像の意味特徴量データ及びユーザの嗜好パラメータを更新することを示している。ユーザが選択した画像に対して正の学習を行い、選択しなかった画像に対して負の学習を行う。
ここで、画像の意味特徴量データの初期値は、その画像を文章に表現したうえで、手作業によって与えられる。ユーザの嗜好パラメータの初期値は、登録されているユーザの平均値によって与えられる。
【0059】
入力テキスト201で取得されたテキストデータが、入力テキストBOW202へ出力される。入力テキストBOW202では、テキストデータのバグオブワードが作成される。雰囲気マッチスコア203では、ユーザ嗜好データ207から得たユーザ嗜好パラメータと画像206の雰囲気特徴量データとに基づいて、雰囲気マッチスコアであるG(E,u)を計算する。意味マッチスコア204では、バグオブワードと画像206の意味特徴量データとに基づいて、意味マッチスコアであるF(W,w)を計算する。総合スコアでは、雰囲気マッチスコアと意味マッチスコアとに基づいて総合スコアである適合度Sを計算する。
【0060】
ユーザ選択208において、ユーザは画像を選択する。ユーザが選択した画像2081の、雰囲気特徴量データ及び意味特徴量データと、ユーザ嗜好パラメータと、テキストデータのバグオブワードと、に基づいて雰囲気マッチスコア2082と、意味マッチスコア2083とが計算される。
【0061】
そして、ユーザの選択に対する、雰囲気特徴量データ及び意味特徴量データの寄与の強さを雰囲気寄与率210及び意味寄与率211で計算する。
意味特徴量W、雰囲気特徴量Eの画像が選択されたとき、意味特徴の寄与度kは、次の式で表される。
k=λF(W,w)/{λF(W,w)+(1−λ)G(E,u)}
また、雰囲気特徴の寄与度は(1−k)で表される。
(1−k)=(1−λ)G(W,w)
/{λF(W,w)+(1−λ)G(E,u)}
【0062】
次に、更新画像意味特徴量209で、画像の元の意味特徴量データWと、入力テキストデータのバグオブワードwと、意味寄与率kとから、MAP(事後確率最大化法)により、次の式で画像の意味特徴量データを更新する。ここで、αは学習の強さを調整する係数である。
【0063】
【数2】

【0064】
同様に、更新ユーザ嗜好パラメータ212で、ユーザの元のユーザ嗜好パラメータuと、雰囲気寄与率(1−k)とから、MAP(事後確率最大化法)により、次の式でユーザのユーザ嗜好パラメータを更新する。ここで、β,γ及びδは学習の強さを調整する係数である。
u={p,p,p,p,μ,σ,μ,σ,p,p,μ,σ
,p10,p11
j番目の分布が前述のP(x,p)の場合
【0065】
【数3】

【0066】
j番目の分布が前述のN(x,μ,σ)の場合
【0067】
【数4】

【0068】
j番目の分布が前述のN(x,μ,σ)の場合
【0069】
【数5】

【0070】
図5は、本発明の処理内容を示すフローチャートである。本処理内容では、画像提示装置10が、適合する画像をユーザに提示し、ユーザが画像を選択することにより画像の適合度に関する、意味特徴量データ及び嗜好パラメータについて学習する。
【0071】
まず、ステップS21において、CPU1010は、ブログの記事を取得する。具体的には、通信I/F1040を介してブログデータを受信し、ハードディスク1070に記憶する。
【0072】
次に、ステップS22において、CPU1010は、ユーザが画像の選択を行うか否かを判断する。具体的には、例えば、画像を選択するためのチェックボックスがONであるか否かを判断する。CPU1010は、ONである場合には、ステップS23へ行く。ONでない場合には、ステップS24へ行く。
ここで、画像提示装置10の学習回数が一定回数未満である場合や、推定精度が充分に高くない場合も、ユーザが画像の選択を行う場合に該当する。
【0073】
次に、ステップS23において、CPU1010は、画像選択処理を行う。画像選択処理では、後述するように、画像の適合度を計算し、画像をユーザに提示し、ユーザの選択に応じて画像の適合に関する意味特徴量データ及び嗜好パラメータを更新する。その後、CPU1010は、ステップS25へ行く。
【0074】
ステップS24において、CPU1010は、記事の内容と、ユーザの好みとから適合度を計算し、適合する画像を抽出する。その後、CPU1010は、ステップS25へ行く。
【0075】
次に、ステップS25において、CPU1010は、適合する画像をブログに挿入する。具体的には、ステップS23又はステップS24において選択された画像又は抽出された画像をブログに挿入する。
【0076】
次に、ステップS26において、CPU1010は、画像を変更するか否かを判断する。具体的には、ユーザの入力を受付け、変更する旨の信号を受信した場合には、信号に応じて、ステップS27へ行く。変更しない旨の信号を受信した場合には、信号に応じて、処理を終了する。
【0077】
次に、ステップS27において、CPU1010は、画像選択処理を行う。その後、CPU1010は、ステップS28へ行く。
【0078】
次に、ステップS28において、CPU1010は、ユーザの選択に応じて、変更した画像をブログに挿入し、処理を終了する。
【0079】
図6は、図5において呼び出される画像選択処理の処理内容を示すフローチャートである。
【0080】
まず、ステップS31において、CPU1010は、記事の内容と、ユーザの好みとから適合する画像を抽出する。
【0081】
次に、ステップS32において、CPU1010は、適合する画像の上位候補を提示する。ここで、例えば、ユーザの好みを学習しやすい画像を提示することもできる。
【0082】
次に、ステップS33において、CPU1010は、ユーザの選択信号を受信する。具体的には、ユーザが選択した画像に対応する入力信号を受信する。ここで、ユーザにさらにキーワードの入力を促し、入力されたキーワードを含めた適合度を計算し、画像を提示することも可能である。
【0083】
次に、ステップS34において、CPU1010は、ユーザの選択した画像に応じて、意味特徴量データ及び嗜好パラメータを更新する。その後、CPU1010は、呼び出されたステップに戻る。
【0084】
図7は、入力されたテキストデータに基づいて、適合する画像を抽出し、テキストデータに挿入する例を示す図である。すなわち、テキストデータの入力画面において、ユーザがテキストデータを入力した後に、画像提示装置10が適合した画像を抽出し、抽出した画像を挿絵として挿入したことを示す図である。
【0085】
図7には、表示装置1022の表示画面300が示されている。そして、表示画面300には、画面中のタイトル入力用エリア301と、記事入力用エリア302とが表示されている。タイトル入力用エリア301には、ユーザの入力により、テキストデータとして「A君への手紙」が入力され、記事入力用エリア302には、テキストデータとして「先日は楽しかったですね。実に25年ぶりでしたね。桜も見事でした。また皆で会えるのを楽しみにしています。」が入力されていることを表している。さらに、入力されたテキストデータのバグオブワード及び画像の意味特徴量データ、並びにユーザの嗜好パラメータ及び画像の雰囲気特徴量データとに基づいて、適合度を計算し、適合度の高い画像として花見の画像516を画像データベースから抽出し、挿絵として挿入したことを表している。
【0086】
[変形例]
変形例は、本発明によって提示された画像の中から、ユーザが画像を選択する場合である。画像データを予め階層型クラスタリングの方法によりクラスタリングしておき、クラスタについての意味特徴量データ及び雰囲気特徴量データを設ける。適合度の計算から適合するクラスタを提示し、ユーザによって選択されたクラスタの中から、適合度の計算によって適合する画像を提示する。そして、ユーザが選択した画像をテキストデータに挿入すると共に、クラスタ及び画像の意味特徴量データ及びユーザの嗜好パラメータを更新する。
【0087】
図8は、入力されたテキストデータに基づいて、適合するクラスタを選択する例を示す図である。すなわち、図8(1)において、ユーザがテキストデータを入力した後に、図8(2)において、画像提示装置10が適合したクラスタを提示していることを示している。
【0088】
図8の(1)は、表示装置1022の表示画面300が示されている。そして、表示画面300には、画面中のタイトル入力用エリア301と、記事入力用エリア302とが表示されている。タイトル入力用エリア301には、ユーザの入力により、テキストデータとして「A君への手紙」が入力され、記事入力用エリア302には、テキストデータとして「先日は楽しかったですね。実に25年ぶりでしたね。桜も見事でした。また皆で会えるのを楽しみにしています。」が入力されていることを表している。
【0089】
図8の(2)は、表示画面300の選択エリア303を示している。そして、入力されたテキストデータのバグオブワード及びクラスタの意味特徴量データ、並びにユーザの嗜好パラメータ及びクラスタの雰囲気特徴量データとに基づいて、適合度を計算し、適合度の高いクラスタ411〜414が、選択候補として選択エリア303に表示されていることを表している。さらに、桜のクラスタ412が選択されたことを選択スイッチ401が表している。
【0090】
図9は、図8において選択されたクラスタの中から、適合する画像を選択する例を示す図である。すなわち、図9(2)において、図8の(2)で選択された桜クラスタ412の中から適合する画像511〜516を表示していることを示し、図9(1)において、ユーザが選択した画像を挿入したことを示している。
【0091】
図9の(1)は、ユーザがテキストデータを入力した後に、図8(2)で表示された適合するクラスタの中から桜クラスタ412を選択し、桜クラスタ412の中の適合する画像511〜516が表示され、表示された画像の中から選択した花見の画像516が、テキストデータに挿入されたことを示している。
【0092】
図9の(2)は、図8(2)で表示された適合するクラスタの中から桜クラスタ412が選択された後、桜クラスタ412の中の適合する画像511〜516が表示されていることを示している。そして、その中から花見の画像516が選択されたことを選択スイッチ501が示している。
【0093】
図10は、テキストデータを入力する画面の壁紙等に適合する画像を提示し、ユーザが選択する例を示す図である。この例では、タイトルの入力により、適合する壁紙の画像を提示する場合を示している。
【0094】
図10の(1)は、表示装置1022の表示画面300のタイトル入力用エリア301と、記事入力用エリア302とを示し、タイトル入力用エリア301に「手紙」と入力されたことを示している。そして、図10の(2)において選択された壁紙を背景の壁紙として表示していることを示している。
【0095】
図10の(2)は、ユーザがタイトルを入力した後に、画像提示装置10が、タイトル入力用エリア301に入力されたテキストデータに基づき、適合する壁紙用の画像611〜614を表示し、提示していることを示している。そして、その中から壁紙612が選択されたことを選択スイッチ601が示している。この例では、タイトルに入力されたテキストデータと、ユーザの嗜好パラメータとから適合する壁紙の画像を抽出しているが、ユーザの嗜好パラメータに基づいて画像を抽出することもできる。同様に、タイトル及び記事に入力されたテキストデータと、ユーザの嗜好パラメータとから適合する壁紙の画像を抽出することもできる。
【0096】
本実施例によれば、画像データベース21は、形態素と画像との関連の強さを数値化した意味特徴量データと、画像の雰囲気の特徴度を数値化した雰囲気特徴量データとを画像データごとに記憶する。ユーザデータベース22は、ユーザの情報と共に、ユーザの嗜好を数値化した嗜好パラメータを記憶する。そして、画像提示装置10は、ユーザが入力したテキストデータを取得するテキスト取得部11と、テキスト取得部が取得したテキストデータを解析して得られた形態素及び該形態素がテキストデータの中で使用される回数の集合であるバグオブワードを作成するバグオブワード作成部12と、意味特徴量データ及びバグオブワード、並びに、雰囲気特徴量データ及び嗜好パラメータに基づいて、テキストデータ及びユーザと画像データとの適合度を計算する適合度計算部13と、適合度計算部の計算結果に基づいて、画像データベースの中から適合度の高い画像データを抽出する画像データ抽出部14と、を備える。また、画像の意味特徴量データの初期値を手作業によって与え、ユーザの嗜好パラメータの初期値を、登録されているユーザの平均値によって与えたうえで、計算によって適合する画像を提示し、ユーザに選択させる。そして、ユーザの選択に応じて、画像の意味特徴量データ及びユーザの嗜好パラメータを更新する。したがって、適合度の計算結果がより的確になり、さらに適合度の高い画像データを抽出することが可能となる。したがって、入力される文書テキストの意味内容と、ユーザの好みとに適合する画像をさらに効率よく出力することができる。
【0097】
なお、変形例では、クラスタの階層を1階層としたが、選択するクラスタの階層は、複数階層としてもよい。例えば、学習回数に応じて、学習回数が少なければ上位のクラスタから表示する。また、学習回数が多ければ下位のクラスタから選択させるようにする。ユーザに関する学習が未熟であり、画像提示が充分には機能しないような場合に、適合する画像を効率よく選択することができ、さらに、学習を促進することができる。
【0098】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
【図面の簡単な説明】
【0099】
【図1】本発明の機能を構成する構成部と、構成部が処理するデータとの関連を示す図である。
【図2】本発明のハードウェア構成の一例を示す図である。
【図3】本発明の処理内容を示すフローチャートである。
【図4】本発明の機能と、処理するデータとの関連を示す図である。
【図5】本発明の処理内容を示すフローチャートである。
【図6】図5において呼び出される画像選択処理の処理内容を示すフローチャートである。
【図7】入力されたテキストデータに基づいて、適合する画像を抽出し、テキストデータに挿入する例を示す図である。
【図8】入力されたテキストデータに基づいて、適合するクラスタを選択する例を示す図である。
【図9】図8において選択されたクラスタの中から、適合する画像を選択する例を示す図である。
【図10】テキストデータを入力する画面の壁紙等に適合する画像を提示し、ユーザが選択する例を示す図である。
【符号の説明】
【0100】
10 画像提示装置
11 テキスト取得部
12 バグオブワード作成部
13 適合度計算部
14 画像データ抽出部
21 画像データベース
22 ユーザデータベース
1010 CPU
1012 CPU_A
1022 表示装置
1040 通信I/F
1050 メインメモリ
1060 BIOS
1070 ハードディスク
1100 キーボード及びマウス

【特許請求の範囲】
【請求項1】
画像データを抽出し、ユーザに提示する画像提示システムにおいて、
前記画像データが表す画像を文章に表現した場合に前記文章の中で意味を持つ最小単位である形態素と前記画像との関連の強さを数値化した意味特徴量データを前記画像データごとに記憶する画像データベースと、
前記ユーザが入力したテキストデータを取得するテキスト取得部と、
前記テキスト取得部が取得した前記テキストデータを解析して得られた形態素及び該形態素が前記テキストデータの中で使用される回数の集合であるバグオブワードを作成するバグオブワード作成部と、
前記意味特徴量データ及び前記バグオブワードに基づいて、前記テキストデータと前記画像データとの適合度を計算する適合度計算部と、
前記適合度計算部の計算結果に基づいて、前記画像データベースの中から前記適合度の高い画像データを抽出する画像データ抽出部と、
を備えることを特徴とする画像提示システム。
【請求項2】
請求項1に記載の画像提示システムにおいて、
前記画像データベースは、前記画像の雰囲気の特徴度を数値化した雰囲気特徴量データを、前記画像データごとにさらに記憶し、
前記画像提示システムは、
前記ユーザの情報と共に、前記ユーザの嗜好を数値化した嗜好パラメータを記憶するユーザデータベースをさらに備え、
前記適合度計算部は、前記意味特徴量データ及び前記バグオブワード、並びに、前記雰囲気特徴量データ及び前記嗜好パラメータに基づいて、前記テキストデータ及び前記ユーザと前記画像データとの適合度を計算することを特徴とする画像提示システム。
【請求項3】
請求項2に記載の画像提示システムにおいて、
前記画像の前記意味特徴量データの初期値は、予め手作業により作成し、
前記画像の前記雰囲気特徴量データの初期値は、全ユーザの平均値によって与えられ、
前記提示された前記画像に対する前記ユーザの選択に応じて、
事後確率最大化法により、前記ユーザが選択した画像の前記意味特徴量データ及び前記ユーザの前記嗜好パラメータを更新することを特徴とする画像提示システム。
【請求項4】
画像データを抽出し、ユーザに提示する方法において、
前記ユーザが入力したテキストデータを取得するステップと、
前記テキストデータを解析して得られた形態素及び該形態素が前記テキストデータの中で使用される回数の集合であるバグオブワードを作成するステップと、
前記画像データが表す画像を文章に表現した場合に前記文章の中で意味を持つ最小単位である形態素と前記画像との関連の強さを数値化した意味特徴量データ及び前記バグオブワードに基づいて、前記テキストデータと前記画像データとの適合度を計算するステップと、
前記計算の結果に基づいて、前記適合度の高い画像データを抽出するステップと、
を含む方法。
【請求項5】
画像データを抽出し、ユーザに提示するコンピュータ・プログラムにおいて、
前記ユーザが入力したテキストデータを取得するステップと、
前記テキストデータを解析して得られた形態素及び該形態素が前記テキストデータの中で使用される回数の集合であるバグオブワードを作成するステップと、
前記画像データが表す画像を文章に表現した場合に前記文章の中で意味を持つ最小単位である形態素と前記画像との関連の強さを数値化した意味特徴量データ及び前記バグオブワードに基づいて、前記テキストデータと前記画像データとの適合度を計算するステップと、
前記計算の結果に基づいて、前記適合度の高い画像データを抽出するステップと、
をコンピュータに実行させるコンピュータ・プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2009−64079(P2009−64079A)
【公開日】平成21年3月26日(2009.3.26)
【国際特許分類】
【出願番号】特願2007−229065(P2007−229065)
【出願日】平成19年9月4日(2007.9.4)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】