情報閲覧端末装置、情報閲覧システム、情報閲覧プログラム及び情報閲覧方法
【課題】閲覧者であるユーザが興味のあると想定される情報を的確に提供すること、及び、それにより提供された情報の閲覧数を向上させることが可能な情報閲覧端末装置及び閲覧プログラムなどを提供すること。
【解決手段】携帯用通信端末装置300は、画像表示領域DAに表示された構成要素に含まれる抽出キーワードの特徴量を抽出するとともに、当該抽出されたキーワードにおける表示文字サイズ、文字装飾数または当該表示範囲SA内の位置に基づいて重み係数を算出する。そして、携帯用通信端末装置300は、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正するとともに、補正された特徴量に基づいて表示範囲SA内に含まれているコンテンツCと各関連情報との類似度を算出しユーザに推薦すべき関連情報を提供する。
【解決手段】携帯用通信端末装置300は、画像表示領域DAに表示された構成要素に含まれる抽出キーワードの特徴量を抽出するとともに、当該抽出されたキーワードにおける表示文字サイズ、文字装飾数または当該表示範囲SA内の位置に基づいて重み係数を算出する。そして、携帯用通信端末装置300は、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正するとともに、補正された特徴量に基づいて表示範囲SA内に含まれているコンテンツCと各関連情報との類似度を算出しユーザに推薦すべき関連情報を提供する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、携帯用通信端末装置などの情報閲覧端末装置に関し、特に、コンテンツを閲覧中に当該コンテンツの関連情報、関連商品または関連広告を情報として提供する技術分野に属する。
【背景技術】
【0002】
近年、インターネットなどのネットワーク及びパーソナルコンピュータなどの通信端末装置の発達に伴って、書籍、ニュースなどの記事、商品またはサービスなどの広告(以下、まとめて「コンテンツ」という。)を、ネットワークまたは記録媒体を介して電子的に閲覧することが一般化している。最近では、通信機能を有する携帯ゲーム機器、タブレット型携帯PC端末装置、携帯用電話機などの携帯可能な携帯用通信端末装置を介してコンテンツを閲覧させることも多く行われている。
【0003】
このような状況下において、ユーザが閲覧しているコンテンツに関連する情報(以下、「関連情報」という。)を推薦するシステム(以下、「情報閲覧システム」という。)が知られている。具体的には、このシステムは、ユーザが所定のコンテンツを閲覧している際に、当該閲覧しているコンテンツデータに関連し、ユーザにとって有用であると想定される広告、文書または画像などの他のコンテンツを提供するようになっている。例えば、情報閲覧システムは、閲覧、参照または編集の対象となっている文書からキーワードを抽出するとともに、抽出したキーワードと、履歴情報として既に記憶された文書データ毎に予め記憶されたキーワードと、を比較し、類似と判定されたキーワードを有する文書データを推薦文書としてユーザに提供するようになっている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−211385号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の情報閲覧システムにあっては、編集、閲覧などの作業内容と作業を行っている領域(注目領域)に含まれるキーワードとに基づいて推薦すべき関連文書を特定しているため、文章を閲覧しているユーザの嗜好まで考慮して当該推薦すべき関連文書を特定していない。すなわち、この情報閲覧システムにあっては、ユーザが興味を持っている点を分析することなく、かつ、ユーザが実際に閲覧しているか否かを判断することなく、注目領域に含まれている全てのキーワードを同レベルの情報として採用するため、ユーザが全く興味を持っていない関連文書が多く推薦されることも予想される。
【0006】
また、特許文献1に記載の情報閲覧システムにあっては、編集、閲覧または参照などユーザにおける文書データの操作履歴に基づいて推薦文書を提供しているため、未だ参照していない文書などユーザの操作履歴に含まれない文書を推薦文書として提供することができない。
【0007】
本発明は、上記課題を解決するためになされたものであり、その目的は、閲覧者であるユーザが興味のあると想定される情報を的確に提供すること、及び、それにより提供された情報の閲覧数を向上させることが可能な情報閲覧端末装置及び閲覧プログラムなどを提供することにある。
【課題を解決するための手段】
【0008】
(1)上記課題を解決するため、本発明の情報閲覧端末装置は、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧端末装置であって、コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段と、所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、前記表示範囲内に含まれている前記構成要素を特定する特定手段と、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、各抽出キーワードの特徴量を算出する特徴量算出手段と、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段と、を備える構成を有している。
【0009】
一般的に、キーワードの各文字における表示文字サイズ若しくは装飾の差異または表示範囲に表示されたキーワードの当該表示範囲に対する位置の違いは、ユーザのキーワードに対する視認性に影響を与える。例えば、小さい文字より大きい文字で記載されていれば、キーワードそのものの注目度(興趣レベル)も高くなるとともに、ユーザにとっても文書の可読性が向上する。また、キーワードの各文字における太字、字体、斜体または色の差異は、ユーザにキーワードの識別力の差及び文書における重要度の差を生じさせる。さらに、キーワードが表示範囲の中心にあれば、ユーザの注目度が高く、表示範囲の周辺にあればユーザの注目度が低い。
【0010】
本発明の情報閲覧端末装置は、上記構成により、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0011】
(2)また、本発明の情報閲覧端末装置は、前記重み付け係数算出手段が、前記表示文字サイズに基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字サイズの平均に対する各抽出キーワードの文字サイズの割合を各抽出キーワードの重み係数として算出する構成を有している。
【0012】
この構成により、本発明の情報閲覧端末装置は、表示範囲内に含まれるキーワードの視認性、特に可読性及び注目度を数値化し、当該数値化された視認性に基づいて各キーワードの特徴量を補正することができるので、ユーザが閲覧している表示範囲に含まれるコンテンツの内容をキーワードの特徴量によって的確に把握することができる。
【0013】
(3)また、本発明の情報閲覧端末装置は、前記重み付け係数算出手段が、前記文字装飾数に基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字装飾数の平均に対する各キーワードの文字装飾数の割合を各抽出キーワードの重み係数として算出する構成を有している。
【0014】
この構成により、本発明の情報閲覧端末装置は、表示範囲内に含まれるキーワードの視認性、特に、キーワードの重要度及び他のキーワードとの識別度を数値化し、当該数値化された視認性に基づいて各キーワードの特徴量を補正することができるので、ユーザが閲覧している表示範囲に含まれるコンテンツの内容をキーワードの特徴量によって的確に把握することができる。
【0015】
(4)また、本発明の情報閲覧端末装置は、前記重み付け係数算出手段が、前記表示範囲内の位置に基づく重み係数を算出する際には、前記表示範囲の中心座標から各抽出キーワードの座標までの距離を相対表示距離として算出するとともに、各抽出キーワードの相対表示距離に対する前記抽出された全ての抽出キーワードにおける算出された各相対表示距離の平均を示す平均相対表示距離の割合を各抽出キーワードの重み係数として算出する構成を有している。
【0016】
この構成により、本発明の情報閲覧端末装置は、表示範囲内に含まれるキーワードの視認性、特にユーザの注目度を数値化してユーザにおける興趣レベルを把握することができるので、ユーザが閲覧している表示範囲に含まれるコンテンツの内容をキーワードの特徴量によって的確に把握することができる。
【0017】
(5)また、本発明の情報閲覧端末装置は、コンテンツデータには、構成要素毎に、各構成要素に含まれるキーワードのデータがキーワードデータとして含まれるとともに、前記重み係数算出手段が、各抽出キーワードの該当するキーワードデータから前記表示文字サイズの情報、前記文字装飾に関する情報または基準位置座標の情報における該当する情報を取得し、当該取得した情報に基づいて各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する構成を有している。
【0018】
この構成により、本発明の情報閲覧端末装置は、コンテンツデータに含まれたキーワードデータに基づいて重み係数を算出するので、キーワードデータを個々に算出する場合に比べて、類似度の算出処理に対する負荷を軽減することができるとともに、短時間によって類似度を算出することができるので、ユーザにストレスを与えずに、コンテンツを表示させることができる。
【0019】
(6)また、本発明の情報閲覧端末装置は、前記類似度算出手段が、前記補正された各抽出キーワードの特徴量に基づいて検索式を生成し、当該生成した検索式に基づいて前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する構成を有している。
【0020】
この構成により、本発明の情報閲覧端末装置は、関連情報と表示範囲に含まれるコンテンツとの類似度を簡易にかつ的確に類似度を算出することができる。
【0021】
(7)また、本発明の情報閲覧端末装置は、前記類似度算出手段が、同一の各抽出キーワードにおける特徴量を合算し、前記検索式として抽出キーワードとその特徴量とから構成されるベクトル空間モデルを生成するとともに、当該生成したベクトルと、前記関連情報に属する各キーワードとその特徴量から構成される前記関連情報に関するデータとしてのベクトルと、を比較し、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する構成を有している。
【0022】
この構成により、本発明の情報閲覧端末装置は、関連情報と表示範囲に含まれるコンテンツとの類似度を簡易にかつ的確に類似度を算出することができる。
【0023】
(8)また、本発明の情報閲覧端末装置は、前記特徴量算出手段が、前記抽出された各抽出キーワードの前記特定された構成要素内における出現頻度及び当該各抽出キーワードにおけるコンテンツ内における出現頻度に基づいて各抽出キーワードの特徴量を算出する構成を有している。
【0024】
この構成により、本発明の情報閲覧端末装置は、キーワードの特徴量を簡易にかつ的確に算出することができる。
【0025】
(9)また、本発明の情報閲覧端末装置は、携帯可能に形成されている。
【0026】
通常、携帯用電話機など、携帯可能な通信端末装置は、画像表示領域のサイズが限られ、一度に多くの文章または画像を画像表示領域に視認可能に表示することができない。
【0027】
したがって、本発明の情報閲覧端末装置は、表示範囲に基づいて関連情報との類似度を算出するので、携帯可能な場合であっても的確に類似度を算出することができる。
【0028】
(10)上記課題を解決するため、本発明の情報閲覧システムは、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、請求項1〜9に記載の情報閲覧端末装置と、前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報として前記関連情報に関するデータ群が記憶されているデータベースと、を備える構成を有している。
【0029】
この構成により、本発明の情報閲覧システムは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0030】
(11)上記課題を解決するため、本発明の情報閲覧システムは、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、前記コンテンツと前記関連情報をユーザに閲覧させるための情報閲覧端末装置と、前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報に関するデータ群が記憶されているデータベースと、前記データベースを管理するサーバ装置と、を備え、前記情報閲覧端末装置が、前記サーバ装置から送信されたコンテンツデータを受信する受信手段と、所定の画像表示領域を有し、前記受信したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、前記表示範囲内に含まれている前記構成要素を特定する特定手段と、を有するとともに、前記サーバ装置または前記情報閲覧端末装置の何れか一方に、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、各抽出キーワードの特徴量を算出する特徴量算出手段と、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、を有し、前記携帯用通信端末装置が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する構成を有している。
【0031】
この構成により、本発明の情報閲覧システムは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0032】
(12)上記課題を解決するため、本発明の情報閲覧プログラムは、所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段を有する情報閲覧端末装置用のコンピュータで実行されるプログラムにおいて、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧プログラムであって、前記コンピュータを、コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段、ユーザの操作及び前記コンテンツデータに基づいて画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段、前記表示範囲内に含まれている前記構成要素を特定する特定手段、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段、各抽出キーワードの特徴量を算出する特徴量算出手段、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段、及び、前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段、として機能させる構成を有している。
【0033】
この構成により、本発明の情報閲覧プログラムは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0034】
(13)上記課題を解決するため、本発明の情報閲覧方法は、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧方法であって、前記コンピュータを、コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得工程と、情報閲覧端末装置の表示手段に設けられた所定の画像表示領域に、前記取得したコンテンツデータ及びユーザの操作に基づいて表示されるコンテンツの表示範囲を認識する認識工程と、前記表示範囲内に含まれている前記構成要素を特定する特定工程と、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出工程と、各抽出キーワードの特徴量を算出する特徴量算出工程と、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出工程と、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正工程と、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出工程と、前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供工程と、を含む構成を有している。
【0035】
この構成により、本発明の情報閲覧方法は、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【発明の効果】
【0036】
本発明の情報閲覧端末装置、情報閲覧システム、情報閲覧プログラム及び情報閲覧方法は、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの興趣性を考慮した関連情報を表示手段に表示することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【図面の簡単な説明】
【0037】
【図1】本発明に係る情報閲覧システム一の実施形態におけるシステム構成図である。
【図2】一の実施形態における構成要素データを含むコンテンツデータのデータ構造の一例である。
【図3】一の実施形態におけるキーワードデータを含むコンテンツデータのデータ構造の一例である。
【図4】一の実施形態における携帯用通信端末装置に表示されるコンテンツデータの一例である。
【図5】一の実施形態における関連情報データのデータ構造の一例である。
【図6】一の実施形態における各携帯用通信端末装置の構成を示すブロック図である。
【図7】一の実施形態の認識処理部において認識される閲覧サイズ、閲覧領域基準座標及びお拡大率を説明するための図である。
【図8】一の実施形態の特定処理部において特定される表示範囲を説明するための図である。
【図9】一の実施形態の抽出キーワードとその抽出キーワード情報の一例である。
【図10】一の実施形態の重み係数算出処理部において、キーワードの表示範囲の中心からの距離に基づく重み係数について説明するための図である。
【図11】一の実施形態の提供処理部において、提供される推薦情報リストを説明するための図である。
【図12】一の実施形態におけるコンテンツの表示範囲の変更とそのときの提供処理部における推薦情報リストを説明するための図である。
【図13】一の実施形態の携帯用通信端末装置における推薦情報提供処理の動作を示すフローチャートである。
【発明を実施するための形態】
【0038】
以下、本発明の実施形態について、図面を参照しながら説明する。以下に説明する実施形態は、ネットワークを介して携帯電話機などの携帯用通信端末装置、または、当該携帯用通信端末装置、他の通信装置であるサーバ装置及びコンテンツデータが記憶されたデータベースを有し、コンテンツデータに基づいてユーザが閲覧可能なコンテンツを提供する情報閲覧システムに対して、本発明の情報閲覧端末装置、情報閲覧システム、情報閲覧プログラム及び情報閲覧方法を適用した場合の実施形態である。
【0039】
<情報閲覧システムの概要構成>
まず、図1を用いて本実施形態の情報閲覧システムSの概要構成について説明する。なお、図1は、情報閲覧システムSの構成を示すシステム構成図である。
【0040】
本実施形態の情報閲覧システムSは、図1に示すように、広告、文書または画像などの複数の構成要素FEから構成されるコンテンツCをユーザに提供する際に用いる複数のコンテンツデータD10と当該コンテンツデータD10に関連する複数の関連情報のデータ(以下、「関連情報データ」という。)D20が記憶されたデータベース100と、データベース100の制御及びデータの管理を行うサーバ装置200とを有している。
【0041】
また、情報閲覧システムSは、画像表示領域DAを有し、ユーザが個々に有し、当該ユーザにコンテンツCを提供するために、コンテンツデータD10に基づいてコンテンツCを画像表示領域DAに閲覧可能に表示する携帯可能な複数の通信端末装置(以下、「携帯用通信端末装置」という。)300を有している。そして、複数の携帯用通信端末装置300は、基地局BSを介して、データベース100及びサーバ装置200は、直接的にインターネット上において提供されるWorld Wide Web システムなどのネットワークNにそれぞれ接続されている。
【0042】
携帯用通信端末装置300は、コンテンツCを画像表示領域DAに表示している際に、当該表示しているコンテンツCに属する構成要素FEを特定しつつ、特定された構成要素(以下、「特定構成要素」ともいう。)に含まれるキーワードの特徴量を算出し、広告、文書または画像などのユーザが閲覧しているコンテンツCに関連があると想定される関連情報(以下、「推薦情報」ともいう。)を画像表示領域DAにコンテンツCとともに表示するようになっている。特に、携帯用通信端末装置300は、ユーザに提供すべき関連情報を、データベース100に記憶されている複数の関連情報データD20に基づいて決定し、決定した関連情報(すなわち、推薦情報)に関する情報としてそのリスト(以下、「推薦情報リスト」という。)LTを画像表示領域DAに表示するようになっている。
【0043】
なお、本実施形態においては、コンテンツデータD10は、固有のURL(Uniform Resource Locator)と呼ばれるアドレス(以下、「URL」という。)に基づいて、データベース100に記憶され、また、携帯用通信端末装置300によって指定されて読み出されるようになっている。
【0044】
<データベース>
次に、図2〜図5の各図を用いて本実施形態のデータベース100と当該データベース100に記憶されているコンテンツデータD10及び関連情報データD20について説明する。なお、図2は、本実施形態における構成要素データD30を含むコンテンツデータD10のデータ構造の一例であり、図3は、本実施形態におけるキーワードデータD40を含むコンテンツデータD10のデータ構造の一例である。また、図4は、本実施形態における携帯用通信端末装置300に表示されるコンテンツデータD10の一例であり、図5は、本実施形態における関連情報データD20のデータ構造の一例である。
【0045】
本実施形態のデータベース100には、WWWシステム用のリソースデータ(以下、「Webページデータ」ともいう。)がコンテンツデータD10として記録されている。各コンテンツデータD10は、広告、画像、文または複数の文の纏まりなどタイプや内容が異なる複数の構成要素FEのデータ(以下、「構成要素データ」ともいう。)D30をタグと呼ばれる識別子を用いつつ、HTML(Hyper Text Markup Language)またはXML(eXtensible Markup Language)などのマークアップ言語によって構成されている。例えば、各コンテンツデータD10は、図2に示すように、各コンテンツデータD10の識別を行うためのコンテンツIDと、コンテンツCとして表示される際に基準となるページサイズ、コンテンツCを構成する構成要素データD30から構成される。なお、例えば、コンテンツIDは、URLアドレスなどの格納場所を示すアドレスであってもよいし、当該アドレスとは別に付与されていてもよい。ただし、コンテンツIDが、アドレスとは別に付与されている場合には、アドレスは各コンテンツデータD10に含まれる。
【0046】
また、各構成要素データD30には、各構成要素FEを識別するための構成要素IDと、各構成要素FEが属するコンテンツIDと、各構成要素FEが表示される際に基準(中心)となるXYにおける絶対座標(以下、「要素基準座標」という。)Oと、各構成要素FEの表示上の幅と高さを示すサイズ(以下、「領域サイズ」という。)と、文書(テキスト)、画像その他の構成要素FEの種別を示すタイプと、テキストまたは画像などの構成要素FEそのものの内容データと、が含まれる。
【0047】
さらに、各構成要素データD30には、図3に示すように、内容データに含まれるキーワードにおけるデータ(以下、「キーワードデータ」という。)D40が含まれる。このキーワードデータD40には、各キーワードを識別するためのキーワードIDと、各キーワードが属する構成要素IDと、各キーワードのテキスト、各キーワードのフォントの種別(以下、「フォント種別」という。)、各キーワードが表示される際に基準(左上隅)となるXYにおける絶対座標(以下、「キーワード基準座標」という。)Pと、キーワードの文字サイズ、キーワードのスタイル(装飾)の種別と、が含まれる。
【0048】
なお、キーワードデータD40として登録されるキーワードは、内容データに対して形態素解析を実行して品詞に分解し、不要な品詞を排除して抽出されたもの、所定のキーワード辞書に含まれたキーワードと完全一致したもの、または、関連情報を提供する提供者またはシステム管理者に抽出されたものなど予め抽出されたものを用いる。そして、キーワードデータD40に含まれる各データは、提供者または管理者によって、または、コンテンツデータD10にリソースとして記述されたタグの情報を用いることによって登録される。例えば、タグの情報としては、HTML上に記述されたdivタグまたはspanタグによって識別され、CSS(Cascading Style Sheet)によって配置、装飾若しくは文字サイズの内容が定義された情報、または、HTMLのテーブルタグによって配置が決められつつ、fontタグなどによって装飾または文字サイズの内容が定義された情報を用いる。
【0049】
また、携帯用通信端末装置300は、例えば、図2及び図3に示すコンテンツデータD10を受信し、当該コンテンツデータD10をフルサイズで画像表示領域DAに表示すると、図4に示すように、後述する推薦情報リストLTとともにコンテンツCを表示することができるようになっている。
【0050】
一方、データベース100には、所定の形式によって推薦情報の候補となるべき関連情報(以下、「関連候補情報」または「推薦候補情報」ともいう。)毎に関連情報データD20が記憶されている。各関連情報データD20には、図5に示すように、関連情報を識別するための関連情報IDと、各関連情報のタイトル、テキストまたは画像などの内容データと、各関連情報の属性と、携帯用通信端末装置300が推薦情報を特定する際に用いる文書ベクトルと、が含まれる。なお、例えば、関連情報IDは、URLアドレスであってもよいし、URLアドレスとは別に付与されていてもよい。ただし、関連情報IDが、URLアドレスとは別に付与されている場合には、URLアドレスは各コンテンツデータD10に含まれる。
【0051】
特に、文書ベクトルは、各内容データ内のキーワードの出現頻度と各キーワードにおける一の関連情報内に出現する出現頻度を示すTF−IDF(Term Frequency − Inverse Document Frequency)の値を有している。キーワードは、内容データに対して形態素解析によって自動的に抽出されたもの、または、関連情報を提供する提供者またはシステム管理者に抽出されたものなど予め抽出されて登録されたものを用いる。例えば、内容データがテキストの場合には、テキストから抽出された1以上のキーワードが抽出され、内容データが画像データの場合には、当該画像データを説明するためのテキストの中から1以上のキーワードが抽出される。また、TF−IDFの値は、抽出された各キーワードのキーワードが含まれる関連情報内における出現頻度と他の関連情報データD20を含めた全ての関連情報におけるキーワードの出現頻度とに基づいて予め算出された値である。
【0052】
<サーバ装置>
次に、本実施形態のサーバ装置200について説明する。
【0053】
サーバ装置200は、主にCPU、ROM、RAM及びハードディスクによって構成され、携帯用通信端末装置300との間においてデータの授受を行うための通信機能、データベース100の管理、並びに、各コンテンツデータD10及び関連情報データD20の管理を行う。例えば、ROMには、各機能を実行するための制御情報が記録されるとともに、ハードディスクには、制御プログラムまたはOS(Operating System)などの各種プログラムが記録されている。また、CPUは、ハードディスクに記録されたプログラムを実行することにより、上述の各種の機能を実現し、RAMは、ワークエリアとして用いられる。特に、サーバ装置200は、通信機能としては、各携帯用通信端末装置300からのコンテンツデータD10または関連情報データD20の送信要求を受信した際に、当該携帯用通信端末装置300との通信回線を確立し、要求されたデータを携帯用通信端末装置300に送信するようになっている。
【0054】
<携帯用通信端末装置>
1.携帯用通信端末装置300の構成
次に、図6を用いて本実施形態の各携帯用通信端末装置300の構成について説明する。なお、図6は、本実施形態の各携帯用通信端末装置300の構成を示すブロック図である。
【0055】
各携帯用通信端末装置300は、例えば、電子書籍用読取再生装置(電子ブックリーダ)、ゲーム機、PDA(Personal Digital Assistants)、携帯用電話機または携帯タブレット型通信端末装置などの携帯可能な通信端末装置である。また、各携帯用通信端末装置300は、画像表示領域DAを有するとともに、リソースデータなどのコンテンツデータD10を読み込んで当該画像表示領域DAにコンテンツCを表示するためのブラウザ機能を有している。そして、各携帯用通信端末装置300は、各携帯用通信端末装置300が有する種々のハードウェアと協働し、コンテンツCとともに、ユーザにとって必要と想定される推薦されるべき関連情報を推薦情報として提供する推薦情報提供処理を実行するためのプログラム(以下、「推薦情報提供プログラム」という。)を実行する。特に、推薦情報提供プログラムによって実行される処理としては、
(1)画像表示領域DAに表示されたコンテンツCの表示範囲SAを認識する認識処理(以下、単に「認識処理」という。)、
(2)認識された表示範囲SA内に含まれている構成要素FEを特定する特定処理(以下、単に「特定処理」という。)、
(3)特定された構成要素FEに含まれているキーワードを抽出する抽出処理(以下、単に「抽出処理」という。)、
(4)抽出された各キーワードにおける特徴量を算出する特徴量算出処理、
(5)コンテンツCを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から抽出された各キーワードにおける特徴量を補正するための重み係数を算出する重み係数算出処理、
(6)抽出された各キーワードの特徴量を算出された重み係数で補正する補正処理(以下、単に「補正処理」という。)、
(7)関連情報データD20における各文書ベクトルをデータベース100から取得しつつ、補正された各キーワードの特徴量に基づいて一の検索式を生成し、生成した検索式と文書ベクトルに基づいて抽出された各キーワードの特徴量と各関連情報との類似度を算出する類似度算出処理、及び、
(8)算出された各類似度に基づいて該当する関連情報のリストを推薦情報リストLTとして画像表示領域DAに表示させてユーザに関連情報に関する情報を提供する提供処理の各処理が含まれる。
【0056】
具体的には、各携帯用通信端末装置300は、サーバ装置200及び他の携帯用通信端末装置300と通信を行う通信インターフェース301と、推薦情報提供処理における各処理を行うデータ処理部320と、所定の画像表示領域DAを有する表示部302と、表示部302における種々の描画を制御する描画制御部303と、を有している。また、各携帯用通信端末装置300は、ユーザの操作を入力するための操作部304と、全体を制御する端末管理制御部306と、推薦情報提供プログラムが記録されるとともに端末管理制御部306が各部材を制御するための制御プログラム及び当該制御プログラムが実行される際に用いられるメモリ機能を有するROM/RAM305と、を有している。そして、携帯用通信端末装置300は、例えば、電話機能及び電子メールなどのメール機能を有する場合には、マイク、スピーカ及び電子メールの送受信機能など種々の必要な部材を有している。さらに、上記の各部は、バスBによって互いに接続され、データの授受が実行される。
【0057】
なお、例えば、本実施形態の通信インターフェース301は、本発明の取得手段を構成し、表示部302は、本実施形態の表示手段を構成する。また、例えば、本実施形態の描画制御部303は、本発明の表示制御手段を構成し、データ処理部320は、特定手段、抽出手段、特徴量算出手段、重み係数算出手段、補正手段、類似度算出手段及び提供手段を構成する。
【0058】
通信インターフェース301は、データ処理部320の制御の下、ネットワークNに接続される基地局BSを介してサーバ装置200と通信回線を構築し、コンテンツデータD10または関連情報など種々のデータの授受を行う。
【0059】
データ処理部320は、推薦情報提供プログラムによって実行される推薦情報提供処理を実現するようになっている。例えば、データ処理部320は、ROM/RAM305に記録された推薦情報提供プログラムで携帯用通信端末装置300の各部を制御するための各種制御プログラムを実行しつつ、通信インターフェース301及び描画制御部303と連動して、または、制御して上述の各種の処理を実行する。
【0060】
具体的には、データ処理部320は、推薦情報提供プログラムを起動することによって、図6に示すように、表示範囲SAの認識処理を実行する認識処理部321、構成要素FEを特定する特定処理を実行する特定処理部322、キーワードを抽出する抽出処理を実行する抽出処理部323、特徴量算出処理を実行する特徴量算出処理部324、重み係数算出処理及び補正処理を実行する重み係数算出処理部325と、類似度算出処理を行う類似度算出処理部326と、提供処理を実行する提供処理部327と、を構築する。
【0061】
なお、例えば、本実施形態の認識処理部321は、本発明の認識手段を構成し、特定処理部322は、本発明の特定手段を構成する。また、本実施形態の抽出処理部323は、抽出手段を構成し、特徴量算出処理部324は、本発明の特徴量算出手段を構成する。さらに、本実施形態の重み係数算出処理部325は、重み係数算出手段及び補正手段を構成し、類似度算出処理部326は、類似度算出手段を構成する。そして、本実施形態の提供処理部327は、本発明の提供手段を構成する。
【0062】
表示部302は、所定のサイズの画像表示領域DAを有し、例えば、液晶素子またはEL(Electro Luminescence)素子のパネルによって構成され、描画制御部303において生成された表示データに基づいて所定の画像を表示するようになっている。特に、本実施形態では、表示部302は、推薦情報提供プログラムが実行されている際に、操作部304と連動しつつ、コンテンツデータD10に基づいてコンテンツCを表示するようになっている。
【0063】
描画制御部303は、端末管理制御部306の制御の下またはデータ処理部320の制御の下、表示部302に所定の画像を描画させるために必要な描画データを生成するようになっており、生成された描画データを当該表示部302に出力するようになっている。
【0064】
操作部304は、各種の確認ボタン、各操作指令を入力する操作ボタン、テンキーなどの多数のキー及び表示部302上に設けられたタッチセンサにより構成され、各操作を行う際に用いられるようになっている。具体的には、操作部304は、推薦情報提供プログラムの起動時に上述の各種の処理を実行するための操作を行う際に用いられるようになっている。
【0065】
端末管理制御部306は、主に中央演算処理装置(CPU)によって構成されるとともに、キー入力ポート、表示制御ポート等の各種入出力ポートを含み、携帯用通信端末装置300の全般的な機能及び推薦情報提供プログラムを実行するための全般的な機能を総括的に制御するようになっている。
【0066】
ROM/RAM305には、携帯用通信端末装置300として機能するための各種の制御プログラムが記録されているとともに、コンテンツCまたは関連情報を閲覧するためのブラウザ機能を含む推薦情報提供プログラムが記録されている。また、このROM/RAM305は、各種の処理が実行される際のワークエリアとして用いられる。
【0067】
2.データ処理部320の詳細
次に、図7〜図12の各図を用いて本実施形態のデータ処理部320における各部の構成及びその動作の詳細について説明する。なお、図7は、本実施形態の認識処理部321において認識される閲覧サイズ、閲覧領域基準座標Z及び拡大率を説明するための図であり、図8は、本実施形態の特定処理部322において特定される表示範囲SAを説明するための図である。また、図9は、本実施形態の抽出キーワードとその抽出キーワード情報の一例であり、図10は、本実施形態の重み係数算出処理部325において、キーワードの表示範囲SAの中心からの距離に基づく重み係数WCについて説明するための図である。さらに、図11は本実施形態の提供処理部327において、提供される推薦情報リストLTを説明するための図であり、図12は、本実施形態のコンテンツCにおける表示範囲SAの変更とそのときの提供処理部327における推薦情報リストLTを説明するための図である。
【0068】
認識処理部321は、コンテンツデータD10に基づいて画像表示領域DAにコンテンツCが閲覧可能に表示される毎に、表示されているコンテンツCにおける閲覧領域のサイズ(以下、「閲覧サイズ」という。)、閲覧領域の基準となる座標(以下、「閲覧領域基準座標」という。)Z及びフルサイズに対する拡大率(以下、単に「拡大率」という。)を認識して当該コンテンツCの表示範囲SAを認識するようになっている。具体的には、認識処理部321は、コンテンツCが閲覧可能に画像表示領域DAに表示される毎に、閲覧サイズとしてコンテンツCの表示されている部分の幅Wと高さHの検出、閲覧領域基準座標Zとして画像表示領域DAの左上隅におけるコンテンツC上の位置座標の検出及びフルサイズに対する拡大率の算出を実行して、閲覧サイズ、閲覧領域基準座標Z及び拡大率を認識する。
【0069】
例えば、認識処理部321は、図7(a)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにフルサイズのコンテンツCが表示されている場合には、閲覧サイズを幅(W):960、高さ(H)1200、閲覧領域基準座標Zを(X:0、Y:0)及び拡大率を100%として認識するようになっている。また、認識処理部321は、図7(b)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにコンテンツCの左隅の一部が表示されている場合には、閲覧サイズを幅(W):320、高さ(H)400、閲覧領域基準座標Zを(X:0、Y:400)及び拡大率を300%として認識するようになっている。なお、図6(a)及び(b)において、左図は、画像表示領域DAにされているコンテンツCを示し、右図は、フルサイズのコンテンツCを基準として表示されている表示範囲SAを示している。
【0070】
特定処理部322は、各構成要素データD30に含まれる要素基準座標(中心座標)Oに基づいて、認識処理部321によって認識されたコンテンツCの表示範囲SA内に含まれる構成要素FEを特定するようになっている。すなわち、特定処理部322は、表示範囲SA内に要素基準座標Oが含まれるか否かを判断し、表示範囲SA内に要素基準座標Oが含まれる場合には、その構成要素FEを画像表示領域DAに表示されている構成要素(以下、「特定構成要素」という。)と特定し、そうでなければ、その構成要素が画像表示領域DAに表示されていないと判断するようになっている。なお、本実施形態においては、要素基準座標Oが構成要素FEの中心座標であるため、構成要素FEの全ての画像またはテキストが表示範囲SAに含まれていない場合であっても、特定構成要素として特定される。
【0071】
例えば、図8(a)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにフルサイズのコンテンツCが表示されている場合には、全ての構成要素FEの要素基準座標Oは表示範囲SA内に含まれているので、特定処理部322は、全ての構成要素FEを特定構成要素と特定するようになっている。また、図8(b)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにコンテンツCの左隅の一部が表示されている場合には、一部の構成要素FE、具体的には、第5構成要素FE5、第6構成要素FE6、第9構成要素FE9及び第10構成要素FE10の要素基準座標Oのみ表示範囲SA内に含まれているので、特定処理部322は、表示範囲SAに要素基準座標Oが含まれている各構成要素FEを特定構成要素と特定するようになっている。
【0072】
なお、本実施形態において、何れの構成要素FEの要素基準座標Oが表示範囲SAに含まれない場合には、表示範囲SAに最も近い要素基準座標Oを有する構成要素FEを特定構成要素に特定するようになっている。
【0073】
抽出処理部323は、各特定構成要素毎のキーワードをコンテンツデータD10から抽出するようになっている。そして、抽出処理部323は、コンテンツデータD10に含まれるキーワードデータD40と認識処理部321において認識された閲覧サイズ、閲覧領域基準座標Z及び拡大率に基づいて、各抽出されたキーワード(以下、「抽出キーワード」という。)に対して、キーワードID、キーワードが属する構成要素ID、キーワードのテキスト、キーワードにおけるフォント種別、キーワード基準座標P、キーワードの表示文字サイズ、キーワードにおけるスタイル(装飾)の種別の各種の抽出キーワードに関する情報(以下、「抽出キーワード情報」という。)D50を認識するようになっている。
【0074】
特に、抽出処理部323は、キーワードの表示文字サイズにおいては、各キーワードデータD40のフォント情報に示されたサイズに認識処理部321において認識された拡大率を乗算して算出するようになっている。
【0075】
例えば、図9(a)に示すように、コンテンツデータD10に基づいてコンテンツCの左隅の一部が表示範囲SAとして画像表示領域DAに表示されている場合には、図9(b)に示すように、第5構成要素FE5、第6構成要素FE6、第9構成要素FE9及び第10構成要素FE10の各構成要素FEにおいて、該当するキーワードデータD30から、「○×△」または「Webアプリ」などのテキストを抽出するとともに、それぞれのキーワードに対してキーワードID、構成要素ID、フォント種別、キーワード基準座標P、表示文字サイズ、スタイル(装飾)の種別を検出するようになっている。
【0076】
なお、抽出処理部323は、抽出されたキーワードに基づいて検出された各種の抽出キーワード情報は、ROM/RAM305のワークエリアに記憶するようになっている。
【0077】
特徴量算出処理部324は、抽出処理部323によって抽出された抽出キーワード情報に基づいて、各キーワードにおける出現頻度を示すTF−IDFの値を特徴量として算出するようになっている。特に、抽出処理部323は、特定構成要素を一の文書とみなし、特定構成要素毎に、抽出された全ての抽出キーワード情報(すなわち、各特定構成要素に含まれる全ての抽出キーワード情報)における出現頻度に対する各キーワードにおける出現頻度(具体的には「1」)の割合をTF−IDFの値として算出するようになっている。例えば、第5構成要素FE、第6構成要素FE、第9構成要素FE及び第10構成要素FEが特定構成要素であって、第5構成要素FEのキーワード「開発」についてTF−IDFを算出する場合には、当該キーワードの特徴量として、特定構成要素の全てにおける出現頻度が「2」であり、各キーワードにおける出現頻度「1」であるので、抽出処理部323は、TF−IDFを「0.5」と算出するようになっている。
【0078】
重み係数算出処理部325は、特定構成要素の各キーワード毎に、各キーワードの表示された状態における視認性を数値化した表示範囲SAの表示に関する重み係数を算出し、算出された重み係数を各キーワードの特徴量に乗算して、各キーワードの特徴量を補正するようになっている。
【0079】
一般的に、キーワードの各文字における表示文字サイズ若しくは装飾の差異または表示範囲SAに表示されたキーワードの当該表示範囲SAに対する位置の違いは、ユーザのキーワードに対する視認性に影響を与える。例えば、小さい文字より大きい文字で記載されていれば、キーワードそのものの注目度(興趣レベル)も高くなるとともに、ユーザにとっても文書の可読性が向上する。また、キーワードの各文字における太字、字体、斜体または色の差異は、ユーザにキーワードの識別力の差、または、文書における重要度の差を生じさせる。さらに、キーワードが表示範囲SAの中心にあれば、ユーザの注目度が高いものであることが想定されるとともに、表示範囲SAの周辺にあればユーザの注目度が低いことが想定される。そこで、本実施形態の重み係数算出処理部325は、キーワードにおける表示文字サイズ、装飾数及び表示範囲SAの中心からの距離によって特定構成要素のキーワード毎に各キーワードの表示された状態における視認性(可読性、注目度、識別度及び重要度)を数値化し、キーワードの特徴量を補正するようになっている。
【0080】
具体的には、キーワードの各文字における表示文字サイズが大きくなれば、ユーザにおける注目度及び可読性が向上する。したがって、重み係数算出処理部325は、(式1)に示すように、抽出された全てのキーワードにおける表示文字サイズの平均に対する各抽出キーワードの表示文字サイズ(以下、「対象表示文字サイズ」ともいう。)の割合を各抽出キーワードの重み係数WAとして算出するようになっている。なお、(式1)における「α」は、予め定められた定数である。また、表示文字サイズが大きいほど、重み係数WAの値は大きくなる。ただし、表示文字サイズが大きすぎる場合には、または、小さすぎる場合には、キーワードを視認することが困難になるので、対象の表示文字サイズが所定の値以下または所定の値以上の場合には、WAは「0」として取り扱っても良い。
【0081】
【数1】
【0082】
また、キーワードの各文字における装飾数が多くなれば、キーワードの識別力及び重要度が高くなり、かつ、特徴点としてのユーザの興趣性も向上していると想定される。したがって、重み係数算出処理部325は、(式2)に示すように、抽出された全てのキーワードにおける文字装飾数の平均に対する各抽出キーワードの文字装飾数(以下、「対象文字装飾数」ともいう。)の割合を各抽出キーワードの重み係数WBとして算出するようになっている。なお、(式2)における「β」は、予め定められた定数である。また、装飾数が多いほど、重み係数WBは大きな値となる。
【0083】
【数2】
【0084】
さらに、キーワードのコンテンツCにおける表示範囲SAの中心からの距離が遠くなれば、注目度や視認性も低下して特徴点としてのユーザの興趣性も低下していると想定し、重み係数算出処理部325は、(式3)に示すように、認識処理部321において認識された閲覧領域基準座標Z並びに閲覧領域サイズW及びHと抽出処理部323において抽出された抽出キーワード情報に含まれるキーワード基準座標Pに基づいて表示範囲SAの中心座標COを算出するようになっている。そして、重み係数算出処理部325は、当該中心座標COから各抽出キーワードの座標までの表示距離(以下、「相対表示距離」ともいう。)(Li)を算出するとともに、抽出された全てのキーワードにおける表示距離の平均(以下、「平均相対表示距離」ともいう。)(Lav)に対する各抽出キーワードの相対表示距離(Li)の割合を各抽出キーワードの重み係数WCとして算出するようになっている。なお、(式3)における「γ」は、予め定められた定数である。また、キーワードの距離Liが近いほど、重み係数WCは大きくなる。
【0085】
【数3】
【0086】
例えば、図10の示すように、コンテンツデータD10に基づいてコンテンツCの左隅の一部が表示範囲SAとして画像表示領域DAに表示されている場合には、中心座標COに対してキーワード「×○△」の座標までの相対表示距離Liとなり、各キーワード基準座標Pの中心座標COからの距離の平均(平均相対距離Lav)に対するキーワード「×○△」の座標までの相対表示距離Liの割合を重み係数WCと算出するようになっている。
【0087】
補正処理部は、重み係数算出処理部325において算出された各キーワード毎の重み係数WA、WB及びWCを該当する各キーワードの特徴量、すなわち、TF−IDFの値にそれぞれ乗算するようになっている。
【0088】
類似度算出部326は、通信インターフェース301を介してデータベース100から関連情報データD20における各文書ベクトル(式4)を取得するとともに、補正された各キーワードの特徴量に基づいて各特定構成要素の各キーワードにおける補正された特徴量を合計して一の検索式(式5)を生成するようになっている。そして、類似度算出部326は、表示範囲SA内に含まれているコンテンツCと各関連情報との類似度として、(式4)を用いて生成したベクトル検索式(Q)と取得した文書ベクトル(Dj)を比較してベクトル空間モデルを用いて検索式と各関連情報との類似度(sim)を算出するようになっている。
【0089】
【数4】
【0090】
【数5】
【0091】
【数6】
【0092】
なお、(式4)〜(式6)においては、Key1〜Keymは、キーワードのテキストを示し、q1〜qmは、補正されたTF−IDFの値を示す。また、Wj1〜Wjmは、各関連情報における各キーワードのTF−IDFの値である。
【0093】
提供処理部327は、描画制御部303及び表示部302を直接的にまたは間接的に制御し、算出された各類似度における上位の関連情報のリストを推薦情報リストLTとして画像表示領域DAに表示させてユーザに閲覧可能に提供するようになっている。具体的には、提供処理部327は、算出された各類似度の上位3位までの関連情報を特定し、描画制御部303及び表示部302を制御して、特定した関連情報のIDをリストLTにして画像表示領域DAに表示するようになっている。例えば、図11(a)に示すように、コンテンツデータD10に基づいてコンテンツCの左隅の一部が表示範囲SAとして画像表示領域DAに表示されている場合には、図11(b)に示すように、類似度の高い上位3位までの関連情報の関連情報ID「item004」、「item005」及び「item006」を推薦情報リストLTとして画像表示領域DAに表示させるようになっている。
【0094】
なお、データ処理部320の各部は、上記の各処理を表示されるコンテンツCの表示範囲SAが変更される毎に実行され、当該コンテンツCの表示範囲SAが変更される毎に類似度の高い関連情報のIDを推薦情報リストLTとして画像表示領域DAに表示するようになっている。例えば、図12(a)に示すように、コンテンツCがフルサイズで表示されているとともに、関連情報のID「item001」、「item002」及び「item003」が推薦情報リストLTとして表示されている場合に、図12(b)に示すように、コンテンツCの左隅の一部を表示範囲SAとして画像表示領域DAに表示するための指定操作を行うと、図12(c)に示すように、指定された表示範囲SAが画像表示領域DAに表示されるとともに、上記の各処理が実行されて、関連情報のID「item004」、「item005」及び「item006」が推薦情報リストLTとして再表示されるようになっている。
【0095】
<推薦情報提供処理>
次に、図13を用いて本実施形態の携帯用通信端末装置300における推薦情報提供処理の動作について説明する。なお、図13は、本実施形態の携帯用通信端末装置300における推薦情報提供処理の動作を示すフローチャートである。
【0096】
なお、本動作においては、サーバ装置200は、携帯用通信端末装置300の指示に基づいてデータベース100を制御しつつ、当該携帯用通信端末装置300にコンテンツデータD10及び各関連情報における文書ベクトルを適宜送信する。また、データベース100には、キーワードデータD40を含めて複数のコンテンツデータD10が記憶されているとともに、各関連情報においても既に文書ベクトルが生成されて記憶されているものとする。
【0097】
まず、端末管理制御部306が、操作部304に入力されたコンテンツデータD10の閲覧に関するユーザ指示を検出すると(ステップS101)、コンテンツデータD10をデータベース100から取得するかまたは既に取得したコンテンツデータD10の表示範囲SAの変更かを判断する(ステップS102)。
【0098】
このとき、端末管理制御部306は、既に取得してあるコンテンツデータD10に基づく表示範囲SAの変更であると判断した場合(ステップS102:No)には、ステップS104の処理に移行する。一方、端末管理制御部306は、コンテンツデータD10をデータベース100から取得すると判断した場合(ステップS102:Yes)には、URLアドレスなどの閲覧すべきコンテンツCのアドレスを取得し、通信インターフェース301に、サーバ装置200の制御の下、コンテンツCのアドレスに基づいてデータベース100からコンテンツデータD10を取得させ、ROM/RAM305のワークエリアに記憶する(ステップS103)。
【0099】
次いで、描画制御部303は、初期設定によって予め定められた表示範囲SAまたは指示された表示範囲SAと、ROM/RAM305に記憶されているコンテンツデータD10とに基づいて、表示部302の画像表示領域DAにコンテンツCを表示させる(ステップS104)。なお、表示範囲SAの初期値はフルサイズとなっているので、描画制御部303は、コンテンツCを最初に表示する際には、フルサイズによってコンテンツCを表示する。
【0100】
次いで、認識処理部321は、表示されているコンテンツCの閲覧サイズ、閲覧領域基準座標Z及び拡大率を認識して当該コンテンツCの表示範囲SAを認識するとともに、特定処理部322は、各構成要素データD30に含まれる要素基準座標Oに基づいて、認識された表示範囲SA内に含まれる特定構成要素を特定する(ステップS105)。
【0101】
次いで、抽出処理部323は、コンテンツデータD10含まれるキーワードデータD40に基づいて、特定構成要素毎のキーワードを抽出キーワードとして、各種の抽出キーワード情報とともに抽出する(ステップS106)。抽出キーワード情報には、キーワードID、キーワードが属する構成要素ID、キーワードのテキスト、キーワードにおけるフォント種別、キーワード基準座標P、キーワードの表示文字サイズ、キーワードにおけるスタイル(装飾)の種別が含まれる。
【0102】
次いで、特徴量算出処理部324は、特定構成要素を一の文書とみなし、特定構成要素毎に、抽出処理部323によって抽出された抽出キーワード情報に基づいて、各抽出キーワードにおける特徴量を算出する(ステップS107)。具体的には、特徴量算出処理部324は、特定構成要素毎に、抽出処理部323によって抽出された抽出キーワード情報に基づいて、各キーワードにおける出現頻度を示すTF−IDFの値を特徴量として算出する。
【0103】
次いで、重み係数算出処理部325は、特定構成要素の各キーワード毎に、各キーワードの表示された状態における上記の視認性を数値化した表示範囲SAの表示に関する重み係数WA、WB及びWCを算出し、算出された重み係数を各抽出キーワードの特徴量に乗算して、各抽出キーワードの特徴量を補正する(ステップS108)。
【0104】
次いで、類似度算出部326は、サーバ装置200の制御の下、通信インターフェース301を介してデータベース100から関連情報データD20における各文書ベクトルを取得するとともに、補正された各キーワードの特徴量に基づいて各特定構成要素の各キーワードにおける補正された特徴量を合計して一の検索式を生成する(ステップS109)。
【0105】
次いで、類似度算出部326は、表示範囲SA内に含まれているコンテンツCと各関連情報との類似度として、生成した検索式と取得した文書ベクトルを比較して検索式と各関連情報との類似度を算出する(ステップS110)。
【0106】
次いで、提供処理部327は、算出された各類似度における上位(例えば3位まで)の関連情報のリストを推薦情報リストLTとして画像表示領域DAに表示させてユーザに閲覧可能に提供して(ステップS111)本動作を終了する。具体的には、提供処理部327は、算出された各類似度の上位3位までの関連情報を特定し、特定した関連情報のIDを推薦情報リストLTにして画像表示領域DAに表示する。
【0107】
<作用効果>
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲SA内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正することができるので、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツCを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、携帯用通信端末装置300は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるとともに、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0108】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、抽出された全ての抽出キーワードにおける文字サイズの平均に対する各抽出キーワードの文字サイズの割合を各抽出キーワードの重み係数として算出することができるとともに、前記抽出された全ての抽出キーワードにおける文字装飾数の平均に対する各キーワードの文字装飾数の割合を各抽出キーワードの重み係数として算出することができる。したがって、本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、表示範囲SA内に含まれるキーワードの視認性及び視覚誘引性を数値化し、当該数値化された視認性及び視覚誘引性に基づいて各キーワードの特徴量を補正することができるので、ユーザが閲覧している表示範囲SAに含まれるコンテンツCの内容をキーワードの特徴量によって的確に把握することができる。
【0109】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、算出された各相対表示距離のうち最大値の相対表示距離に対する各抽出キーワードの相対表示距離の割合を各抽出キーワードの重み係数として算出することができるので、表示範囲SA内に含まれるキーワードの配置性を数値化してユーザにおける興趣レベルを把握することができるとともに、ユーザが閲覧している表示範囲SAに含まれるコンテンツCの内容をキーワードの特徴量によって的確に把握することができる。
【0110】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、コンテンツデータD10に含まれたキーワードデータD40に基づいて重み係数を算出するので、キーワードデータD40を個々に算出する場合に比べて、類似度の算出処理に対する負荷を軽減することができるとともに、短時間によって類似度を算出することができるので、ユーザにストレスを与えずに、コンテンツCを表示させることができる。
【0111】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、補正された各キーワードの特徴量に基づいて一の検索式を生成し、当該生成した検索式に基づいて表示範囲SA内に含まれているコンテンツCと各関連情報との類似度を算出することができるので、関連情報と表示範囲SAに含まれるコンテンツCとの類似度を簡易にかつ的確に類似度を算出することができる。
【0112】
<変形例>
本実施形態においては、コンテンツデータD10及び関連情報データD20をサーバ装置200から取得するようになっているが、携帯電話機に装着されたフラッシュメモリ、DVDまたはハードディスなどの外部記憶媒体、または、内部に設けられたハードディスクなどの内部記憶媒体から読み出して取得してもよい。
【0113】
また、本実施形態の例では、タイプや内容が異なる文または文の纏まりから構成される文書を表示部302に表示させてユーザに閲覧させているが、タイプや内容が異なる複数の画像、画像と文または画像と文の纏まりから構成されるコンテンツCを表示部302に表示させてユーザに閲覧させるようにしてもよい。この場合には、キーワードとしては、画像を説明するための文など画像の構成要素データD30が有するテキストデータを用いる。
【0114】
また、本実施形態においては、関連情報及び特定構成要素に含まれる各キーワードの特徴量に、各キーワードの出現頻度を示すTF−IDFを用いているが、単にキーワードの出現頻度の回数をカウントし当該カウント数を特徴量に用いるなど、関連情報及び特定構成要素内における各キーワードの特徴量を算出することができるものであればよい。
【0115】
また、本実施形態においては、該当する関連情報のリストを選択表示可能に画像表示領域DAに表示することによって関連情報に関する情報を提供するようになっているが、当該リストLTに代えて関連情報そのものを画像表示領域DAに表示して直接提供してもよいし、例えば、予め特定された電子メールアドレスにデータとして送信し、または、予め定められたURLにアクセスすることによってWebページを介して閲覧可能に関連情報または関連情報に関する情報を間接的に提供するようにしてもよい。
【0116】
また、本実施形態では、携帯用通信端末装置300において、構成要素FEを特定する特定処理、キーワードを抽出する抽出処理、特徴量算出処理、重み係数算出処理、補正処理、類似度算出処理及び提供処理が実行されているが、携帯用通信端末装置300またはサーバ装置200の何れかによって各種の処理が行われてもよい。この場合には、サーバ装置200と携帯用通信端末装置300との逐次的な通信によって必要なデータ授受することができるようになっている。また、このように各種のデータ処理をサーバ装置200によって行うことができれば、上述の実施形態と同様な処理を行うことができるとともに、携帯用通信端末装置300の処理負担を軽減することができる。
【産業上の利用可能性】
【0117】
本発明の情報閲覧システムSは、インターネットなどのネットワークNを用いて新聞、雑誌、書籍または論文などの情報を閲覧するシステムに適用することができる。
【符号の説明】
【0118】
B … バス
C … コンテンツ
S … 情報閲覧システム
DA … 画像表示領域
FE … 構成要素
LT … 推薦情報リスト
SA … 表示範囲
WA、WB、WC … 重み係数
100 … データベース
200 … サーバ装置
300 … 携帯用通信端末装置
301 … 通信インターフェース
302 … 表示部
303 … 描画制御部
304 … 操作部
306 … 端末管理制御部
320 … データ処理部
321 … 認識処理部
322 … 特定処理部
323 … 抽出処理部
324 … 特徴量算出処理部
325 … 重み係数算出処理部
326 … 類似度算出処理部
327 … 提供処理部
【技術分野】
【0001】
本発明は、携帯用通信端末装置などの情報閲覧端末装置に関し、特に、コンテンツを閲覧中に当該コンテンツの関連情報、関連商品または関連広告を情報として提供する技術分野に属する。
【背景技術】
【0002】
近年、インターネットなどのネットワーク及びパーソナルコンピュータなどの通信端末装置の発達に伴って、書籍、ニュースなどの記事、商品またはサービスなどの広告(以下、まとめて「コンテンツ」という。)を、ネットワークまたは記録媒体を介して電子的に閲覧することが一般化している。最近では、通信機能を有する携帯ゲーム機器、タブレット型携帯PC端末装置、携帯用電話機などの携帯可能な携帯用通信端末装置を介してコンテンツを閲覧させることも多く行われている。
【0003】
このような状況下において、ユーザが閲覧しているコンテンツに関連する情報(以下、「関連情報」という。)を推薦するシステム(以下、「情報閲覧システム」という。)が知られている。具体的には、このシステムは、ユーザが所定のコンテンツを閲覧している際に、当該閲覧しているコンテンツデータに関連し、ユーザにとって有用であると想定される広告、文書または画像などの他のコンテンツを提供するようになっている。例えば、情報閲覧システムは、閲覧、参照または編集の対象となっている文書からキーワードを抽出するとともに、抽出したキーワードと、履歴情報として既に記憶された文書データ毎に予め記憶されたキーワードと、を比較し、類似と判定されたキーワードを有する文書データを推薦文書としてユーザに提供するようになっている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−211385号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の情報閲覧システムにあっては、編集、閲覧などの作業内容と作業を行っている領域(注目領域)に含まれるキーワードとに基づいて推薦すべき関連文書を特定しているため、文章を閲覧しているユーザの嗜好まで考慮して当該推薦すべき関連文書を特定していない。すなわち、この情報閲覧システムにあっては、ユーザが興味を持っている点を分析することなく、かつ、ユーザが実際に閲覧しているか否かを判断することなく、注目領域に含まれている全てのキーワードを同レベルの情報として採用するため、ユーザが全く興味を持っていない関連文書が多く推薦されることも予想される。
【0006】
また、特許文献1に記載の情報閲覧システムにあっては、編集、閲覧または参照などユーザにおける文書データの操作履歴に基づいて推薦文書を提供しているため、未だ参照していない文書などユーザの操作履歴に含まれない文書を推薦文書として提供することができない。
【0007】
本発明は、上記課題を解決するためになされたものであり、その目的は、閲覧者であるユーザが興味のあると想定される情報を的確に提供すること、及び、それにより提供された情報の閲覧数を向上させることが可能な情報閲覧端末装置及び閲覧プログラムなどを提供することにある。
【課題を解決するための手段】
【0008】
(1)上記課題を解決するため、本発明の情報閲覧端末装置は、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧端末装置であって、コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段と、所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、前記表示範囲内に含まれている前記構成要素を特定する特定手段と、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、各抽出キーワードの特徴量を算出する特徴量算出手段と、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段と、を備える構成を有している。
【0009】
一般的に、キーワードの各文字における表示文字サイズ若しくは装飾の差異または表示範囲に表示されたキーワードの当該表示範囲に対する位置の違いは、ユーザのキーワードに対する視認性に影響を与える。例えば、小さい文字より大きい文字で記載されていれば、キーワードそのものの注目度(興趣レベル)も高くなるとともに、ユーザにとっても文書の可読性が向上する。また、キーワードの各文字における太字、字体、斜体または色の差異は、ユーザにキーワードの識別力の差及び文書における重要度の差を生じさせる。さらに、キーワードが表示範囲の中心にあれば、ユーザの注目度が高く、表示範囲の周辺にあればユーザの注目度が低い。
【0010】
本発明の情報閲覧端末装置は、上記構成により、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0011】
(2)また、本発明の情報閲覧端末装置は、前記重み付け係数算出手段が、前記表示文字サイズに基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字サイズの平均に対する各抽出キーワードの文字サイズの割合を各抽出キーワードの重み係数として算出する構成を有している。
【0012】
この構成により、本発明の情報閲覧端末装置は、表示範囲内に含まれるキーワードの視認性、特に可読性及び注目度を数値化し、当該数値化された視認性に基づいて各キーワードの特徴量を補正することができるので、ユーザが閲覧している表示範囲に含まれるコンテンツの内容をキーワードの特徴量によって的確に把握することができる。
【0013】
(3)また、本発明の情報閲覧端末装置は、前記重み付け係数算出手段が、前記文字装飾数に基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字装飾数の平均に対する各キーワードの文字装飾数の割合を各抽出キーワードの重み係数として算出する構成を有している。
【0014】
この構成により、本発明の情報閲覧端末装置は、表示範囲内に含まれるキーワードの視認性、特に、キーワードの重要度及び他のキーワードとの識別度を数値化し、当該数値化された視認性に基づいて各キーワードの特徴量を補正することができるので、ユーザが閲覧している表示範囲に含まれるコンテンツの内容をキーワードの特徴量によって的確に把握することができる。
【0015】
(4)また、本発明の情報閲覧端末装置は、前記重み付け係数算出手段が、前記表示範囲内の位置に基づく重み係数を算出する際には、前記表示範囲の中心座標から各抽出キーワードの座標までの距離を相対表示距離として算出するとともに、各抽出キーワードの相対表示距離に対する前記抽出された全ての抽出キーワードにおける算出された各相対表示距離の平均を示す平均相対表示距離の割合を各抽出キーワードの重み係数として算出する構成を有している。
【0016】
この構成により、本発明の情報閲覧端末装置は、表示範囲内に含まれるキーワードの視認性、特にユーザの注目度を数値化してユーザにおける興趣レベルを把握することができるので、ユーザが閲覧している表示範囲に含まれるコンテンツの内容をキーワードの特徴量によって的確に把握することができる。
【0017】
(5)また、本発明の情報閲覧端末装置は、コンテンツデータには、構成要素毎に、各構成要素に含まれるキーワードのデータがキーワードデータとして含まれるとともに、前記重み係数算出手段が、各抽出キーワードの該当するキーワードデータから前記表示文字サイズの情報、前記文字装飾に関する情報または基準位置座標の情報における該当する情報を取得し、当該取得した情報に基づいて各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する構成を有している。
【0018】
この構成により、本発明の情報閲覧端末装置は、コンテンツデータに含まれたキーワードデータに基づいて重み係数を算出するので、キーワードデータを個々に算出する場合に比べて、類似度の算出処理に対する負荷を軽減することができるとともに、短時間によって類似度を算出することができるので、ユーザにストレスを与えずに、コンテンツを表示させることができる。
【0019】
(6)また、本発明の情報閲覧端末装置は、前記類似度算出手段が、前記補正された各抽出キーワードの特徴量に基づいて検索式を生成し、当該生成した検索式に基づいて前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する構成を有している。
【0020】
この構成により、本発明の情報閲覧端末装置は、関連情報と表示範囲に含まれるコンテンツとの類似度を簡易にかつ的確に類似度を算出することができる。
【0021】
(7)また、本発明の情報閲覧端末装置は、前記類似度算出手段が、同一の各抽出キーワードにおける特徴量を合算し、前記検索式として抽出キーワードとその特徴量とから構成されるベクトル空間モデルを生成するとともに、当該生成したベクトルと、前記関連情報に属する各キーワードとその特徴量から構成される前記関連情報に関するデータとしてのベクトルと、を比較し、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する構成を有している。
【0022】
この構成により、本発明の情報閲覧端末装置は、関連情報と表示範囲に含まれるコンテンツとの類似度を簡易にかつ的確に類似度を算出することができる。
【0023】
(8)また、本発明の情報閲覧端末装置は、前記特徴量算出手段が、前記抽出された各抽出キーワードの前記特定された構成要素内における出現頻度及び当該各抽出キーワードにおけるコンテンツ内における出現頻度に基づいて各抽出キーワードの特徴量を算出する構成を有している。
【0024】
この構成により、本発明の情報閲覧端末装置は、キーワードの特徴量を簡易にかつ的確に算出することができる。
【0025】
(9)また、本発明の情報閲覧端末装置は、携帯可能に形成されている。
【0026】
通常、携帯用電話機など、携帯可能な通信端末装置は、画像表示領域のサイズが限られ、一度に多くの文章または画像を画像表示領域に視認可能に表示することができない。
【0027】
したがって、本発明の情報閲覧端末装置は、表示範囲に基づいて関連情報との類似度を算出するので、携帯可能な場合であっても的確に類似度を算出することができる。
【0028】
(10)上記課題を解決するため、本発明の情報閲覧システムは、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、請求項1〜9に記載の情報閲覧端末装置と、前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報として前記関連情報に関するデータ群が記憶されているデータベースと、を備える構成を有している。
【0029】
この構成により、本発明の情報閲覧システムは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0030】
(11)上記課題を解決するため、本発明の情報閲覧システムは、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、前記コンテンツと前記関連情報をユーザに閲覧させるための情報閲覧端末装置と、前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報に関するデータ群が記憶されているデータベースと、前記データベースを管理するサーバ装置と、を備え、前記情報閲覧端末装置が、前記サーバ装置から送信されたコンテンツデータを受信する受信手段と、所定の画像表示領域を有し、前記受信したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、前記表示範囲内に含まれている前記構成要素を特定する特定手段と、を有するとともに、前記サーバ装置または前記情報閲覧端末装置の何れか一方に、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、各抽出キーワードの特徴量を算出する特徴量算出手段と、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、を有し、前記携帯用通信端末装置が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する構成を有している。
【0031】
この構成により、本発明の情報閲覧システムは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0032】
(12)上記課題を解決するため、本発明の情報閲覧プログラムは、所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段を有する情報閲覧端末装置用のコンピュータで実行されるプログラムにおいて、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧プログラムであって、前記コンピュータを、コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段、ユーザの操作及び前記コンテンツデータに基づいて画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段、前記表示範囲内に含まれている前記構成要素を特定する特定手段、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段、各抽出キーワードの特徴量を算出する特徴量算出手段、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段、及び、前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段、として機能させる構成を有している。
【0033】
この構成により、本発明の情報閲覧プログラムは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0034】
(13)上記課題を解決するため、本発明の情報閲覧方法は、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧方法であって、前記コンピュータを、コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得工程と、情報閲覧端末装置の表示手段に設けられた所定の画像表示領域に、前記取得したコンテンツデータ及びユーザの操作に基づいて表示されるコンテンツの表示範囲を認識する認識工程と、前記表示範囲内に含まれている前記構成要素を特定する特定工程と、前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出工程と、各抽出キーワードの特徴量を算出する特徴量算出工程と、各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出工程と、前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正工程と、前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出工程と、前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供工程と、を含む構成を有している。
【0035】
この構成により、本発明の情報閲覧方法は、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【発明の効果】
【0036】
本発明の情報閲覧端末装置、情報閲覧システム、情報閲覧プログラム及び情報閲覧方法は、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲内の位置に基づいて算出された重み係数に基づいて各抽出キーワードの特徴量を補正しており、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、本発明は、ユーザの興趣性を考慮した関連情報を表示手段に表示することができるので、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【図面の簡単な説明】
【0037】
【図1】本発明に係る情報閲覧システム一の実施形態におけるシステム構成図である。
【図2】一の実施形態における構成要素データを含むコンテンツデータのデータ構造の一例である。
【図3】一の実施形態におけるキーワードデータを含むコンテンツデータのデータ構造の一例である。
【図4】一の実施形態における携帯用通信端末装置に表示されるコンテンツデータの一例である。
【図5】一の実施形態における関連情報データのデータ構造の一例である。
【図6】一の実施形態における各携帯用通信端末装置の構成を示すブロック図である。
【図7】一の実施形態の認識処理部において認識される閲覧サイズ、閲覧領域基準座標及びお拡大率を説明するための図である。
【図8】一の実施形態の特定処理部において特定される表示範囲を説明するための図である。
【図9】一の実施形態の抽出キーワードとその抽出キーワード情報の一例である。
【図10】一の実施形態の重み係数算出処理部において、キーワードの表示範囲の中心からの距離に基づく重み係数について説明するための図である。
【図11】一の実施形態の提供処理部において、提供される推薦情報リストを説明するための図である。
【図12】一の実施形態におけるコンテンツの表示範囲の変更とそのときの提供処理部における推薦情報リストを説明するための図である。
【図13】一の実施形態の携帯用通信端末装置における推薦情報提供処理の動作を示すフローチャートである。
【発明を実施するための形態】
【0038】
以下、本発明の実施形態について、図面を参照しながら説明する。以下に説明する実施形態は、ネットワークを介して携帯電話機などの携帯用通信端末装置、または、当該携帯用通信端末装置、他の通信装置であるサーバ装置及びコンテンツデータが記憶されたデータベースを有し、コンテンツデータに基づいてユーザが閲覧可能なコンテンツを提供する情報閲覧システムに対して、本発明の情報閲覧端末装置、情報閲覧システム、情報閲覧プログラム及び情報閲覧方法を適用した場合の実施形態である。
【0039】
<情報閲覧システムの概要構成>
まず、図1を用いて本実施形態の情報閲覧システムSの概要構成について説明する。なお、図1は、情報閲覧システムSの構成を示すシステム構成図である。
【0040】
本実施形態の情報閲覧システムSは、図1に示すように、広告、文書または画像などの複数の構成要素FEから構成されるコンテンツCをユーザに提供する際に用いる複数のコンテンツデータD10と当該コンテンツデータD10に関連する複数の関連情報のデータ(以下、「関連情報データ」という。)D20が記憶されたデータベース100と、データベース100の制御及びデータの管理を行うサーバ装置200とを有している。
【0041】
また、情報閲覧システムSは、画像表示領域DAを有し、ユーザが個々に有し、当該ユーザにコンテンツCを提供するために、コンテンツデータD10に基づいてコンテンツCを画像表示領域DAに閲覧可能に表示する携帯可能な複数の通信端末装置(以下、「携帯用通信端末装置」という。)300を有している。そして、複数の携帯用通信端末装置300は、基地局BSを介して、データベース100及びサーバ装置200は、直接的にインターネット上において提供されるWorld Wide Web システムなどのネットワークNにそれぞれ接続されている。
【0042】
携帯用通信端末装置300は、コンテンツCを画像表示領域DAに表示している際に、当該表示しているコンテンツCに属する構成要素FEを特定しつつ、特定された構成要素(以下、「特定構成要素」ともいう。)に含まれるキーワードの特徴量を算出し、広告、文書または画像などのユーザが閲覧しているコンテンツCに関連があると想定される関連情報(以下、「推薦情報」ともいう。)を画像表示領域DAにコンテンツCとともに表示するようになっている。特に、携帯用通信端末装置300は、ユーザに提供すべき関連情報を、データベース100に記憶されている複数の関連情報データD20に基づいて決定し、決定した関連情報(すなわち、推薦情報)に関する情報としてそのリスト(以下、「推薦情報リスト」という。)LTを画像表示領域DAに表示するようになっている。
【0043】
なお、本実施形態においては、コンテンツデータD10は、固有のURL(Uniform Resource Locator)と呼ばれるアドレス(以下、「URL」という。)に基づいて、データベース100に記憶され、また、携帯用通信端末装置300によって指定されて読み出されるようになっている。
【0044】
<データベース>
次に、図2〜図5の各図を用いて本実施形態のデータベース100と当該データベース100に記憶されているコンテンツデータD10及び関連情報データD20について説明する。なお、図2は、本実施形態における構成要素データD30を含むコンテンツデータD10のデータ構造の一例であり、図3は、本実施形態におけるキーワードデータD40を含むコンテンツデータD10のデータ構造の一例である。また、図4は、本実施形態における携帯用通信端末装置300に表示されるコンテンツデータD10の一例であり、図5は、本実施形態における関連情報データD20のデータ構造の一例である。
【0045】
本実施形態のデータベース100には、WWWシステム用のリソースデータ(以下、「Webページデータ」ともいう。)がコンテンツデータD10として記録されている。各コンテンツデータD10は、広告、画像、文または複数の文の纏まりなどタイプや内容が異なる複数の構成要素FEのデータ(以下、「構成要素データ」ともいう。)D30をタグと呼ばれる識別子を用いつつ、HTML(Hyper Text Markup Language)またはXML(eXtensible Markup Language)などのマークアップ言語によって構成されている。例えば、各コンテンツデータD10は、図2に示すように、各コンテンツデータD10の識別を行うためのコンテンツIDと、コンテンツCとして表示される際に基準となるページサイズ、コンテンツCを構成する構成要素データD30から構成される。なお、例えば、コンテンツIDは、URLアドレスなどの格納場所を示すアドレスであってもよいし、当該アドレスとは別に付与されていてもよい。ただし、コンテンツIDが、アドレスとは別に付与されている場合には、アドレスは各コンテンツデータD10に含まれる。
【0046】
また、各構成要素データD30には、各構成要素FEを識別するための構成要素IDと、各構成要素FEが属するコンテンツIDと、各構成要素FEが表示される際に基準(中心)となるXYにおける絶対座標(以下、「要素基準座標」という。)Oと、各構成要素FEの表示上の幅と高さを示すサイズ(以下、「領域サイズ」という。)と、文書(テキスト)、画像その他の構成要素FEの種別を示すタイプと、テキストまたは画像などの構成要素FEそのものの内容データと、が含まれる。
【0047】
さらに、各構成要素データD30には、図3に示すように、内容データに含まれるキーワードにおけるデータ(以下、「キーワードデータ」という。)D40が含まれる。このキーワードデータD40には、各キーワードを識別するためのキーワードIDと、各キーワードが属する構成要素IDと、各キーワードのテキスト、各キーワードのフォントの種別(以下、「フォント種別」という。)、各キーワードが表示される際に基準(左上隅)となるXYにおける絶対座標(以下、「キーワード基準座標」という。)Pと、キーワードの文字サイズ、キーワードのスタイル(装飾)の種別と、が含まれる。
【0048】
なお、キーワードデータD40として登録されるキーワードは、内容データに対して形態素解析を実行して品詞に分解し、不要な品詞を排除して抽出されたもの、所定のキーワード辞書に含まれたキーワードと完全一致したもの、または、関連情報を提供する提供者またはシステム管理者に抽出されたものなど予め抽出されたものを用いる。そして、キーワードデータD40に含まれる各データは、提供者または管理者によって、または、コンテンツデータD10にリソースとして記述されたタグの情報を用いることによって登録される。例えば、タグの情報としては、HTML上に記述されたdivタグまたはspanタグによって識別され、CSS(Cascading Style Sheet)によって配置、装飾若しくは文字サイズの内容が定義された情報、または、HTMLのテーブルタグによって配置が決められつつ、fontタグなどによって装飾または文字サイズの内容が定義された情報を用いる。
【0049】
また、携帯用通信端末装置300は、例えば、図2及び図3に示すコンテンツデータD10を受信し、当該コンテンツデータD10をフルサイズで画像表示領域DAに表示すると、図4に示すように、後述する推薦情報リストLTとともにコンテンツCを表示することができるようになっている。
【0050】
一方、データベース100には、所定の形式によって推薦情報の候補となるべき関連情報(以下、「関連候補情報」または「推薦候補情報」ともいう。)毎に関連情報データD20が記憶されている。各関連情報データD20には、図5に示すように、関連情報を識別するための関連情報IDと、各関連情報のタイトル、テキストまたは画像などの内容データと、各関連情報の属性と、携帯用通信端末装置300が推薦情報を特定する際に用いる文書ベクトルと、が含まれる。なお、例えば、関連情報IDは、URLアドレスであってもよいし、URLアドレスとは別に付与されていてもよい。ただし、関連情報IDが、URLアドレスとは別に付与されている場合には、URLアドレスは各コンテンツデータD10に含まれる。
【0051】
特に、文書ベクトルは、各内容データ内のキーワードの出現頻度と各キーワードにおける一の関連情報内に出現する出現頻度を示すTF−IDF(Term Frequency − Inverse Document Frequency)の値を有している。キーワードは、内容データに対して形態素解析によって自動的に抽出されたもの、または、関連情報を提供する提供者またはシステム管理者に抽出されたものなど予め抽出されて登録されたものを用いる。例えば、内容データがテキストの場合には、テキストから抽出された1以上のキーワードが抽出され、内容データが画像データの場合には、当該画像データを説明するためのテキストの中から1以上のキーワードが抽出される。また、TF−IDFの値は、抽出された各キーワードのキーワードが含まれる関連情報内における出現頻度と他の関連情報データD20を含めた全ての関連情報におけるキーワードの出現頻度とに基づいて予め算出された値である。
【0052】
<サーバ装置>
次に、本実施形態のサーバ装置200について説明する。
【0053】
サーバ装置200は、主にCPU、ROM、RAM及びハードディスクによって構成され、携帯用通信端末装置300との間においてデータの授受を行うための通信機能、データベース100の管理、並びに、各コンテンツデータD10及び関連情報データD20の管理を行う。例えば、ROMには、各機能を実行するための制御情報が記録されるとともに、ハードディスクには、制御プログラムまたはOS(Operating System)などの各種プログラムが記録されている。また、CPUは、ハードディスクに記録されたプログラムを実行することにより、上述の各種の機能を実現し、RAMは、ワークエリアとして用いられる。特に、サーバ装置200は、通信機能としては、各携帯用通信端末装置300からのコンテンツデータD10または関連情報データD20の送信要求を受信した際に、当該携帯用通信端末装置300との通信回線を確立し、要求されたデータを携帯用通信端末装置300に送信するようになっている。
【0054】
<携帯用通信端末装置>
1.携帯用通信端末装置300の構成
次に、図6を用いて本実施形態の各携帯用通信端末装置300の構成について説明する。なお、図6は、本実施形態の各携帯用通信端末装置300の構成を示すブロック図である。
【0055】
各携帯用通信端末装置300は、例えば、電子書籍用読取再生装置(電子ブックリーダ)、ゲーム機、PDA(Personal Digital Assistants)、携帯用電話機または携帯タブレット型通信端末装置などの携帯可能な通信端末装置である。また、各携帯用通信端末装置300は、画像表示領域DAを有するとともに、リソースデータなどのコンテンツデータD10を読み込んで当該画像表示領域DAにコンテンツCを表示するためのブラウザ機能を有している。そして、各携帯用通信端末装置300は、各携帯用通信端末装置300が有する種々のハードウェアと協働し、コンテンツCとともに、ユーザにとって必要と想定される推薦されるべき関連情報を推薦情報として提供する推薦情報提供処理を実行するためのプログラム(以下、「推薦情報提供プログラム」という。)を実行する。特に、推薦情報提供プログラムによって実行される処理としては、
(1)画像表示領域DAに表示されたコンテンツCの表示範囲SAを認識する認識処理(以下、単に「認識処理」という。)、
(2)認識された表示範囲SA内に含まれている構成要素FEを特定する特定処理(以下、単に「特定処理」という。)、
(3)特定された構成要素FEに含まれているキーワードを抽出する抽出処理(以下、単に「抽出処理」という。)、
(4)抽出された各キーワードにおける特徴量を算出する特徴量算出処理、
(5)コンテンツCを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から抽出された各キーワードにおける特徴量を補正するための重み係数を算出する重み係数算出処理、
(6)抽出された各キーワードの特徴量を算出された重み係数で補正する補正処理(以下、単に「補正処理」という。)、
(7)関連情報データD20における各文書ベクトルをデータベース100から取得しつつ、補正された各キーワードの特徴量に基づいて一の検索式を生成し、生成した検索式と文書ベクトルに基づいて抽出された各キーワードの特徴量と各関連情報との類似度を算出する類似度算出処理、及び、
(8)算出された各類似度に基づいて該当する関連情報のリストを推薦情報リストLTとして画像表示領域DAに表示させてユーザに関連情報に関する情報を提供する提供処理の各処理が含まれる。
【0056】
具体的には、各携帯用通信端末装置300は、サーバ装置200及び他の携帯用通信端末装置300と通信を行う通信インターフェース301と、推薦情報提供処理における各処理を行うデータ処理部320と、所定の画像表示領域DAを有する表示部302と、表示部302における種々の描画を制御する描画制御部303と、を有している。また、各携帯用通信端末装置300は、ユーザの操作を入力するための操作部304と、全体を制御する端末管理制御部306と、推薦情報提供プログラムが記録されるとともに端末管理制御部306が各部材を制御するための制御プログラム及び当該制御プログラムが実行される際に用いられるメモリ機能を有するROM/RAM305と、を有している。そして、携帯用通信端末装置300は、例えば、電話機能及び電子メールなどのメール機能を有する場合には、マイク、スピーカ及び電子メールの送受信機能など種々の必要な部材を有している。さらに、上記の各部は、バスBによって互いに接続され、データの授受が実行される。
【0057】
なお、例えば、本実施形態の通信インターフェース301は、本発明の取得手段を構成し、表示部302は、本実施形態の表示手段を構成する。また、例えば、本実施形態の描画制御部303は、本発明の表示制御手段を構成し、データ処理部320は、特定手段、抽出手段、特徴量算出手段、重み係数算出手段、補正手段、類似度算出手段及び提供手段を構成する。
【0058】
通信インターフェース301は、データ処理部320の制御の下、ネットワークNに接続される基地局BSを介してサーバ装置200と通信回線を構築し、コンテンツデータD10または関連情報など種々のデータの授受を行う。
【0059】
データ処理部320は、推薦情報提供プログラムによって実行される推薦情報提供処理を実現するようになっている。例えば、データ処理部320は、ROM/RAM305に記録された推薦情報提供プログラムで携帯用通信端末装置300の各部を制御するための各種制御プログラムを実行しつつ、通信インターフェース301及び描画制御部303と連動して、または、制御して上述の各種の処理を実行する。
【0060】
具体的には、データ処理部320は、推薦情報提供プログラムを起動することによって、図6に示すように、表示範囲SAの認識処理を実行する認識処理部321、構成要素FEを特定する特定処理を実行する特定処理部322、キーワードを抽出する抽出処理を実行する抽出処理部323、特徴量算出処理を実行する特徴量算出処理部324、重み係数算出処理及び補正処理を実行する重み係数算出処理部325と、類似度算出処理を行う類似度算出処理部326と、提供処理を実行する提供処理部327と、を構築する。
【0061】
なお、例えば、本実施形態の認識処理部321は、本発明の認識手段を構成し、特定処理部322は、本発明の特定手段を構成する。また、本実施形態の抽出処理部323は、抽出手段を構成し、特徴量算出処理部324は、本発明の特徴量算出手段を構成する。さらに、本実施形態の重み係数算出処理部325は、重み係数算出手段及び補正手段を構成し、類似度算出処理部326は、類似度算出手段を構成する。そして、本実施形態の提供処理部327は、本発明の提供手段を構成する。
【0062】
表示部302は、所定のサイズの画像表示領域DAを有し、例えば、液晶素子またはEL(Electro Luminescence)素子のパネルによって構成され、描画制御部303において生成された表示データに基づいて所定の画像を表示するようになっている。特に、本実施形態では、表示部302は、推薦情報提供プログラムが実行されている際に、操作部304と連動しつつ、コンテンツデータD10に基づいてコンテンツCを表示するようになっている。
【0063】
描画制御部303は、端末管理制御部306の制御の下またはデータ処理部320の制御の下、表示部302に所定の画像を描画させるために必要な描画データを生成するようになっており、生成された描画データを当該表示部302に出力するようになっている。
【0064】
操作部304は、各種の確認ボタン、各操作指令を入力する操作ボタン、テンキーなどの多数のキー及び表示部302上に設けられたタッチセンサにより構成され、各操作を行う際に用いられるようになっている。具体的には、操作部304は、推薦情報提供プログラムの起動時に上述の各種の処理を実行するための操作を行う際に用いられるようになっている。
【0065】
端末管理制御部306は、主に中央演算処理装置(CPU)によって構成されるとともに、キー入力ポート、表示制御ポート等の各種入出力ポートを含み、携帯用通信端末装置300の全般的な機能及び推薦情報提供プログラムを実行するための全般的な機能を総括的に制御するようになっている。
【0066】
ROM/RAM305には、携帯用通信端末装置300として機能するための各種の制御プログラムが記録されているとともに、コンテンツCまたは関連情報を閲覧するためのブラウザ機能を含む推薦情報提供プログラムが記録されている。また、このROM/RAM305は、各種の処理が実行される際のワークエリアとして用いられる。
【0067】
2.データ処理部320の詳細
次に、図7〜図12の各図を用いて本実施形態のデータ処理部320における各部の構成及びその動作の詳細について説明する。なお、図7は、本実施形態の認識処理部321において認識される閲覧サイズ、閲覧領域基準座標Z及び拡大率を説明するための図であり、図8は、本実施形態の特定処理部322において特定される表示範囲SAを説明するための図である。また、図9は、本実施形態の抽出キーワードとその抽出キーワード情報の一例であり、図10は、本実施形態の重み係数算出処理部325において、キーワードの表示範囲SAの中心からの距離に基づく重み係数WCについて説明するための図である。さらに、図11は本実施形態の提供処理部327において、提供される推薦情報リストLTを説明するための図であり、図12は、本実施形態のコンテンツCにおける表示範囲SAの変更とそのときの提供処理部327における推薦情報リストLTを説明するための図である。
【0068】
認識処理部321は、コンテンツデータD10に基づいて画像表示領域DAにコンテンツCが閲覧可能に表示される毎に、表示されているコンテンツCにおける閲覧領域のサイズ(以下、「閲覧サイズ」という。)、閲覧領域の基準となる座標(以下、「閲覧領域基準座標」という。)Z及びフルサイズに対する拡大率(以下、単に「拡大率」という。)を認識して当該コンテンツCの表示範囲SAを認識するようになっている。具体的には、認識処理部321は、コンテンツCが閲覧可能に画像表示領域DAに表示される毎に、閲覧サイズとしてコンテンツCの表示されている部分の幅Wと高さHの検出、閲覧領域基準座標Zとして画像表示領域DAの左上隅におけるコンテンツC上の位置座標の検出及びフルサイズに対する拡大率の算出を実行して、閲覧サイズ、閲覧領域基準座標Z及び拡大率を認識する。
【0069】
例えば、認識処理部321は、図7(a)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにフルサイズのコンテンツCが表示されている場合には、閲覧サイズを幅(W):960、高さ(H)1200、閲覧領域基準座標Zを(X:0、Y:0)及び拡大率を100%として認識するようになっている。また、認識処理部321は、図7(b)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにコンテンツCの左隅の一部が表示されている場合には、閲覧サイズを幅(W):320、高さ(H)400、閲覧領域基準座標Zを(X:0、Y:400)及び拡大率を300%として認識するようになっている。なお、図6(a)及び(b)において、左図は、画像表示領域DAにされているコンテンツCを示し、右図は、フルサイズのコンテンツCを基準として表示されている表示範囲SAを示している。
【0070】
特定処理部322は、各構成要素データD30に含まれる要素基準座標(中心座標)Oに基づいて、認識処理部321によって認識されたコンテンツCの表示範囲SA内に含まれる構成要素FEを特定するようになっている。すなわち、特定処理部322は、表示範囲SA内に要素基準座標Oが含まれるか否かを判断し、表示範囲SA内に要素基準座標Oが含まれる場合には、その構成要素FEを画像表示領域DAに表示されている構成要素(以下、「特定構成要素」という。)と特定し、そうでなければ、その構成要素が画像表示領域DAに表示されていないと判断するようになっている。なお、本実施形態においては、要素基準座標Oが構成要素FEの中心座標であるため、構成要素FEの全ての画像またはテキストが表示範囲SAに含まれていない場合であっても、特定構成要素として特定される。
【0071】
例えば、図8(a)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにフルサイズのコンテンツCが表示されている場合には、全ての構成要素FEの要素基準座標Oは表示範囲SA内に含まれているので、特定処理部322は、全ての構成要素FEを特定構成要素と特定するようになっている。また、図8(b)に示すように、コンテンツデータD10に基づいて表示範囲SAとして画像表示領域DAにコンテンツCの左隅の一部が表示されている場合には、一部の構成要素FE、具体的には、第5構成要素FE5、第6構成要素FE6、第9構成要素FE9及び第10構成要素FE10の要素基準座標Oのみ表示範囲SA内に含まれているので、特定処理部322は、表示範囲SAに要素基準座標Oが含まれている各構成要素FEを特定構成要素と特定するようになっている。
【0072】
なお、本実施形態において、何れの構成要素FEの要素基準座標Oが表示範囲SAに含まれない場合には、表示範囲SAに最も近い要素基準座標Oを有する構成要素FEを特定構成要素に特定するようになっている。
【0073】
抽出処理部323は、各特定構成要素毎のキーワードをコンテンツデータD10から抽出するようになっている。そして、抽出処理部323は、コンテンツデータD10に含まれるキーワードデータD40と認識処理部321において認識された閲覧サイズ、閲覧領域基準座標Z及び拡大率に基づいて、各抽出されたキーワード(以下、「抽出キーワード」という。)に対して、キーワードID、キーワードが属する構成要素ID、キーワードのテキスト、キーワードにおけるフォント種別、キーワード基準座標P、キーワードの表示文字サイズ、キーワードにおけるスタイル(装飾)の種別の各種の抽出キーワードに関する情報(以下、「抽出キーワード情報」という。)D50を認識するようになっている。
【0074】
特に、抽出処理部323は、キーワードの表示文字サイズにおいては、各キーワードデータD40のフォント情報に示されたサイズに認識処理部321において認識された拡大率を乗算して算出するようになっている。
【0075】
例えば、図9(a)に示すように、コンテンツデータD10に基づいてコンテンツCの左隅の一部が表示範囲SAとして画像表示領域DAに表示されている場合には、図9(b)に示すように、第5構成要素FE5、第6構成要素FE6、第9構成要素FE9及び第10構成要素FE10の各構成要素FEにおいて、該当するキーワードデータD30から、「○×△」または「Webアプリ」などのテキストを抽出するとともに、それぞれのキーワードに対してキーワードID、構成要素ID、フォント種別、キーワード基準座標P、表示文字サイズ、スタイル(装飾)の種別を検出するようになっている。
【0076】
なお、抽出処理部323は、抽出されたキーワードに基づいて検出された各種の抽出キーワード情報は、ROM/RAM305のワークエリアに記憶するようになっている。
【0077】
特徴量算出処理部324は、抽出処理部323によって抽出された抽出キーワード情報に基づいて、各キーワードにおける出現頻度を示すTF−IDFの値を特徴量として算出するようになっている。特に、抽出処理部323は、特定構成要素を一の文書とみなし、特定構成要素毎に、抽出された全ての抽出キーワード情報(すなわち、各特定構成要素に含まれる全ての抽出キーワード情報)における出現頻度に対する各キーワードにおける出現頻度(具体的には「1」)の割合をTF−IDFの値として算出するようになっている。例えば、第5構成要素FE、第6構成要素FE、第9構成要素FE及び第10構成要素FEが特定構成要素であって、第5構成要素FEのキーワード「開発」についてTF−IDFを算出する場合には、当該キーワードの特徴量として、特定構成要素の全てにおける出現頻度が「2」であり、各キーワードにおける出現頻度「1」であるので、抽出処理部323は、TF−IDFを「0.5」と算出するようになっている。
【0078】
重み係数算出処理部325は、特定構成要素の各キーワード毎に、各キーワードの表示された状態における視認性を数値化した表示範囲SAの表示に関する重み係数を算出し、算出された重み係数を各キーワードの特徴量に乗算して、各キーワードの特徴量を補正するようになっている。
【0079】
一般的に、キーワードの各文字における表示文字サイズ若しくは装飾の差異または表示範囲SAに表示されたキーワードの当該表示範囲SAに対する位置の違いは、ユーザのキーワードに対する視認性に影響を与える。例えば、小さい文字より大きい文字で記載されていれば、キーワードそのものの注目度(興趣レベル)も高くなるとともに、ユーザにとっても文書の可読性が向上する。また、キーワードの各文字における太字、字体、斜体または色の差異は、ユーザにキーワードの識別力の差、または、文書における重要度の差を生じさせる。さらに、キーワードが表示範囲SAの中心にあれば、ユーザの注目度が高いものであることが想定されるとともに、表示範囲SAの周辺にあればユーザの注目度が低いことが想定される。そこで、本実施形態の重み係数算出処理部325は、キーワードにおける表示文字サイズ、装飾数及び表示範囲SAの中心からの距離によって特定構成要素のキーワード毎に各キーワードの表示された状態における視認性(可読性、注目度、識別度及び重要度)を数値化し、キーワードの特徴量を補正するようになっている。
【0080】
具体的には、キーワードの各文字における表示文字サイズが大きくなれば、ユーザにおける注目度及び可読性が向上する。したがって、重み係数算出処理部325は、(式1)に示すように、抽出された全てのキーワードにおける表示文字サイズの平均に対する各抽出キーワードの表示文字サイズ(以下、「対象表示文字サイズ」ともいう。)の割合を各抽出キーワードの重み係数WAとして算出するようになっている。なお、(式1)における「α」は、予め定められた定数である。また、表示文字サイズが大きいほど、重み係数WAの値は大きくなる。ただし、表示文字サイズが大きすぎる場合には、または、小さすぎる場合には、キーワードを視認することが困難になるので、対象の表示文字サイズが所定の値以下または所定の値以上の場合には、WAは「0」として取り扱っても良い。
【0081】
【数1】
【0082】
また、キーワードの各文字における装飾数が多くなれば、キーワードの識別力及び重要度が高くなり、かつ、特徴点としてのユーザの興趣性も向上していると想定される。したがって、重み係数算出処理部325は、(式2)に示すように、抽出された全てのキーワードにおける文字装飾数の平均に対する各抽出キーワードの文字装飾数(以下、「対象文字装飾数」ともいう。)の割合を各抽出キーワードの重み係数WBとして算出するようになっている。なお、(式2)における「β」は、予め定められた定数である。また、装飾数が多いほど、重み係数WBは大きな値となる。
【0083】
【数2】
【0084】
さらに、キーワードのコンテンツCにおける表示範囲SAの中心からの距離が遠くなれば、注目度や視認性も低下して特徴点としてのユーザの興趣性も低下していると想定し、重み係数算出処理部325は、(式3)に示すように、認識処理部321において認識された閲覧領域基準座標Z並びに閲覧領域サイズW及びHと抽出処理部323において抽出された抽出キーワード情報に含まれるキーワード基準座標Pに基づいて表示範囲SAの中心座標COを算出するようになっている。そして、重み係数算出処理部325は、当該中心座標COから各抽出キーワードの座標までの表示距離(以下、「相対表示距離」ともいう。)(Li)を算出するとともに、抽出された全てのキーワードにおける表示距離の平均(以下、「平均相対表示距離」ともいう。)(Lav)に対する各抽出キーワードの相対表示距離(Li)の割合を各抽出キーワードの重み係数WCとして算出するようになっている。なお、(式3)における「γ」は、予め定められた定数である。また、キーワードの距離Liが近いほど、重み係数WCは大きくなる。
【0085】
【数3】
【0086】
例えば、図10の示すように、コンテンツデータD10に基づいてコンテンツCの左隅の一部が表示範囲SAとして画像表示領域DAに表示されている場合には、中心座標COに対してキーワード「×○△」の座標までの相対表示距離Liとなり、各キーワード基準座標Pの中心座標COからの距離の平均(平均相対距離Lav)に対するキーワード「×○△」の座標までの相対表示距離Liの割合を重み係数WCと算出するようになっている。
【0087】
補正処理部は、重み係数算出処理部325において算出された各キーワード毎の重み係数WA、WB及びWCを該当する各キーワードの特徴量、すなわち、TF−IDFの値にそれぞれ乗算するようになっている。
【0088】
類似度算出部326は、通信インターフェース301を介してデータベース100から関連情報データD20における各文書ベクトル(式4)を取得するとともに、補正された各キーワードの特徴量に基づいて各特定構成要素の各キーワードにおける補正された特徴量を合計して一の検索式(式5)を生成するようになっている。そして、類似度算出部326は、表示範囲SA内に含まれているコンテンツCと各関連情報との類似度として、(式4)を用いて生成したベクトル検索式(Q)と取得した文書ベクトル(Dj)を比較してベクトル空間モデルを用いて検索式と各関連情報との類似度(sim)を算出するようになっている。
【0089】
【数4】
【0090】
【数5】
【0091】
【数6】
【0092】
なお、(式4)〜(式6)においては、Key1〜Keymは、キーワードのテキストを示し、q1〜qmは、補正されたTF−IDFの値を示す。また、Wj1〜Wjmは、各関連情報における各キーワードのTF−IDFの値である。
【0093】
提供処理部327は、描画制御部303及び表示部302を直接的にまたは間接的に制御し、算出された各類似度における上位の関連情報のリストを推薦情報リストLTとして画像表示領域DAに表示させてユーザに閲覧可能に提供するようになっている。具体的には、提供処理部327は、算出された各類似度の上位3位までの関連情報を特定し、描画制御部303及び表示部302を制御して、特定した関連情報のIDをリストLTにして画像表示領域DAに表示するようになっている。例えば、図11(a)に示すように、コンテンツデータD10に基づいてコンテンツCの左隅の一部が表示範囲SAとして画像表示領域DAに表示されている場合には、図11(b)に示すように、類似度の高い上位3位までの関連情報の関連情報ID「item004」、「item005」及び「item006」を推薦情報リストLTとして画像表示領域DAに表示させるようになっている。
【0094】
なお、データ処理部320の各部は、上記の各処理を表示されるコンテンツCの表示範囲SAが変更される毎に実行され、当該コンテンツCの表示範囲SAが変更される毎に類似度の高い関連情報のIDを推薦情報リストLTとして画像表示領域DAに表示するようになっている。例えば、図12(a)に示すように、コンテンツCがフルサイズで表示されているとともに、関連情報のID「item001」、「item002」及び「item003」が推薦情報リストLTとして表示されている場合に、図12(b)に示すように、コンテンツCの左隅の一部を表示範囲SAとして画像表示領域DAに表示するための指定操作を行うと、図12(c)に示すように、指定された表示範囲SAが画像表示領域DAに表示されるとともに、上記の各処理が実行されて、関連情報のID「item004」、「item005」及び「item006」が推薦情報リストLTとして再表示されるようになっている。
【0095】
<推薦情報提供処理>
次に、図13を用いて本実施形態の携帯用通信端末装置300における推薦情報提供処理の動作について説明する。なお、図13は、本実施形態の携帯用通信端末装置300における推薦情報提供処理の動作を示すフローチャートである。
【0096】
なお、本動作においては、サーバ装置200は、携帯用通信端末装置300の指示に基づいてデータベース100を制御しつつ、当該携帯用通信端末装置300にコンテンツデータD10及び各関連情報における文書ベクトルを適宜送信する。また、データベース100には、キーワードデータD40を含めて複数のコンテンツデータD10が記憶されているとともに、各関連情報においても既に文書ベクトルが生成されて記憶されているものとする。
【0097】
まず、端末管理制御部306が、操作部304に入力されたコンテンツデータD10の閲覧に関するユーザ指示を検出すると(ステップS101)、コンテンツデータD10をデータベース100から取得するかまたは既に取得したコンテンツデータD10の表示範囲SAの変更かを判断する(ステップS102)。
【0098】
このとき、端末管理制御部306は、既に取得してあるコンテンツデータD10に基づく表示範囲SAの変更であると判断した場合(ステップS102:No)には、ステップS104の処理に移行する。一方、端末管理制御部306は、コンテンツデータD10をデータベース100から取得すると判断した場合(ステップS102:Yes)には、URLアドレスなどの閲覧すべきコンテンツCのアドレスを取得し、通信インターフェース301に、サーバ装置200の制御の下、コンテンツCのアドレスに基づいてデータベース100からコンテンツデータD10を取得させ、ROM/RAM305のワークエリアに記憶する(ステップS103)。
【0099】
次いで、描画制御部303は、初期設定によって予め定められた表示範囲SAまたは指示された表示範囲SAと、ROM/RAM305に記憶されているコンテンツデータD10とに基づいて、表示部302の画像表示領域DAにコンテンツCを表示させる(ステップS104)。なお、表示範囲SAの初期値はフルサイズとなっているので、描画制御部303は、コンテンツCを最初に表示する際には、フルサイズによってコンテンツCを表示する。
【0100】
次いで、認識処理部321は、表示されているコンテンツCの閲覧サイズ、閲覧領域基準座標Z及び拡大率を認識して当該コンテンツCの表示範囲SAを認識するとともに、特定処理部322は、各構成要素データD30に含まれる要素基準座標Oに基づいて、認識された表示範囲SA内に含まれる特定構成要素を特定する(ステップS105)。
【0101】
次いで、抽出処理部323は、コンテンツデータD10含まれるキーワードデータD40に基づいて、特定構成要素毎のキーワードを抽出キーワードとして、各種の抽出キーワード情報とともに抽出する(ステップS106)。抽出キーワード情報には、キーワードID、キーワードが属する構成要素ID、キーワードのテキスト、キーワードにおけるフォント種別、キーワード基準座標P、キーワードの表示文字サイズ、キーワードにおけるスタイル(装飾)の種別が含まれる。
【0102】
次いで、特徴量算出処理部324は、特定構成要素を一の文書とみなし、特定構成要素毎に、抽出処理部323によって抽出された抽出キーワード情報に基づいて、各抽出キーワードにおける特徴量を算出する(ステップS107)。具体的には、特徴量算出処理部324は、特定構成要素毎に、抽出処理部323によって抽出された抽出キーワード情報に基づいて、各キーワードにおける出現頻度を示すTF−IDFの値を特徴量として算出する。
【0103】
次いで、重み係数算出処理部325は、特定構成要素の各キーワード毎に、各キーワードの表示された状態における上記の視認性を数値化した表示範囲SAの表示に関する重み係数WA、WB及びWCを算出し、算出された重み係数を各抽出キーワードの特徴量に乗算して、各抽出キーワードの特徴量を補正する(ステップS108)。
【0104】
次いで、類似度算出部326は、サーバ装置200の制御の下、通信インターフェース301を介してデータベース100から関連情報データD20における各文書ベクトルを取得するとともに、補正された各キーワードの特徴量に基づいて各特定構成要素の各キーワードにおける補正された特徴量を合計して一の検索式を生成する(ステップS109)。
【0105】
次いで、類似度算出部326は、表示範囲SA内に含まれているコンテンツCと各関連情報との類似度として、生成した検索式と取得した文書ベクトルを比較して検索式と各関連情報との類似度を算出する(ステップS110)。
【0106】
次いで、提供処理部327は、算出された各類似度における上位(例えば3位まで)の関連情報のリストを推薦情報リストLTとして画像表示領域DAに表示させてユーザに閲覧可能に提供して(ステップS111)本動作を終了する。具体的には、提供処理部327は、算出された各類似度の上位3位までの関連情報を特定し、特定した関連情報のIDを推薦情報リストLTにして画像表示領域DAに表示する。
【0107】
<作用効果>
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、抽出された各抽出キーワードにおける表示文字サイズ、文字装飾数または当該表示範囲SA内の位置に基づいて重み係数を算出し、当該算出された重み係数に基づいて各抽出キーワードの特徴量を補正することができるので、ユーザに推薦すべき関連情報との類似度を算出する際に用いる各抽出キーワードの特徴量に対して、コンテンツCを閲覧しているユーザの視認性及び当該視認性に基づく興趣性の観点から補正を行うことができる。したがって、携帯用通信端末装置300は、ユーザの視認性及び当該視認性に基づく興趣性を考慮して関連情報を判別してユーザに提供することができるとともに、ユーザが興味のあると想定される関連情報を的確に提供すること、及び、それにより提供されたコンテンツの閲覧数を向上させることができる。
【0108】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、抽出された全ての抽出キーワードにおける文字サイズの平均に対する各抽出キーワードの文字サイズの割合を各抽出キーワードの重み係数として算出することができるとともに、前記抽出された全ての抽出キーワードにおける文字装飾数の平均に対する各キーワードの文字装飾数の割合を各抽出キーワードの重み係数として算出することができる。したがって、本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、表示範囲SA内に含まれるキーワードの視認性及び視覚誘引性を数値化し、当該数値化された視認性及び視覚誘引性に基づいて各キーワードの特徴量を補正することができるので、ユーザが閲覧している表示範囲SAに含まれるコンテンツCの内容をキーワードの特徴量によって的確に把握することができる。
【0109】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、算出された各相対表示距離のうち最大値の相対表示距離に対する各抽出キーワードの相対表示距離の割合を各抽出キーワードの重み係数として算出することができるので、表示範囲SA内に含まれるキーワードの配置性を数値化してユーザにおける興趣レベルを把握することができるとともに、ユーザが閲覧している表示範囲SAに含まれるコンテンツCの内容をキーワードの特徴量によって的確に把握することができる。
【0110】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、コンテンツデータD10に含まれたキーワードデータD40に基づいて重み係数を算出するので、キーワードデータD40を個々に算出する場合に比べて、類似度の算出処理に対する負荷を軽減することができるとともに、短時間によって類似度を算出することができるので、ユーザにストレスを与えずに、コンテンツCを表示させることができる。
【0111】
本実施形態の携帯用通信端末装置300及び情報閲覧システムSは、補正された各キーワードの特徴量に基づいて一の検索式を生成し、当該生成した検索式に基づいて表示範囲SA内に含まれているコンテンツCと各関連情報との類似度を算出することができるので、関連情報と表示範囲SAに含まれるコンテンツCとの類似度を簡易にかつ的確に類似度を算出することができる。
【0112】
<変形例>
本実施形態においては、コンテンツデータD10及び関連情報データD20をサーバ装置200から取得するようになっているが、携帯電話機に装着されたフラッシュメモリ、DVDまたはハードディスなどの外部記憶媒体、または、内部に設けられたハードディスクなどの内部記憶媒体から読み出して取得してもよい。
【0113】
また、本実施形態の例では、タイプや内容が異なる文または文の纏まりから構成される文書を表示部302に表示させてユーザに閲覧させているが、タイプや内容が異なる複数の画像、画像と文または画像と文の纏まりから構成されるコンテンツCを表示部302に表示させてユーザに閲覧させるようにしてもよい。この場合には、キーワードとしては、画像を説明するための文など画像の構成要素データD30が有するテキストデータを用いる。
【0114】
また、本実施形態においては、関連情報及び特定構成要素に含まれる各キーワードの特徴量に、各キーワードの出現頻度を示すTF−IDFを用いているが、単にキーワードの出現頻度の回数をカウントし当該カウント数を特徴量に用いるなど、関連情報及び特定構成要素内における各キーワードの特徴量を算出することができるものであればよい。
【0115】
また、本実施形態においては、該当する関連情報のリストを選択表示可能に画像表示領域DAに表示することによって関連情報に関する情報を提供するようになっているが、当該リストLTに代えて関連情報そのものを画像表示領域DAに表示して直接提供してもよいし、例えば、予め特定された電子メールアドレスにデータとして送信し、または、予め定められたURLにアクセスすることによってWebページを介して閲覧可能に関連情報または関連情報に関する情報を間接的に提供するようにしてもよい。
【0116】
また、本実施形態では、携帯用通信端末装置300において、構成要素FEを特定する特定処理、キーワードを抽出する抽出処理、特徴量算出処理、重み係数算出処理、補正処理、類似度算出処理及び提供処理が実行されているが、携帯用通信端末装置300またはサーバ装置200の何れかによって各種の処理が行われてもよい。この場合には、サーバ装置200と携帯用通信端末装置300との逐次的な通信によって必要なデータ授受することができるようになっている。また、このように各種のデータ処理をサーバ装置200によって行うことができれば、上述の実施形態と同様な処理を行うことができるとともに、携帯用通信端末装置300の処理負担を軽減することができる。
【産業上の利用可能性】
【0117】
本発明の情報閲覧システムSは、インターネットなどのネットワークNを用いて新聞、雑誌、書籍または論文などの情報を閲覧するシステムに適用することができる。
【符号の説明】
【0118】
B … バス
C … コンテンツ
S … 情報閲覧システム
DA … 画像表示領域
FE … 構成要素
LT … 推薦情報リスト
SA … 表示範囲
WA、WB、WC … 重み係数
100 … データベース
200 … サーバ装置
300 … 携帯用通信端末装置
301 … 通信インターフェース
302 … 表示部
303 … 描画制御部
304 … 操作部
306 … 端末管理制御部
320 … データ処理部
321 … 認識処理部
322 … 特定処理部
323 … 抽出処理部
324 … 特徴量算出処理部
325 … 重み係数算出処理部
326 … 類似度算出処理部
327 … 提供処理部
【特許請求の範囲】
【請求項1】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧端末装置であって、
コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段と、
所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、
ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、
前記表示範囲内に含まれている前記構成要素を特定する特定手段と、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、
各抽出キーワードの特徴量を算出する特徴量算出手段と、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、
前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段と、
を備えることを特徴とする情報閲覧端末装置。
【請求項2】
請求項1に記載の情報閲覧端末装置において、
前記重み付け係数算出手段が、前記表示文字サイズに基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字サイズの平均に対する各抽出キーワードの文字サイズの割合を各抽出キーワードの重み係数として算出する、情報閲覧端末装置。
【請求項3】
請求項1に記載の情報閲覧端末装置において、
前記重み付け係数算出手段が、前記文字装飾数に基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字装飾数の平均に対する各キーワードの文字装飾数の割合を各抽出キーワードの重み係数として算出する、情報閲覧端末装置。
【請求項4】
請求項1に記載の情報閲覧端末装置において、
前記重み付け係数算出手段が、前記表示範囲内の位置に基づく重み係数を算出する際には、前記表示範囲の中心座標から各抽出キーワードの座標までの距離を相対表示距離として算出するとともに、各抽出キーワードの相対表示距離に対する前記抽出された全ての抽出キーワードにおける算出された各相対表示距離の平均を示す平均相対表示距離の割合を各抽出キーワードの重み係数として算出する、情報閲覧端末装置。
【請求項5】
請求項2乃至4の何れか一項に記載の情報閲覧端末装置において、
コンテンツデータには、構成要素毎に、各構成要素に含まれるキーワードのデータがキーワードデータとして含まれるとともに、
前記重み係数算出手段が、各抽出キーワードの該当するキーワードデータから前記表示文字サイズの情報、前記文字装飾に関する情報または基準位置座標の情報における該当する情報を取得し、当該取得した情報に基づいて各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する、情報閲覧端末装置。
【請求項6】
請求項1乃至5の何れか一項に記載の情報閲覧端末装置において、
前記類似度算出手段が、前記補正された各抽出キーワードの特徴量に基づいて検索式を生成し、当該生成した検索式に基づいて前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する、情報閲覧端末装置。
【請求項7】
請求項6に記載の情報閲覧端末装置において、
前記類似度算出手段が、同一の各抽出キーワードにおける特徴量を合算し、前記検索式として抽出キーワードとその特徴量とから構成されるベクトル空間モデルを生成するとともに、当該生成したベクトルと、前記関連情報に属する各キーワードとその特徴量から構成される前記関連情報に関するデータとしてのベクトルと、を比較し、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する、情報閲覧端末装置。
【請求項8】
請求項1乃至5の何れか一項に記載の情報閲覧端末装置において、
前記特徴量算出手段が、前記抽出された各抽出キーワードの前記特定された構成要素内における出現頻度及び当該各抽出キーワードにおけるコンテンツ内における出現頻度に基づいて各抽出キーワードの特徴量を算出する、情報閲覧端末装置。
【請求項9】
請求項1乃至8の何れか一項に記載の情報閲覧端末装置において、
携帯可能に形成されている、情報閲覧端末装置。
【請求項10】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、
請求項1〜9に記載の情報閲覧端末装置と、
前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報に関するデータ群が記憶されているデータベースと、
を備えることを特徴とする情報閲覧システム。
【請求項11】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、
前記コンテンツと前記関連情報をユーザに閲覧させるための情報閲覧端末装置と、
前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報の候補として前記関連情報に関するデータ群が記憶されているデータベースと、
前記データベースを管理するサーバ装置と、
を備え、
前記情報閲覧端末装置が、
前記サーバ装置から送信されたコンテンツデータを受信する受信手段と、
所定の画像表示領域を有し、前記受信したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、
ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、
前記表示範囲内に含まれている前記構成要素を特定する特定手段と、
を有するとともに、
前記サーバ装置または前記情報閲覧端末装置の何れか一方に、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、
各抽出キーワードの特徴量を算出する特徴量算出手段と、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、
を有し、
前記携帯用通信端末装置が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供することを特徴とする情報閲覧システム。
【請求項12】
所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段を有する情報閲覧端末装置用のコンピュータで実行されるプログラムにおいて、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧プログラムであって、
前記コンピュータを、
コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段、
ユーザの操作及び前記コンテンツデータに基づいて画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段、
前記表示範囲内に含まれている前記構成要素を特定する特定手段、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段、
各抽出キーワードの特徴量を算出する特徴量算出手段、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段、及び、
前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段、
として機能させることを特徴とする情報閲覧プログラム。
【請求項13】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧方法であって、
前記コンピュータを、
コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得工程と、
情報閲覧端末装置の表示手段に設けられた所定の画像表示領域に、前記取得したコンテンツデータ及びユーザの操作に基づいて表示されるコンテンツの表示範囲を認識する認識工程と、
前記表示範囲内に含まれている前記構成要素を特定する特定工程と、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出工程と、
各抽出キーワードの特徴量を算出する特徴量算出工程と、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出工程と、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正工程と、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出工程と、
前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供工程と、
を含むことを特徴とする情報閲覧方法。
【請求項1】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧端末装置であって、
コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段と、
所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、
ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、
前記表示範囲内に含まれている前記構成要素を特定する特定手段と、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、
各抽出キーワードの特徴量を算出する特徴量算出手段と、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、
前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段と、
を備えることを特徴とする情報閲覧端末装置。
【請求項2】
請求項1に記載の情報閲覧端末装置において、
前記重み付け係数算出手段が、前記表示文字サイズに基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字サイズの平均に対する各抽出キーワードの文字サイズの割合を各抽出キーワードの重み係数として算出する、情報閲覧端末装置。
【請求項3】
請求項1に記載の情報閲覧端末装置において、
前記重み付け係数算出手段が、前記文字装飾数に基づく重み係数を算出する際には、前記抽出された全ての抽出キーワードにおける文字装飾数の平均に対する各キーワードの文字装飾数の割合を各抽出キーワードの重み係数として算出する、情報閲覧端末装置。
【請求項4】
請求項1に記載の情報閲覧端末装置において、
前記重み付け係数算出手段が、前記表示範囲内の位置に基づく重み係数を算出する際には、前記表示範囲の中心座標から各抽出キーワードの座標までの距離を相対表示距離として算出するとともに、各抽出キーワードの相対表示距離に対する前記抽出された全ての抽出キーワードにおける算出された各相対表示距離の平均を示す平均相対表示距離の割合を各抽出キーワードの重み係数として算出する、情報閲覧端末装置。
【請求項5】
請求項2乃至4の何れか一項に記載の情報閲覧端末装置において、
コンテンツデータには、構成要素毎に、各構成要素に含まれるキーワードのデータがキーワードデータとして含まれるとともに、
前記重み係数算出手段が、各抽出キーワードの該当するキーワードデータから前記表示文字サイズの情報、前記文字装飾に関する情報または基準位置座標の情報における該当する情報を取得し、当該取得した情報に基づいて各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する、情報閲覧端末装置。
【請求項6】
請求項1乃至5の何れか一項に記載の情報閲覧端末装置において、
前記類似度算出手段が、前記補正された各抽出キーワードの特徴量に基づいて検索式を生成し、当該生成した検索式に基づいて前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する、情報閲覧端末装置。
【請求項7】
請求項6に記載の情報閲覧端末装置において、
前記類似度算出手段が、同一の各抽出キーワードにおける特徴量を合算し、前記検索式として抽出キーワードとその特徴量とから構成されるベクトル空間モデルを生成するとともに、当該生成したベクトルと、前記関連情報に属する各キーワードとその特徴量から構成される前記関連情報に関するデータとしてのベクトルと、を比較し、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する、情報閲覧端末装置。
【請求項8】
請求項1乃至5の何れか一項に記載の情報閲覧端末装置において、
前記特徴量算出手段が、前記抽出された各抽出キーワードの前記特定された構成要素内における出現頻度及び当該各抽出キーワードにおけるコンテンツ内における出現頻度に基づいて各抽出キーワードの特徴量を算出する、情報閲覧端末装置。
【請求項9】
請求項1乃至8の何れか一項に記載の情報閲覧端末装置において、
携帯可能に形成されている、情報閲覧端末装置。
【請求項10】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、
請求項1〜9に記載の情報閲覧端末装置と、
前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報に関するデータ群が記憶されているデータベースと、
を備えることを特徴とする情報閲覧システム。
【請求項11】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧システムであって、
前記コンテンツと前記関連情報をユーザに閲覧させるための情報閲覧端末装置と、
前記情報閲覧端末装置によって前記コンテンツをユーザに閲覧させるためのコンテンツデータ及び前記関連情報の候補として前記関連情報に関するデータ群が記憶されているデータベースと、
前記データベースを管理するサーバ装置と、
を備え、
前記情報閲覧端末装置が、
前記サーバ装置から送信されたコンテンツデータを受信する受信手段と、
所定の画像表示領域を有し、前記受信したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段と、
ユーザの操作及び前記コンテンツデータに基づいて前記画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段と、
前記表示範囲内に含まれている前記構成要素を特定する特定手段と、
を有するとともに、
前記サーバ装置または前記情報閲覧端末装置の何れか一方に、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段と、
各抽出キーワードの特徴量を算出する特徴量算出手段と、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段と、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段と、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段と、
を有し、
前記携帯用通信端末装置が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供することを特徴とする情報閲覧システム。
【請求項12】
所定の画像表示領域を有し、前記取得したコンテンツデータに基づいて前記コンテンツを当該画像表示領域に表示する表示手段を有する情報閲覧端末装置用のコンピュータで実行されるプログラムにおいて、複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧プログラムであって、
前記コンピュータを、
コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得手段、
ユーザの操作及び前記コンテンツデータに基づいて画像表示領域に表示されるコンテンツの表示範囲を制御する表示制御手段、
前記表示範囲内に含まれている前記構成要素を特定する特定手段、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出手段、
各抽出キーワードの特徴量を算出する特徴量算出手段、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出手段、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正手段、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出手段、及び、
前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供手段、
として機能させることを特徴とする情報閲覧プログラム。
【請求項13】
複数の構成要素を有するコンテンツと当該コンテンツに関連する関連情報をユーザに閲覧させるための情報閲覧方法であって、
前記コンピュータを、
コンテンツデータ及び関連情報に関するデータを他の通信装置または記録媒体から取得する取得工程と、
情報閲覧端末装置の表示手段に設けられた所定の画像表示領域に、前記取得したコンテンツデータ及びユーザの操作に基づいて表示されるコンテンツの表示範囲を認識する認識工程と、
前記表示範囲内に含まれている前記構成要素を特定する特定工程と、
前記特定された構成要素に含まれたキーワードを抽出キーワードとして抽出する抽出工程と、
各抽出キーワードの特徴量を算出する特徴量算出工程と、
各抽出キーワードにおける前記表示範囲に表示されている際の表示文字サイズ、文字装飾数または当該表示範囲内の位置の少なくとも何れか一方に基づいて、各抽出キーワードにおける前記表示範囲の表示に関する重み係数を算出する重み係数算出工程と、
前記算出された各抽出キーワードに関する重み係数を用いて該当する各抽出キーワードの特徴量を補正する補正工程と、
前記補正された各抽出キーワードの特徴量と前記取得した関連情報に関するデータとに基づいて、前記表示範囲内に含まれているコンテンツと各関連情報との類似度を算出する類似度算出工程と、
前記表示制御手段が、前記算出された類似度に基づいて該当する関連情報または該当する関連情報に関する情報を前記ユーザに提供する提供工程と、
を含むことを特徴とする情報閲覧方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2012−22365(P2012−22365A)
【公開日】平成24年2月2日(2012.2.2)
【国際特許分類】
【出願番号】特願2010−157618(P2010−157618)
【出願日】平成22年7月12日(2010.7.12)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
【公開日】平成24年2月2日(2012.2.2)
【国際特許分類】
【出願日】平成22年7月12日(2010.7.12)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
[ Back to top ]