説明

コンテンツ検索装置、コンテンツ検索プログラム及びコンテンツ検索方法

【課題】ユーザが真に欲する情報を容易に得ることができるようにすることを目的とする。
【解決手段】キーワード入力部はユーザに検索用のキーワードを入力させる。第1コンテンツ検索部はキーワード入力部が入力させたキーワードに基づきコンテンツを検索する。第1単語抽出部は第1コンテンツ検索部が検索したコンテンツから複数の単語を抽出する。頻出順位算出部は第1単語抽出部が抽出した複数の単語それぞれの頻出度を計算して、単語の頻出度の順位を算出する。第2コンテンツ検索部は頻出順位算出部が算出した順位の上位所定の順位までの単語に基づきコンテンツを検索する。リンク表示部は第2コンテンツ検索部が検索したコンテンツへのリンクを表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、インターネット検索等における検索技術に関する。
【背景技術】
【0002】
インターネットには多数の情報を提供するサイトが存在する。そして、各サイトには多量の情報が存在する。インターネットに存在する膨大な情報の中からユーザが欲する情報を得るためには、いわゆるインターネット検索を使用するのが一般的である。インターネット検索においては、全文検索型(ロボット型)とディレクトリ型の検索エンジンがある。いずれの検索エンジンでもユーザが入力したキーワードに基づいて、インターネットで公開されている情報を検索して、その情報へのリンクの表示等する。ディレクトリ型の検索エンジンでは、エディタ等と呼ばれる人により登録されたサイトの情報のみが検索される。つまり、ディレクトリ型の検索エンジンでは、検索されるサイトには一定の制限がかけられている。しかし、いずれの検索エンジンにおいても、検索処理は入力されたキーワードを含むサイトや、キーワードに関連付けされて登録されたサイトを抽出するものである。
【特許文献1】特開2002−183541号公報
【特許文献2】特開2002−092025号公報
【特許文献3】特開2002−245061号公報
【特許文献4】特開平10−285484号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
従来のインターネット検索では、ユーザは必要な情報を抽出するためには適切なキーワードを選択して検索を行う必要がある。しかし、いかに適切なキーワードを選択しても不要な情報が多く検索されてしまい、インターネットに存在する膨大な情報からユーザが真に欲する情報が抽出することは非常に困難である。
本発明は、例えば、ユーザが真に欲する情報を容易に得ることができるようにすることを目的とする。
【課題を解決するための手段】
【0004】
本発明に係るコンテンツ検索装置は、例えば、ユーザに検索用のキーワードを入力装置により入力させるキーワード入力部と、
上記キーワード入力部が入力させたキーワードに基づきコンテンツを処理装置により検索する第1コンテンツ検索部と、
上記第1コンテンツ検索部が検索したコンテンツから複数の単語を抽出して記憶装置に記憶する第1単語抽出部と、
上記第1単語抽出部が抽出した複数の単語それぞれの頻出度を処理装置により計算して、単語の頻出度の順位を処理装置により算出する頻出順位算出部と、
上記頻出順位算出部が算出した順位の上位所定の順位までの単語に基づきコンテンツを処理装置により検索する第2コンテンツ検索部と
を備えることを特徴とする。
【0005】
上記コンテンツ検索装置は、さらに、
所定の期間に上記第1単語抽出部が抽出した単語を処理装置により集計する集計処理部を備え、
上記頻出順位算出部は、上記集計処理部が集計した結果に基づき、上記所定の期間における単語の頻出度の順位を算出し、
上記第2コンテンツ検索部は、上記所定の期間における順位の上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする。
【0006】
上記集計処理部は、所定の期間毎に上記第1単語抽出部が抽出した単語を集計し、
上記頻出順位算出部は、上記所定の期間毎に単語の頻出度の順位を算出し、
上記第2コンテンツ検索部は、ユーザがキーワードを入力した時点が含まれる期間の順位に基づきコンテンツを検索する
ことを特徴とする。
【0007】
上記集計処理部は、ユーザを所定の範囲に特定する特定情報毎に集計する
ことを特徴とする。
【0008】
上記コンテンツ検索装置は、さらに、
所定の規則に基づき選択された単語である限定用単語を記憶装置に記憶する限定用単語記憶部と、
上記第1単語抽出部が抽出した単語から上記限定用単語記憶部が記憶した限定用単語と一致する単語を処理装置により抽出することで単語を限定する単語限定部とを備え、
上記第2コンテンツ検索部は、上記単語限定部が限定した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする。
【0009】
上記限定用単語記憶部は、ユーザを所定の範囲に特定する特定情報毎に限定用単語を記憶する
ことを特徴とする。
【0010】
上記限定用単語記憶部は、上記キーワード入力部が入力させたキーワード毎に限定用単語を記憶する
ことを特徴とする。
【0011】
上記限定用単語記憶部は、上記第1単語抽出部が抽出した単語の内、上記限定用単語として記憶していない単語で、上記頻出順位算出部が算出した順位が高い単語を新たに限定用単語として記憶する
ことを特徴とする。
【0012】
上記コンテンツ検索装置は、さらに、
所定の規則に基づき選択された単語である追加用単語を記憶装置に記憶する追加用単語記憶部と、
上記第1単語抽出部が抽出した単語と上記追加用単語記憶部が記憶した追加用単語とを比較して、追加用単語にのみ存在する単語を所定の順位として上記第1単語抽出部が抽出した単語に追加する単語追加部とを備え、
上記第2コンテンツ検索部は、上記単語追加部が追加した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする。
【0013】
上記追加用単語記憶部は、ユーザを所定の範囲に特定する特定情報毎に追加用単語を記憶する
ことを特徴とする。
【0014】
上記追加用単語記憶部は、上記キーワード入力部が入力させたキーワード毎に追加用単語を記憶する
ことを特徴とする。
【0015】
上記追加用単語記憶部は、上記第1単語抽出部が抽出した単語の内、上記追加用単語として記憶していない単語で、上記頻出順位算出部が算出した順位が高い単語を新たに追加用単語として記憶する
ことを特徴とする。
【0016】
上記コンテンツ検索装置は、さらに、
上記第2コンテンツ検索部が検索したコンテンツへのリンクを表示装置に表示するリンク表示部
を備えることを特徴とする。
【0017】
上記リンク表示部は、上記第2コンテンツ検索部が検索したコンテンツの中で、上位に検索されたコンテンツへのリンクを表示する
ことを特徴とする。
【0018】
上記コンテンツ検索装置は、さらに、
上記第2コンテンツ検索部が検索したコンテンツの中で、上記所定の期間にヒット率が高かったコンテンツへのリンクを表示装置に表示するリンク表示部
を備えることを特徴とする。
【0019】
上記コンテンツ検索装置は、さらに、
上記第2コンテンツ検索部が検索したコンテンツから所定の条件で単語を抽出する第2単語抽出部と、
上記第2単語抽出部が抽出した単語を表示装置に表示する単語表示部と
を備えることを特徴とする。
【0020】
本発明に係るコンテンツ検索プログラムは、例えば、ユーザに検索用のキーワードを入力装置により入力させるキーワード入力処理と、
上記キーワード入力処理で入力させたキーワードに基づきコンテンツを処理装置により検索する第1コンテンツ検索処理と、
上記第1コンテンツ検索処理で検索したコンテンツから複数の単語を抽出して記憶装置に記憶する第1単語抽出処理と、
上記第1単語抽出処理で抽出した複数の単語それぞれの頻出度を処理装置により計算して、単語の頻出度の順位を処理装置により算出する頻出順位算出処理と、
上記頻出順位算出処理で算出した順位の上位所定の順位までの単語に基づきコンテンツを処理装置により検索する第2コンテンツ検索処理と
をコンピュータに実行させることを特徴とする。
【0021】
上記コンテンツ検索プログラムは、さらに、
所定の期間に上記第1単語抽出処理で抽出した単語を処理装置により集計する集計処理をコンピュータに実行させ、
上記頻出順位算出処理は、上記集計処理で集計した結果に基づき、上記所定の期間における単語の頻出度の順位を算出し、
上記第2コンテンツ検索処理は、上記所定の期間における順位の上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする。
【0022】
上記集計処理は、所定の期間毎に上記第1単語抽出処理で抽出した単語を集計し、
上記頻出順位算出処理は、上記所定の期間毎に単語の頻出度の順位を算出し、
上記第2コンテンツ検索処理は、ユーザがキーワードを入力した時点が含まれる期間の順位に基づきコンテンツを検索する
ことを特徴とする。
【0023】
上記集計処理は、ユーザを所定の範囲に特定する特定情報毎に集計する
ことを特徴とする。
【0024】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語から所定の規則に基づき選択され予め記憶装置に記憶した単語である限定用単語と一致する単語を処理装置により抽出することで単語を限定する単語限定処理をコンピュータに実行させ、
上記第2コンテンツ検索処理は、上記単語限定処理で限定した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする。
【0025】
上記単語限定処理は、ユーザを所定の範囲に特定する特定情報毎に記憶された限定用単語と一致する単語を処理装置により抽出する
ことを特徴とする。
【0026】
上記単語限定処理は、上記キーワード入力処理で入力させたキーワード毎に記憶された限定用単語と一致する単語を処理装置により抽出する
ことを特徴とする。
【0027】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語の内、上記限定用単語として記憶していない単語で、上記頻出順位算出処理で算出した順位が高い単語を新たに限定用単語として記憶する限定用単語記憶処理
をコンピュータに実行させることを特徴とする。
【0028】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語と所定の規則に基づき選択され予め記憶装置に記憶した単語である追加用単語とを比較して、追加用単語にのみ存在する単語を所定の順位として上記第1単語抽出処理で抽出した単語に追加する単語追加処理をコンピュータに実行させ、
上記第2コンテンツ検索処理は、上記単語追加処理で追加した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする。
【0029】
上記単語追加処理は、ユーザを所定の範囲に特定する特定情報毎に記憶された追加用単語と比較して追加用単語にのみ存在する単語を追加する
ことを特徴とする。
【0030】
上記単語追加処理は、上記キーワード入力処理で入力させたキーワード毎に記憶された追加用単語と比較して追加用単語にのみ存在する単語を追加する
ことを特徴とする。
【0031】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語の内、上記追加用単語として記憶していない単語で、上記頻出順位算出処理で算出した順位が高い単語を新たに追加用単語として記憶する追加用単語記憶処理
をコンピュータに実行させることを特徴とする。
【0032】
上記コンテンツ検索プログラムは、さらに、
上記第2コンテンツ検索処理で検索したコンテンツへのリンクを表示装置に表示するリンク表示処理
をコンピュータに実行させることを特徴とする。
【0033】
上記リンク表示処理は、上記第2コンテンツ検索処理で検索したコンテンツの中で、上位に検索されたコンテンツへのリンクを表示する
ことを特徴とする。
【0034】
上記コンテンツ検索プログラムは、さらに、
上記第2コンテンツ検索処理で検索したコンテンツの中で、上記所定の期間にヒット率が高かったコンテンツへのリンクを表示装置に表示するリンク表示処理
をコンピュータに実行させることを特徴とする。
【0035】
上記コンテンツ検索プログラムは、さらに、
上記第2コンテンツ検索処理で検索したコンテンツから所定の条件で単語を抽出する第2単語抽出処理と、
上記第2単語抽出処理で抽出した単語を表示装置に表示する単語表示処理と
をコンピュータに実行させることを特徴とする。
【0036】
本発明に係るコンテンツ検索方法は、例えば、入力装置が検索用のキーワードを入力するキーワード入力ステップと、
処理装置が上記キーワード入力ステップで入力したキーワードに基づきコンテンツを検索する第1コンテンツ検索ステップと、
処理装置が上記第1コンテンツ検索ステップで検索したコンテンツから複数の単語を抽出して、記憶装置が記憶する第1単語抽出ステップと、
処理装置が上記第1単語抽出ステップで抽出した複数の単語それぞれの頻出度を計算して、単語の頻出度の順位を算出する頻出順位算出ステップと、
処理装置が上記頻出順位算出ステップで算出した順位の上位所定の順位までの単語に基づきコンテンツを検索する第2コンテンツ検索ステップと
を備えることを特徴とする。
【発明の効果】
【0037】
本発明に係るコンテンツ検索装置によれば、ユーザが入力したキーワードに基づき検索された単語の出現頻度の高い単語により第2コンテンツ検索部が再検索を行う。そのことで、ユーザが入力したキーワードから1段階掘り下げた情報が検索される。また、出現頻度の高い情報により再検索を行っているため、入力したキーワードとの関連性の高い又は重要度の高い情報が検索される。
【発明を実施するための最良の形態】
【0038】
図1は、実施の形態におけるコンテンツ検索システム1000の外観の一例を示す図である。
図1において、コンテンツ検索システム1000は、サーバ910、PC(パーソナルコンピュータ)909、LCD(液晶)等の表示画面を有する表示装置901、キーボード902(Key・Board:K/B)、マウス903、FDD904(Flexible・Disc・ Drive)、携帯電話端末917などのハードウェア資源を備え、これらはケーブルや信号線等の有線ネットワークや、無線ネットワークで接続されている。
サーバ910、PC909、携帯電話端末917は、コンピュータである。サーバ910は、ローカルエリアネットワーク942(LAN)、ゲートウェイ941を介してインターネット940に接続されインターネット940を介してPC909、携帯電話端末917と接続されている。
ここで、サーバ910は、コンテンツ検索装置100の一例である。また、PC909及び携帯電話端末917は、ユーザ端末の一例である。
【0039】
図2は、実施の形態におけるコンテンツ検索装置100のハードウェア資源の一例を示す図である。
図2において、コンテンツ検索装置100は、プログラムを実行するCPU911(Central・Processing・Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、表示装置901、キーボード902、マウス903、FDD904、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
【0040】
RAM914は、揮発性メモリの一例である。ROM913、FDD904、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置984の一例である。
通信ボード915、キーボード902、FDD904などは、入力装置982の一例である。
【0041】
通信ボード915は、LAN942等に接続されている。通信ボード915は、LAN942に限らず、インターネット940、ISDN等のWAN(ワイドエリアネットワーク)などに接続されていても構わない。インターネット940或いはISDN等のWANに接続されている場合、ゲートウェイ941は不要となる。
磁気ディスク装置920又はROM913などには、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
【0042】
上記プログラム群923には、以下に述べる実施の形態の説明において「コンテンツ検索部110」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、以下に述べる実施の形態の説明において、「〜判定」として説明する情報やデータや信号値や変数値やパラメータが、「ファイル」や「データベース」の各項目として記憶されている。「ファイル」や「データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリになどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPU911の動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示のCPU911の動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
また、以下に述べる実施の形態の説明において説明するフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、コンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disc)等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
【0043】
また、以下に述べる実施の形態の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」、「〜手段」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、以下に述べる「〜部」としてコンピュータを機能させるものである。あるいは、以下に述べる「〜部」の手順や方法をコンピュータに実行させるものである。
【0044】
実施の形態1.
まず、図3に基づきコンテンツ検索装置100の動作の概要を説明する。
初めにコンテンツ検索装置100は、ユーザが入力したキーワードにより検索されたWEBサイトコンテンツの頻出単語を複数抽出する(1)。次に、コンテンツ検索装置00は、抽出された頻出単語を、例えば、次のパラメータにより集計を行う(2)。パラメータとは、日、週、月、年、季節毎や、家族構成、年齢、性別、職業、生活レベル(収入、持家、支出、地域活動、近所付き合い等)のユーザ情報等である。そして、これらのパラメータにより、抽出された頻出単語を日時、場所、環境、性別、年齢層等の組合せで細かく分類した分類コード別にデータマイニングし、ユーザが好む傾向を分析することで、適切な再検索キーワードを選出する。次に、コンテンツ検索装置100は、マイニングされた単語と年代別キーワード辞書とを比較・解析する(3)。年代別キーワード辞書とは、年代毎の傾向・流行を示す単語を分類して登録してあるデータベース等である。ここでは、一例としてユーザがシニア世代であることを想定する。そこで、抽出された単語と比較する辞書はシニア向けキーワード辞書である。シニア向けキーワード辞書は、例えば、シニア向けの旅行情報、グルメ情報、ファッション情報などから厳選された単語からなるものである。次に、コンテンツ検索装置100は、マイニングされた頻出単語とシニア向けキーワード辞書に登録された単語とを比較し、所定の条件の下、頻出単語の絞込み(限定)、あるいは追加を行い、再検索キーワードを選出する。(4)。次に、コンテンツ検索装置100は、選出した再検索キーワードをジャンル別ユーザ頻出ワード辞書に登録する(5)。コンテンツ検索装置100は、例えば、ユーザが入力したキーワードに基づき、ジャンルを判断して、選出した再検索キーワードをジャンル別ユーザ頻出ワード辞書に登録する。そして、コンテンツ検索装置100は、ジャンル別ユーザ頻出ワード辞書に登録した単語に基づき、再度WEBサイトを検索する(6)。コンテンツ検索装置100は、検索された結果をシニア向けのジャンル別一押し情報として、検索されたサイトへのリンクを表示する。また、検索されたサイトから頻出単語を抽出して、ジャンル別頻出キーワードDB(データベース)に登録する。ジャンル別頻出キーワードDBに登録した情報をジャンル別一押し情報として表示しても構わない。
【0045】
次に、図4に基づきコンテンツ検索装置100を備えるコンテンツ検索システム1000の構成の概要について説明する。
図4に示すように、コンテンツ検索装置100は、ネットワークを介してユーザ端末とWEBサイトを構成するWEBサーバと接続される。ユーザがユーザ端末よりコンテンツ検索装置100へアクセスし、検索指示を行う。コンテンツ検索装置100は、ユーザから検索指示があると、入力されたキーワードに基づき図3に示す処理を行い、WEBサイトを検索する。そして、検索結果をユーザ端末へ返す。ここで、キーワードに基づきWEBサイトを検索するのは、既存の検索エンジンを使用しても構わない。
つまり、ユーザはコンテンツ検索装置100にアクセスし、例えば会員登録等により個人情報をコンテンツ検索装置100に入力することで、上記パラメータである年齢、性別、職業、生活レベルなどを登録する。その上で、ユーザはWEBサイトの検索指示を行う。そのため、上記マイニングが可能となる。
【0046】
次に、図5から図10までに基づきコンテンツ検索装置100の機能及び動作について説明する。
図5は、コンテンツ検索装置100の機能を示す機能ブロック図である。
コンテンツ検索装置100は、コンテンツ検索部110、表示装置901、処理装置980、入力装置982、記憶装置984、通信装置988を備える。
コンテンツ検索部110は、例えば、ソフトウェア、プログラム等であってもよく、この場合、記憶装置984に記憶され、処理装置980により実行される。コンテンツ検索部110は、キーワード入力部112、第1コンテンツ検索部114、第1単語抽出部116、頻出順位算出部118、第2コンテンツ検索部120、リンク表示部122、第2単語抽出部124、単語表示部126、限定用単語記憶部128、単語限定部130、追加用単語記憶部132、単語追加部134、集計処理部136を備える。
【0047】
図6は、限定用単語記憶部128及び追加用単語記憶部132が記憶した情報の一例である。限定用単語記憶部128及び追加用単語記憶部132の役割については後述する。
限定用単語記憶部128及び追加用単語記憶部132は、例えば、図6に示すように大分類、中分類に分けて限定用単語及び追加用単語を記憶装置984に記憶する。
【0048】
図7は、コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャートである。図7は、コンテンツ検索処理の基本的動作を示す。コンテンツ検索処理は、コンテンツ検索プログラム及びコンテンツ検索方法の処理内容を示す。
まず、キーワード入力処理(S101)では、キーワード入力部112は、ユーザに検索用のキーワードを入力装置982により入力させる。検索用のキーワードは任意のものでよく、単数でも複数でも構わない。
次に、第1コンテンツ検索処理(S102)では、第1コンテンツ検索部114は、キーワード入力部112が入力させたキーワードに基づきコンテンツを処理装置980により検索する。第1コンテンツ検索部114は、例えば、既存の検索エンジン等を使用してユーザが入力したキーワードに基づきWEBサイトを検索する。
次に、第1単語抽出処理(S103)では、第1単語抽出部116は、第1コンテンツ検索部114が検索したコンテンツから複数の単語を抽出して記憶装置984に記憶する。第1単語抽出部116は、例えば、検索されたコンテンツの文字情報について形態素解析を行い、品詞が名詞であるもののみを抽出する。第1単語抽出部116は、名詞形の単語をすべて抽出するとしても構わないが、例えば、予め分類辞書を記憶装置984に記憶しておき、入力されたキーワードが属する大分類に含まれる中分類、小分類に該当する単語のみを抽出するとしても構わない。
次に、頻出順位算出処理(S104)では、頻出順位算出部118は、第1単語抽出部116が抽出した複数の単語それぞれの頻出度を処理装置980により計算して、単語の頻出度の順位を処理装置980により算出する。頻出順位算出部118は、第1単語抽出部116が抽出した単語の数の多いものを頻出度が高いとしても、その単語を含んでいるWEBサイトが多いものを頻出度が高いとしても構わない。また、WEBサイトで使用しているフォントサイズが頻出度に影響を与えるとしても構わない。例えば1つそのフォントサイズが大きい単語があった場合、その単語が5つあったものとする等としても構わない。
次に、第2コンテンツ検索処理(S105)では、第2コンテンツ検索部120は、頻出順位算出部118が算出した順位の上位所定の順位までの単語に基づきコンテンツを処理装置980により検索する。つまり、第2コンテンツ検索部120は再検索を行う。第1単語抽出部116が抽出したすべての単語に基づいてコンテンツの検索を行うのは、抽出される単語が多い場合には妥当ではない。そこで、第2コンテンツ検索部120は、頻出順位算出部118が算出した順位の上位の単語を例えばOR条件で結んで検索を行う。これに限られず、頻出順位算出部118が算出した順位の上位の単語それぞれで検索を行っても構わない。上位所定の順位とは、1位のみでも3位まででも5位まででも何位まででも構わない。
そして、リンク表示処理(S106)では、リンク表示部122は、第2コンテンツ検索部120が検索したコンテンツへのリンクを表示装置901に表示する。また、リンク表示部122は、第2コンテンツ検索部120が検索したコンテンツの中で、上位に検索されたコンテンツへのリンクを表示するとしても構わない。さらに、リンク表示部122は、第2コンテンツ検索部120が検索したコンテンツの中で、上記所定の期間にヒット率が高かったコンテンツへのリンクを表示装置901に表示するとしても構わない。
【0049】
そのため、コンテンツ検索装置100によれば、ユーザが入力したキーワードに基づき検索された単語の出現頻度の高い単語により第2コンテンツ検索部120が再検索を行う。そのことで、ユーザが入力したキーワードから1段階掘り下げた情報が検索される。また、出現頻度の高い情報により再検索を行っているため、入力したキーワードとの関連性の高い又は重要度の高い情報が検索される。
【0050】
また、リンク表示部122は再検索されたコンテンツへのリンクを表示する。このため、表示されたリンクを辿ることで容易に検索された情報を閲覧等することができる。
【0051】
さらに、リンク表示部122は特に検索されたコンテンツの中でも上位に検索されたもののみへのリンクを表示する。そのため、表示されたリンクを辿ることでユーザは真に欲する情報へ容易に辿ることができる。
【0052】
また、さらに、リンク表示部122は特に検索されたコンテンツの中でもヒット率が高かったコンテンツへのリンクを表示する。上記同様、表示されたリンクを辿ることでユーザは真に欲する情報へ容易に辿ることができる。
【0053】
次に、図8も、コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャートである。図8は、図7に基づき説明したコンテンツ検索処理のリンク表示処理(S106)に変更を加えたものである。つまり、(S201)から(S205)までは、上記(S101)から(S105)までと同様である。
第2単語抽出処理(S206)では、第2単語抽出部124は、第2コンテンツ検索部120が検索したコンテンツから所定の条件で単語を抽出する。第2単語抽出部124は、例えば、形態素解析を行い、ユーザが入力したジャンルと関連性がある単語を抽出する。第2単語抽出部124は、上述したジャンル別頻出キーワードDBに抽出した単語を登録する。
そして、単語表示処理(S207)では、単語表示部126は、第2単語抽出部124が抽出した単語を表示装置901に表示する。単語表示部126は、例えば、第2単語抽出部124が抽出した単語の内、頻出度が上位所定の順位までのものを表示するとしても構わない。つまり、単語表示部126は、上述したジャンル別一押し情報を表示する。
【0054】
したがって、コンテンツ検索装置100によれば、単語表示部126は、再検索されたコンテンツの中から所定の条件で抽出された単語を表示する。そのため、検索されたサイトへアクセスすることなく、必要な情報を得ることが可能である。
【0055】
次に、図9も、コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャートである。図9は、図7に基づき説明したコンテンツ検索処理に再検索用の単語を限定・追加する処理を加えたものである。
ここで、(S301)から(S304)までは、上記(S101)から(S104)までと同様である。
(S304)に続き、単語限定処理(S305)では、単語限定部130は、第1単語抽出部116が抽出した単語から、所定の規則に基づき選択され予め限定用単語記憶部128が記憶装置984に記憶した単語である限定用単語と一致する単語を処理装置980により抽出することで単語を限定する。これに限られず、単語限定部130は限定用単語にない単語の順位を所定分下げるようにしても構わない。限定用単語記憶部128が記憶装置984に記憶した限定用単語の一例は図6に示したものである。図6の例では、年代をシニアとしたシニア向けが好む情報を限定用単語として記憶している。つまり、限定用単語記憶部128はユーザを所定の範囲に特定する特定情報毎に限定用単語を記憶する。また、図6では、限定用単語記憶部128は大分類、中分類と分けて限定用単語を記憶している。つまり、限定用単語記憶部128はキーワード入力部112が入力させたキーワード毎、またはキーワードを所定の分類に分けた分類毎に限定用単語を記憶する。
次に、単語追加処理(S306)では、単語追加部134は、第1単語抽出処理で抽出した単語と、所定の規則に基づき選択され予め追加用単語記憶部132が記憶装置984に記憶した単語である追加用単語とを比較して、追加用単語にのみ存在する単語を所定の順位として上記第1単語抽出部116で抽出した単語に追加する。ここでは、単語限定部130が、第1単語抽出部116が抽出した単語を限定した単語に対して、単語追加部134は単語を追加する。追加用単語記憶部132は、限定用単語記憶部128が記憶した情報と同じ情報を追加用単語として記憶している。つまり、限定用単語と追加用単語とは共通であっても構わない。したがって、追加用単語記憶部132は、限定用単語記憶部128と同様に、ユーザを所定の範囲に特定する特定情報毎に追加用単語を記憶し、キーワード入力部112が入力させたキーワード毎、またはキーワードを所定の分類に分けた分類毎に追加用単語を記憶する。
次の第2コンテンツ検索処理(S307)は(S105)と同様である。また、(S307)の次に、リンク表示処理(S106)と同様の処理を行っても、第2単語抽出処理(S206)と単語表示処理(S207)と同様の処理を行っても構わない。
【0056】
コンテンツ検索装置100によれば、ユーザが入力したキーワードに基づき検索された単語を所定の条件により単語限定部130が限定する。そのため、ユーザが入力したキーワードと関連性が高くても不適切である単語については再検索のキーワードから除外することができる。
【0057】
また、単語限定部130は、ユーザを所定の範囲に特定する特定情報毎に単語を限定する条件を変える。そのため、そのユーザの傾向、流行に合わない単語を再検索のキーワードから除外することができる。
【0058】
さらに、単語限定部130は、ユーザが入力したキーワード毎に単語を限定する条件を変える。そのため、ユーザが入力したキーワードに対して不適切な単語については再検索のキーワードから除外することができる。
【0059】
また、ユーザが入力したキーワードに基づき検索された単語に所定の条件により単語追加部134が単語を追加する。そのため、ユーザが入力したキーワードでは検索されなかったが、ユーザが入力したキーワードと関連性が高い単語を再検索のキーワードに追加することができる。
【0060】
さらに、単語追加部134は、ユーザを所定の範囲に特定する特定情報毎に単語を追加する条件を変える。そのため、そのユーザの傾向、流行に合わせて再検索のキーワードに単語を追加することができる。
【0061】
また、さらに、単語追加部134は、ユーザが入力したキーワード毎に単語を追加する条件を変える。そのため、ユーザが入力したキーワードに対して、検索されなかったが、流行性が高い単語については再検索のキーワードに追加することができる。
【0062】
ここで、限定用単語記憶部128及び追加用単語記憶部132は、上述したように例えば、年代別等に分類分けされた旅行情報、グルメ情報、ファッション情報などから厳選された単語である。限定用単語記憶部128及び追加用単語記憶部132は、例えば、旅行情報であれば、所定の旅行会社等から情報を受信して記憶する。つまり、限定用単語記憶部128及び追加用単語記憶部132は、所定の情報源から情報を得る。また、限定用単語記憶部128及び追加用単語記憶部132は、第1単語抽出部116が抽出した単語の内、限定用単語または追加用単語として記憶していない単語で、上記頻出順位算出部が算出した順位が高い単語を新たに限定用単語または追加用単語として記憶するとしても構わない(限定用単語記憶処理、追加用単語記憶処理)。つまり、所定の情報源からは得られなかった情報であっても、検索の頻出度が高い単語は、流行性等があると認め限定用単語または追加用単語に追加する。限定用単語または追加用単語に追加する場合には、入力されたキーワードまたは追加する単語に基づき各単語を適切な分類として記憶する。この場合、必要であれば、分類辞書等を記憶装置984に予め記憶しておくとしても構わない。
【0063】
したがって、コンテンツ検索装置100によれば、ユーザが入力したキーワードに基づき検索された出現頻度の高い単語については、単語限定部130が除外しないように単語の除外条件を変更する。そのため、ユーザが入力したキーワードと関連性の非常に高い単語や重要な単語を再検索のキーワードから除外してしまうことがない。
【0064】
また、ユーザが入力したキーワードに基づき検索された出現頻度の高い単語については、他のユーザが入力したキーワードでは検索されない場合であっても、単語追加部134が追加するように単語の追加条件を変更する。そのため、ユーザが入力したキーワードと関連性の非常に高い単語や重要な単語を再検索のキーワードに精度よく追加することができる。
【0065】
次に、図10も、コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャートである。図10は、図7に基づき説明したコンテンツ検索処理に頻出順位の算出のための集計処理を加えたものである。
ここで、(S401)から(S403)までは、上記(S101)から(S103)までと同様である。
(S403)に続き、集計処理(S404)では、集計処理部136は、所定の期間に第1単語抽出部116が抽出した単語を処理装置980により集計する。また、集計処理部136は、ユーザを所定の範囲に特定する特定情報毎に集計する。特定情報とは、上記図3の例で示した、年齢、性別、職業、生活レベル等のパラメータである。つまり、集計処理部136は、所定のパラメータ毎、所定の期間毎に抽出した単語を集計する。
次に、頻出順位算出処理(S405)では、頻出順位算出部118は、集計処理部136が集計した結果に基づき、上記所定の期間、及び該当する特定情報における単語の頻出度の順位を算出する。また、集計処理部136は、所定の期間毎に第1単語抽出部116が抽出した単語を集計し、頻出順位算出部118は、上記所定の期間毎に単語の頻出度の順位を算出するとしても構わない。つまり、例えば集計処理部136が季節毎に単語を集計する場合には、頻出順位算出部118は季節毎の順位を算出する。
次に、第2コンテンツ検索処理(S406)では、第2コンテンツ検索部120は、上記所定の期間、及び該当する特定情報における順位の上位所定の順位までの単語に基づきコンテンツを検索する。また、集計処理部136が所定の期間毎に上記第1単語抽出部116が抽出した単語を集計し、頻出順位算出部118が上記所定の期間毎に単語の頻出度の順位を算出するとした場合には、第2コンテンツ検索部120は、ユーザがキーワードを入力した時点が含まれる期間の順位に基づきコンテンツを検索するとしても構わない。つまり、例えば集計処理部136が季節毎に単語を集計し、頻出順位算出部118が季節毎の順位を算出する場合には、第2コンテンツ検索部120はユーザが検索キーワードを入力した季節の順位に基づきコンテンツを検索する。
また、(S406)の次に、リンク表示処理(S106)と同様の処理を行っても、第2単語抽出処理(S206)と単語表示処理(S207)と同様の処理を行っても構わない。
【0066】
したがって、コンテンツ検索装置100によれば、集計処理部136はユーザが入力したキーワードに基づき検索された単語について集計を行う。そして、第2コンテンツ検索部120が所定の期間における出現頻度の高い単語により再検索を行うことで、所定の期間における傾向、流行等を取り入れた上で情報が検索される。
【0067】
また、集計処理部136はユーザが入力したキーワードに基づき検索された単語について所定の期間毎に集計を行う。そのため、例えば、ユーザが入力したキーワードが同じであっても、春夏秋冬の季節毎の傾向、流行を取り入れて再検索に使用されるキーワードを変更すること等ができる。
【0068】
さらに、集計処理部136はユーザを所定の範囲に特定する特定情報毎に集計することにより、ユーザの年代、性別等による傾向、流行を取り入れた上で情報が検索される。
【0069】
次に、図11も、コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャートである。図11は、図9に示した再検索用の単語を限定・追加する処理と図10に示した集計処理とを合わせたものである。つまり、(S501)から(S505)までは、上記(S401)から(S405)までと同様である。そして、(S506)から(S508)までは、上記(S305)から(S307)までと同様である。
図11に示すコンテンツ検索処理は図3に示す処理の概要と概ね一致する。つまり、第1コンテンツ検索処理(S502)及び第1単語抽出処理(S503)は図3の(1)と、集計処理(S504)及び頻出順位算出処理(S505)は、図3の(3)と、単語限定処理(S506)及び単語追加処理(S507)は、図3の(4)と、限定用単語記憶処理及び追加用単語記憶処理は、図3の(5)と、第2コンテンツ検索処理(S508)は、図3の(6)とにそれぞれ該当する。したがって、図3に示すシニア向け(年代別)キーワード辞書には、限定用単語記憶部128及び追加用単語記憶部132が記憶装置984に記憶した情報が記憶される。また、ジャンル別ユーザ頻出ワード辞書には、最終的に選出された再検索用の単語が記憶される。さらに、ジャンル別頻出キーワードDBには、第2コンテンツ検索部120が検索したコンテンツから第2単語抽出部124が抽出した単語が記憶される。また、さらに、ジャンル別一押し情報は、単語表示部126が表示する情報を示す。
【0070】
次に、図11に示すコンテンツ検索処理についての具体例を示す。ここでは、限定用単語記憶部128及び追加用単語記憶部132は、図6に示す情報を記憶装置984に記憶しているものとする。また、検索するユーザはシニア世代であるものとする。
まず、(S501)では、キーワード入力部112は、ユーザに検索用のキーワードを入力させる。ここで、ユーザはキーワードとして「夕食」を入力したとする。そこで、(S502)では、第1コンテンツ検索部114は、入力されたキーワードである「夕食」に基づき、WEBサイトを検索する。そして、(S503)では、第1単語抽出部116は、検索されたWEBサイトから所定の条件で単語を抽出する。ここでは、予め分類辞書を記憶装置984に記憶しているとし、入力されたキーワードが属する大分類「食事」に含まれる中分類に該当する単語のみを抽出する。その結果「日本料理−30個」、「インド料理−20個」、「イタリア料理−18個」、「中華料理−15個」、「フランス料理−10個」、「トルコ料理−2個」が抽出されたとする。
【0071】
次に、(S504)では、集計処理部136は、抽出された単語を集計する。この例では、シニア世代(特定情報の一例)のユーザが食事の分類についての検索を行っている。また、例えば、季節毎に集計を行っており、検索をしたのが夏(所定の期間の一例)であれば、「夏−シニア世代−食事」の集計結果に上記検索結果を反映させる。集計処理部136は、例えば、検索された単語のこれまでの検索個数の累計に今回の検索個数を加える。次に、(S505)では、頻出順位算出部118は抽出された単語の頻出順位を算出する。ここで、頻出順位算出部118は、集計処理部136が集計した結果に基づき頻出順位を算出する。ここでは、「夏−シニア世代−食事」の集計結果に基づき単語の頻出順位を算出する。その結果、「日本料理−>イタリア料理−>中華料理−>フランス料理−>インド料理−>トルコ料理」の順であったとする。つまり、集計結果に基づいて順位を算出したことにより、単純に検索結果に基づき順位を算出する場合とはインド料理の順位が入れ替わっている。つまり、「夏−シニア世代−食事」に該当する検索では、インド料理が抽出される検索はあまり行われていないことを示す。すなわち、インド料理がこの分類では好まれていないと推測される。
【0072】
次に、(S506)では、単語限定部130は、限定用単語記憶部128が記憶した限定用単語に基づき抽出した単語を限定する。つまり、単語限定部130は、シニア向け(年代別)キーワード辞書に基づき単語を限定する。ここでは、図6に示す限定用単語の中で、入力されたキーワードと一致する分類に該当する情報のみを使用する。つまり、分類「食事−>夕食」と辿り、「日本料理」、「中華料理」、「ベトナム料理」、「イタリア料理」、「フランス料理」を限定用単語として使用する。ここでは単語限定部130は、抽出した単語から限定用単語にない単語を削除する。したがって、単語限定部130が単語を限定した結果、残りの単語は、「日本料理−>イタリア料理−>フランス料理−>中華料理」となる。つまり、「インド料理」、「トルコ料理」は、一般にシニア世代には好まれていない傾向にあると認められ、再検索用の単語から除外される。
【0073】
次に、(S507)では、単語追加部134は、追加用単語記憶部132が記憶した追加用単語に基づき単語を追加する。つまり、単語追加部134は、シニア向け(年代別)キーワード辞書に基づき単語を追加する。ここでは、単語限定部130が行ったように、分類「食事−>夕食」と辿り得られる「日本料理」、「中華料理」、「ベトナム料理」、「イタリア料理」、「フランス料理」を追加用単語として使用する。ここでは、抽出した単語になく、追加用単語にのみある単語を所定の順位として追加する。所定の順位は、例えば、追加用単語についても順位付けしておき、その順位として挿入するとしても構わない。ここでは、1位「日本料理」、2位「中華料理」、3位「ベトナム料理」、4位「イタリア料理」、5位「フランス料理」であったとする。そのため、単語が追加された結果、「ベトナム料理」が3位に加えられ、「日本料理−>イタリア料理−>ベトナム料理−>フランス料理−>中華料理」となる。つまり、「ベトナム料理」が現在の流行である場合などには、検索結果に存在しない場合でも「ベトナム料理」が再検索用の単語として加えられる。選出された再検索用の単語は、ジャンル別ユーザ頻出ワード辞書に記憶される。
【0074】
次に、(S508)では、第2コンテンツ検索部120は、抽出された「日本料理−>イタリア料理−>ベトナム料理−>フランス料理−>中華料理」の上位所定の順位までの単語に基づきWEBサイトを再検索する。ここでは、上位3位までの単語に基づき検索を行う。つまり、第2コンテンツ検索部120は「日本料理」、「イタリア料理」、「ベトナム料理」に基づき検索を行う。
【0075】
そして、リンク表示部122は、第2コンテンツ検索部120が検索したWEBサイトへのリンクを表示する。この表示内容がジャンル別一押し情報である。
または、第2単語抽出部124は、第2コンテンツ検索部120が検索したWEBサイトから所定の条件に基づき単語を抽出する。第2単語抽出部124は、例えば、各検索キーワードで検索した第2コンテンツ検索部120が検索したWEBサイトに含まれる名詞を抽出する。そして、単語表示部126は、これらの単語を表示する。例えば、上記の例では、「日本料理」に基づき第2コンテンツ検索部120が検索を行い、第2単語抽出部124が分類辞書の中分類「日本料理」の小分類に該当する単語のみを抽出したとする。その結果「うなぎ」、「寿司」などの単語が抽出され、単語表示部126はこれらを表示する。このようにすることにより、「食事」というキーワードから夏にシニア世代に好まれる食事のジャンルを抽出し、表示することができる。この表示内容がジャンル別頻出キーワードDBに記憶された情報である。
【0076】
また、コンテンツ検索装置100はこれに限られず、第2単語抽出部124が抽出した単語に基づき3回目のコンテンツ検索を行う第3コンテンツ検索部を備えていても構わない。第3コンテンツ検索部の検索前に、第2単語抽出部124が抽出した単語について、集計処理、単語限定処理、単語追加処理を実行し、検索用の単語を選出しても構わない。例えば、上記の例では、「日本料理」に基づき第2コンテンツ検索部120が検索を行い、第2単語抽出部124が分類辞書の中分類「日本料理」の小分類に該当する単語のみを抽出したとする。すると「うなぎ」、「寿司」・・・という単語が抽出されたとする。そして、上記と同様に、集計処理、単語限定処理、単語追加処理を実行し、検索用の単語を選出する。その結果選出された単語に基づき、第3コンテンツ検索部はコンテンツの検索を行う。また、コンテンツ検索装置100は第3コンテンツ検索部が検索したコンテンツから単語を抽出する第3単語抽出部を備えても構わない。例えば、「うなぎ」に基づき第3コンテンツ検索部が検索を行い検索された結果から形態素解析を経て、店舗名称と認められる情報のみを抽出する。そして、単語表示部126は抽出した結果を表示する。このようにすることにより、「食事」というキーワードから夏にシニア世代に好まれる食事を提供する店舗情報を抽出し、表示することができる。
【0077】
ここで、第1単語抽出部116が抽出した結果、限定用単語・追加用単語として記憶されていない「インド料理」と「トルコ料理」とが抽出されている。ここで、「インド料理」については、頻出度が高い。この傾向が続き、所定の期間である夏期の集計としても「インド料理」の頻出度が高くなる場合には、シニア世代に夏期には「インド料理」が好まれる傾向にあると判断して、限定用単語記憶部128及び追加用単語記憶部132は、限定用単語・追加用単語として「インド料理」を追加する。例えば、所定の期間の集計をとり終わった時点で、「インド料理」の頻出度が上記所定の順位に入っていた場合に限定用単語記憶部128及び追加用単語記憶部132は、限定用単語・追加用単語として追加する。
【0078】
上記では、ユーザがキーワードを入力し検索指示を行った場合に、上記処理を行い、検索結果を表示した。しかし、これに限られず、ユーザによる検索結果を記憶したジャンル別頻出キーワードDBの情報に基づき、例えば年代別一押し情報としてWEBサイト等に掲載しても構わない。
つまり、上記では、夕食にというキーワードからレストラン等の店舗情報を得ることができた。これ以外にも、ユーザの入力するキーワードに基づき様々な情報を得ることが可能であり、またその頻出度から傾向・流行も判別することが可能である。例えば、首都圏の人気喫茶店情報を提供することができる。つまり、ジャンル別頻出キーワードDBの情報に基づき、例えば、山手線、地下鉄駅近隣の地域別人気喫茶店の場所、電話番号を検索し易い形で一覧表にして提供する。情報はWEBから収集したジャンル別頻出キーワードDBの情報を基礎とするが、SNS(Social Networking Site)で地元にいるユーザに提供して貰い充実化させても構わない。また、首都圏のお勧め食べ物情報を提供することができる。つまり、ジャンル別頻出キーワードDBの情報に基づき、例えば、山手線、地下鉄等の駅近隣の地域別年代別のお勧め食べ物店の情報を検索し易い形で提供する。また、旅行(国内、海外)、海外留学、海外移住、贈り物、安心投資、健康情報、ペット情報、防犯/防災関連等についても、ジャンル別頻出キーワードを使った情報の提供が可能である。
【0079】
また、上記説明では、ユーザがキーワードを入力した場合に上記処理を行うこととした。しかし、第1単語抽出部116の処理等は相当の時間が必要であると考えられる。そこで、いわゆるエージェント機能により第1コンテンツ検索処理から第1単語抽出処理までをコンテンツ検索装置100で事前に実行しておくとしても構わない。具体的には、ユーザにより入力されることが予想されるキーワードについて、例えば定期的にコンテンツ検索装置100がWEBサイトを検索し、頻出度の高い単語を抽出する。そして、キーワードと抽出された単語とを紐付けして記憶装置984に記憶しておく。ユーザから検索指示があった場合に、予想されていたキーワードとユーザが入力したキーワードが一致する場合には、記憶装置984から頻出度の高い単語を読み込む。これにより検索処理を短時間で行うことが可能となる。同様に、第2コンテンツ検索処理から第2単語抽出処理までをコンテンツ検索装置100で事前に実行しておくとしても構わない。
【0080】
上記説明において、「〜処理」としたものは「〜ステップ」と読み替えても構わない。
【図面の簡単な説明】
【0081】
【図1】実施の形態におけるコンテンツ検索システム1000の外観の一例を示す図。
【図2】実施の形態におけるコンテンツ検索装置100のハードウェア資源の一例を示す図。
【図3】コンテンツ検索装置100の動作の概要を示す図。
【図4】コンテンツ検索システム1000の構成の概要を示す図。
【図5】コンテンツ検索装置100の機能を示す機能ブロック図。
【図6】限定用単語記憶部128及び追加用単語記憶部132が記憶した情報の一例を示す図。
【図7】コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャート。
【図8】コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャート。
【図9】コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャート。
【図10】コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャート。
【図11】コンテンツ検索装置100の動作を示すコンテンツ検索処理を示すフローチャート。
【符号の説明】
【0082】
100 コンテンツ検索装置、110 コンテンツ検索部、112 キーワード入力部、114 1コンテンツ検索部、116 第1単語抽出部、118 頻出順位算出部、120 第2コンテンツ検索部、122 リンク表示部、124 第2単語抽出部、126 単語表示部、128 限定用単語記憶部、130 単語限定部、132 追加用単語記憶部、134 単語追加部、136 集計処理部、901 表示装置、902 キーボード、903 マウス、904 FDD、909 PC、910 サーバ、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、916 外部サーバ、917 携帯電話端末、919 スピーカー、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、940 インターネット、941 ゲートウェイ、942 LAN、980 処理装置、982 入力装置、984 記憶装置、988 通信装置。

【特許請求の範囲】
【請求項1】
ユーザに検索用のキーワードを入力装置により入力させるキーワード入力部と、
上記キーワード入力部が入力させたキーワードに基づきコンテンツを処理装置により検索する第1コンテンツ検索部と、
上記第1コンテンツ検索部が検索したコンテンツから複数の単語を抽出して記憶装置に記憶する第1単語抽出部と、
上記第1単語抽出部が抽出した複数の単語それぞれの頻出度を処理装置により計算して、単語の頻出度の順位を処理装置により算出する頻出順位算出部と、
上記頻出順位算出部が算出した順位の上位所定の順位までの単語に基づきコンテンツを処理装置により検索する第2コンテンツ検索部と
を備えることを特徴とするコンテンツ検索装置。
【請求項2】
上記コンテンツ検索装置は、さらに、
所定の期間に上記第1単語抽出部が抽出した単語を処理装置により集計する集計処理部を備え、
上記頻出順位算出部は、上記集計処理部が集計した結果に基づき、上記所定の期間における単語の頻出度の順位を算出し、
上記第2コンテンツ検索部は、上記所定の期間における順位の上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする請求項1記載のコンテンツ検索装置。
【請求項3】
上記集計処理部は、所定の期間毎に上記第1単語抽出部が抽出した単語を集計し、
上記頻出順位算出部は、上記所定の期間毎に単語の頻出度の順位を算出し、
上記第2コンテンツ検索部は、ユーザがキーワードを入力した時点が含まれる期間の順位に基づきコンテンツを検索する
ことを特徴とする請求項2記載のコンテンツ検索装置。
【請求項4】
上記集計処理部は、ユーザを所定の範囲に特定する特定情報毎に集計する
ことを特徴とする請求項2記載のコンテンツ検索装置。
【請求項5】
上記コンテンツ検索装置は、さらに、
所定の規則に基づき選択された単語である限定用単語を記憶装置に記憶する限定用単語記憶部と、
上記第1単語抽出部が抽出した単語から上記限定用単語記憶部が記憶した限定用単語と一致する単語を処理装置により抽出することで単語を限定する単語限定部とを備え、
上記第2コンテンツ検索部は、上記単語限定部が限定した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする請求項1記載のコンテンツ検索装置。
【請求項6】
上記限定用単語記憶部は、ユーザを所定の範囲に特定する特定情報毎に限定用単語を記憶する
ことを特徴とする請求項5記載のコンテンツ検索装置。
【請求項7】
上記限定用単語記憶部は、上記キーワード入力部が入力させたキーワード毎に限定用単語を記憶する
ことを特徴とする請求項5記載のコンテンツ検索装置。
【請求項8】
上記限定用単語記憶部は、上記第1単語抽出部が抽出した単語の内、上記限定用単語として記憶していない単語で、上記頻出順位算出部が算出した順位が高い単語を新たに限定用単語として記憶する
ことを特徴とする請求項5記載のコンテンツ検索装置。
【請求項9】
上記コンテンツ検索装置は、さらに、
所定の規則に基づき選択された単語である追加用単語を記憶装置に記憶する追加用単語記憶部と、
上記第1単語抽出部が抽出した単語と上記追加用単語記憶部が記憶した追加用単語とを比較して、追加用単語にのみ存在する単語を所定の順位として上記第1単語抽出部が抽出した単語に追加する単語追加部とを備え、
上記第2コンテンツ検索部は、上記単語追加部が追加した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする請求項1記載のコンテンツ検索装置。
【請求項10】
上記追加用単語記憶部は、ユーザを所定の範囲に特定する特定情報毎に追加用単語を記憶する
ことを特徴とする請求項9記載のコンテンツ検索装置。
【請求項11】
上記追加用単語記憶部は、上記キーワード入力部が入力させたキーワード毎に追加用単語を記憶する
ことを特徴とする請求項9記載のコンテンツ検索装置。
【請求項12】
上記追加用単語記憶部は、上記第1単語抽出部が抽出した単語の内、上記追加用単語として記憶していない単語で、上記頻出順位算出部が算出した順位が高い単語を新たに追加用単語として記憶する
ことを特徴とする請求項9記載のコンテンツ検索装置。
【請求項13】
上記コンテンツ検索装置は、さらに、
上記第2コンテンツ検索部が検索したコンテンツへのリンクを表示装置に表示するリンク表示部
を備えることを特徴とする請求項1記載のコンテンツ検索装置。
【請求項14】
上記リンク表示部は、上記第2コンテンツ検索部が検索したコンテンツの中で、上位に検索されたコンテンツへのリンクを表示する
ことを特徴とする請求項13記載のコンテンツ検索装置。
【請求項15】
上記コンテンツ検索装置は、さらに、
上記第2コンテンツ検索部が検索したコンテンツの中で、上記所定の期間にヒット率が高かったコンテンツへのリンクを表示装置に表示するリンク表示部
を備えることを特徴とする請求項2記載のコンテンツ検索装置。
【請求項16】
上記コンテンツ検索装置は、さらに、
上記第2コンテンツ検索部が検索したコンテンツから所定の条件で単語を抽出する第2単語抽出部と、
上記第2単語抽出部が抽出した単語を表示装置に表示する単語表示部と
を備えることを特徴とする請求項1記載のコンテンツ検索装置。
【請求項17】
ユーザに検索用のキーワードを入力装置により入力させるキーワード入力処理と、
上記キーワード入力処理で入力させたキーワードに基づきコンテンツを処理装置により検索する第1コンテンツ検索処理と、
上記第1コンテンツ検索処理で検索したコンテンツから複数の単語を抽出して記憶装置に記憶する第1単語抽出処理と、
上記第1単語抽出処理で抽出した複数の単語それぞれの頻出度を処理装置により計算して、単語の頻出度の順位を処理装置により算出する頻出順位算出処理と、
上記頻出順位算出処理で算出した順位の上位所定の順位までの単語に基づきコンテンツを処理装置により検索する第2コンテンツ検索処理と
をコンピュータに実行させることを特徴とするコンテンツ検索プログラム。
【請求項18】
上記コンテンツ検索プログラムは、さらに、
所定の期間に上記第1単語抽出処理で抽出した単語を処理装置により集計する集計処理をコンピュータに実行させ、
上記頻出順位算出処理は、上記集計処理で集計した結果に基づき、上記所定の期間における単語の頻出度の順位を算出し、
上記第2コンテンツ検索処理は、上記所定の期間における順位の上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする請求項17記載のコンテンツ検索プログラム。
【請求項19】
上記集計処理は、所定の期間毎に上記第1単語抽出処理で抽出した単語を集計し、
上記頻出順位算出処理は、上記所定の期間毎に単語の頻出度の順位を算出し、
上記第2コンテンツ検索処理は、ユーザがキーワードを入力した時点が含まれる期間の順位に基づきコンテンツを検索する
ことを特徴とする請求項18記載のコンテンツ検索プログラム。
【請求項20】
上記集計処理は、ユーザを所定の範囲に特定する特定情報毎に集計する
ことを特徴とする請求項18記載のコンテンツ検索プログラム。
【請求項21】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語から所定の規則に基づき選択され予め記憶装置に記憶した単語である限定用単語と一致する単語を処理装置により抽出することで単語を限定する単語限定処理をコンピュータに実行させ、
上記第2コンテンツ検索処理は、上記単語限定処理で限定した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする請求項17記載のコンテンツ検索プログラム。
【請求項22】
上記単語限定処理は、ユーザを所定の範囲に特定する特定情報毎に記憶された限定用単語と一致する単語を処理装置により抽出する
ことを特徴とする請求項21記載のコンテンツ検索プログラム。
【請求項23】
上記単語限定処理は、上記キーワード入力処理で入力させたキーワード毎に記憶された限定用単語と一致する単語を処理装置により抽出する
ことを特徴とする請求項21記載のコンテンツ検索プログラム。
【請求項24】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語の内、上記限定用単語として記憶していない単語で、上記頻出順位算出処理で算出した順位が高い単語を新たに限定用単語として記憶する限定用単語記憶処理
をコンピュータに実行させることを特徴とする請求項21記載のコンテンツ検索プログラム。
【請求項25】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語と所定の規則に基づき選択され予め記憶装置に記憶した単語である追加用単語とを比較して、追加用単語にのみ存在する単語を所定の順位として上記第1単語抽出処理で抽出した単語に追加する単語追加処理をコンピュータに実行させ、
上記第2コンテンツ検索処理は、上記単語追加処理で追加した単語の内、上位所定の順位までの単語に基づきコンテンツを検索する
ことを特徴とする請求項17記載のコンテンツ検索プログラム。
【請求項26】
上記単語追加処理は、ユーザを所定の範囲に特定する特定情報毎に記憶された追加用単語と比較して追加用単語にのみ存在する単語を追加する
ことを特徴とする請求項25記載のコンテンツ検索プログラム。
【請求項27】
上記単語追加処理は、上記キーワード入力処理で入力させたキーワード毎に記憶された追加用単語と比較して追加用単語にのみ存在する単語を追加する
ことを特徴とする請求項25記載のコンテンツ検索プログラム。
【請求項28】
上記コンテンツ検索プログラムは、さらに、
上記第1単語抽出処理で抽出した単語の内、上記追加用単語として記憶していない単語で、上記頻出順位算出処理で算出した順位が高い単語を新たに追加用単語として記憶する追加用単語記憶処理
をコンピュータに実行させることを特徴とする請求項25記載のコンテンツ検索プログラム。
【請求項29】
上記コンテンツ検索プログラムは、さらに、
上記第2コンテンツ検索処理で検索したコンテンツへのリンクを表示装置に表示するリンク表示処理
をコンピュータに実行させることを特徴とする請求項17記載のコンテンツ検索プログラム。
【請求項30】
上記リンク表示処理は、上記第2コンテンツ検索処理で検索したコンテンツの中で、上位に検索されたコンテンツへのリンクを表示する
ことを特徴とする請求項29記載のコンテンツ検索プログラム。
【請求項31】
上記コンテンツ検索プログラムは、さらに、
上記第2コンテンツ検索処理で検索したコンテンツの中で、上記所定の期間にヒット率が高かったコンテンツへのリンクを表示装置に表示するリンク表示処理
をコンピュータに実行させることを特徴とする請求項18記載のコンテンツ検索プログラム。
【請求項32】
上記コンテンツ検索プログラムは、さらに、
上記第2コンテンツ検索処理で検索したコンテンツから所定の条件で単語を抽出する第2単語抽出処理と、
上記第2単語抽出処理で抽出した単語を表示装置に表示する単語表示処理と
をコンピュータに実行させることを特徴とする請求項17記載のコンテンツ検索プログラム。
【請求項33】
入力装置が検索用のキーワードを入力するキーワード入力ステップと、
処理装置が上記キーワード入力ステップで入力したキーワードに基づきコンテンツを検索する第1コンテンツ検索ステップと、
処理装置が上記第1コンテンツ検索ステップで検索したコンテンツから複数の単語を抽出して、記憶装置が記憶する第1単語抽出ステップと、
処理装置が上記第1単語抽出ステップで抽出した複数の単語それぞれの頻出度を計算して、単語の頻出度の順位を算出する頻出順位算出ステップと、
処理装置が上記頻出順位算出ステップで算出した順位の上位所定の順位までの単語に基づきコンテンツを検索する第2コンテンツ検索ステップと
を備えることを特徴とするコンテンツ検索方法。

【図1】
image rotate

【図4】
image rotate

【図2】
image rotate

【図3】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate