説明

アイテム検索装置、アイテム検索方法およびアイテム検索プログラム

【課題】コンテンツや商品の名前の一部あるいは全部がわからなくても、関連する任意のキーワードから、それらアイテムの妥当な候補を出力できるアイテム検索装置を提供すること。
【解決手段】あらかじめ候補となるアイテム名のリストをアイテムリスト203に記憶しておき、URL検索部201が、キーワードをもとにインターネット上のウェブページを検索し、テキスト抽出部202が、キーワードに関連するテキスト情報を取得し、スコア計数部204が、そのテキスト情報からアイテムリストに含まれるアイテム名の出現数をカウントして、出力部205が、その出現数の多いもの順に出力する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、CDやDVDなどの音楽作品や映像作品等のコンテンツや各種の商品などのアイテムを検索するアイテム検索装置、アイテム検索方法およびアイテム検索プログラムに関する。
【背景技術】
【0002】
従来、映像(ビデオ)、音楽、書籍、ゲームなどのレンタルおよび販売されるコンテンツを検索するシステムとしては、題名、作者名(監督、作家、演奏者)、製作年月、出演者名、販売元(レーベル、出版社)等のあらかじめ設定されている属性をキーワードとして、店舗端末を利用し、または、インターネット経由で店舗等のサーバにアクセスして所望のコンテンツ(アイテム)を検索することが行われている。
【0003】
また、インターネットを利用したオンライン店舗などで取扱商品を検索するシステムとしては、製品名、メーカ名、価格等のあらかじめ設定されている属性をキーワードとして所望の商品(アイテム)を検索することが行われている。
【0004】
例えば、音楽に関するコンテンツであれば、演奏者名、アルバム名、曲名、ジャンル(邦楽、洋楽、ロック、クラシックなど)、レーベルなどのキーワードや分類因子を用いて、店舗端末やインターネット経由で検索することで、所望のコンテンツを検索することができるものである。
【0005】
上述した従来の検索のやり方は、例えば、あるアルバムを購入するときに、アルバム名は忘れたが、演奏者と曲名は知っているので、そのアルバムを見つけだすために、演奏者と曲名を掛け合わせて、各種の属性が設定されているコンテンツのデータベースの中から所望するコンテンツ(アルバム)を検索していた。
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、アイテムの検索としては、このように、あらかじめ定められた属性をキーワードとして検索するのではなく、任意のキーワードから検索したいという要求もある。例えば、○○という商品のテレビコマーシャルに使われていた曲の入っているCDを検索したい、ドラマ△△の主題歌の曲名を知りたい、○○映画祭で△△賞を受賞した映画のタイトルを知りたい、経営哲学について書かれた本を検索したい、というような検索の要求も存在する。しかし、このような属性に含まれないキーワードを用いてアイテムを検索する手段はこれまで存在しなかった。
【0007】
この発明は、上記に鑑みてなされたものであって、任意のキーワードを用いて、所望のアイテムを検索することができるアイテム検索装置、アイテム検索方法およびアイテム検索プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するため、請求項1に記載の発明にかかるアイテム検索装置は、候補として出力するアイテム名を記憶するアイテムリスト記憶手段と、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト記憶手段に記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数手段と、前記計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、を備えたことを特徴とする。
【0009】
また、請求項2に記載の発明にかかるアイテム検索装置は、一次検索用の一次検索候補を記憶する一次検索リストを記憶する一時検索リスト記憶手段と、アイテムを前記一次検索候補毎に分類した属性アイテムリストを記憶する属性アイテムリスト記憶手段と、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、前記検索手段によって取得されたウェブページの内容において、前記一次検索リスト記憶手段に記憶された一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数手段と、前記一次スコア計数手段によって計数された数と前記属性アイテムリスト記憶手段に記憶された属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成手段と、前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト生成手段によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数手段と、前記二次スコア計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、を備えたことを特徴とする。
【0010】
また、請求項3に記載の発明にかかるアイテム検索方法は、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、前記検索工程によって取得されたウェブページの内容において、候補として出力するアイテム名を記憶するアイテムリストに記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数工程と、前記計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、を含んだことを特徴とする。
【0011】
また、請求項4に記載の発明にかかるアイテム検索方法は、検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、前記検索工程によって取得されたウェブページの内容において、一次検索用の一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数工程と、前記一次スコア計数工程によって計数された数と、アイテムを前記一次検索候補毎に分類した属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成工程と、前記検索工程によって取得されたウェブページの内容において、前記アイテムリスト生成工程によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数工程と、前記二次スコア計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、を含んだことを特徴とする。
【0012】
また、請求項5に記載の発明にかかるアイテム検索プログラムは、請求項3または4に記載のアイテム検索方法のいずれか一つをコンピュータに実行させることを特徴とする。
【発明の効果】
【0013】
この発明によれば、あらかじめ候補となるアイテム名のリストを記憶しておき、キーワードをもとにインターネット上のウェブページを検索し、キーワードに関連するテキスト情報を取得し、そのテキスト情報からアイテムリストに含まれるアイテム名の出現数をカウントして、その出現数の多いもの順に出力するようにしているので、そのアイテムに関連する任意のキーワードを指定するだけで、そのアイテム名を推定して出力するアイテム検索装置を提供することができるという効果を奏する。
【0014】
また、この発明によれば、キーワードをもとにインターネット上のウェブページを検索した後に、一次検索候補のリストをもとに検索を行うようにしたことで、アイテムの数が莫大であった場合にも高速に処理が可能なアイテム検索装置を提供することができるという効果を奏する。
【発明を実施するための最良の形態】
【0015】
以下に添付図面を参照して、この発明にかかるアイテム検索装置の好適な実施の形態を詳細に説明する。
【0016】
(実施の形態1)
図1は、この発明の実施の形態1にかかるアイテム検索装置を含む、システムの全体を示す構成図である。図1において、101は本実施の形態にかかるアイテム検索装置を備えたサーバであり、102はウェブページ等の膨大な情報を含んだインターネットであり、103は101のサーバとLAN等のネットワークで接続された入出力端末であり、104はインターネットに接続可能なパソコンまたはPDAなどである。
【0017】
このシステムにおいて、まずアイテムを検索したいユーザは入出力端末103を操作して、そのアイテムに関連する事項をキーワードとして入力する。例えば、曲名を検索する場合、その曲が使用されているコマーシャルの商品名、ドラマの主題歌に使われているのであればそのドラマ名などである。キーワードは複数指定することが可能である。次にそのキーワードをサーバ101に送る。キーワードを受信したサーバ101内のアイテム検索装置は、そのキーワードでインターネット102上の情報を検索し、その結果をもとにアイテム名候補を求め、その結果を入出力端末103に送る。そのアイテム名候補は入出力端末103に示される。
【0018】
また、入出力端末103の代わりに、インターネットに接続可能なパソコンまたはPDAなどの情報処理端末104を用いることもできる。検索端末を店舗におかずに、オンラインショッピングなどインターネットを経由して検索を行う場合にこのような形態が用いられる。同様にパソコンまたはPDAなどの情報処理端末104からアイテムに関するキーワードを入力し、アイテム検索装置を含むサーバ101へインターネットを介して送信し、アイテム候補をサーバ101からインターネットを介して受信する。なお、入出力端末103やパソコンまたはPDAなどの情報処理端末104はネットワーク上に複数個設けてもよい。
【0019】
また、別のシステム構成として、サーバ101の機能の一部あるいは全部を入出力端末103に備えてもよく、また、アイテム検索装置の一部をパソコンまたはPDAなどの情報処理端末104の内部に備えるようにしてもよい。
【0020】
図2は、この発明の実施の形態1にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。実施の形態1のアイテム検索装置は、URL検索部201と、テキスト抽出部202と、アイテムリスト203と、スコア計数部204と、出力部205とを備えている。
【0021】
URL検索部201は、受信したキーワードをもとにインターネット上のウェブページから得た膨大な情報の中から検索を行い、このキーワードを含むウェブページのURLを複数取得し、それをURLリストとしてテキスト抽出部202に出力するものである。このURL検索部201は既存のインターネット検索エンジン(Google(登録商標)やYahoo!(登録商標)など)の技術を用いて実現することができる。求めるURLの数はあらかじめ設定しておいてもよく、また、ユーザが別途指定できるようにしてもよい。
【0022】
なお、検索効率を高めるために、受信したキーワードに加えて、検索目的に応じた固定のキーワードを含めて検索してもよい。例えば、曲名の検索の場合には「曲」とか、書籍の検索の場合には「本」などである。
【0023】
テキスト抽出部202は、URLリストに従って、順次そのURLアドレスにアクセスを行い、そのページのテキスト情報を獲得(抽出)する。ここで、テキスト情報とは、ウェブページがHTML形式であれば、その中からタグ情報を除いたものを用いることができる。なお、テキスト情報すべてを取得せずに、キーワード周辺のテキスト情報のみを抽出するようにしてもよい。周辺としては、キーワード前後の所定の文字数や単語数を用いることができる。
【0024】
また、周辺のテキストだけでなくタイトルの文字列もテキスト情報に加えてもよい。これはウェブページのタイトルも重要な意味を持っているためである。また、タグ情報のうちタイトル等、内容の構造や属性を示す情報をテキスト情報に残してもよい。このテキスト情報に含まれる構造や属性の情報は、スコアを求める際の重み付けに利用することができる。こうしてテキスト抽出部202は、取得したテキスト情報をスコア計数部204に出力する。
【0025】
なお、その都度URLアドレスにアクセスせずに、あらかじめそのURLの内容をキャッシュに保存しておくこともできる。この場合、インターネット経由でテキスト情報を抽出する代わりにキャッシュの中からテキスト情報を取得すればよい。
【0026】
アイテムリスト203は、候補となりえるアイテム名をリスト状に記憶しておく。これは単純に大量のアイテム名を並べて記憶するだけでもよい。例えば、CDのアルバム名を検索する場合には、候補となりえるすべてのアルバム名をリスト状に記憶しておく。このとき、アルバム名だけでなくアルバムを特定する一意のID番号を付与してもよい。このID番号は結果出力時に、アルバム名のほかにレーベル名、価格等の付加情報を表示するのに利用できる。
【0027】
ここでアイテムとは、CDやDVDなどの音楽作品や映像作品、書籍、ゲーム等のコンテンツや各種の商品などの他、検索の対象となるものを広く含む。したがって、アイテム名はそのアイテムの名称を広く含む。すなわち、アイテム名としては、検索の対象となるアイテムがCD、DVD、書籍、ゲーム等のコンテンツの場合には、そのコンテンツのタイトルをアイテム名として指定することができ、また、例えば、アイテムが電気製品の場合には、その商品名や型番をアイテム名として記憶すればよい。
【0028】
また、同じアイテムであっても何を検索候補にするのかによって、複数のアイテム名の記憶方法がある。例えば、CDというアイテムの検索であっても、アルバム名を出力候補とする場合にはアルバムのタイトルがアイテム名となり、曲名を出力候補とする場合にはCDに含まれる曲名がアイテム名となり、アーチスト名を出力候補とする場合にはアーチストがアイテム名を記憶する。
【0029】
スコア計数部204は、テキスト情報とアイテムリスト203の照合を行い、アイテム名毎に、そのアイテム名がテキスト情報内に出現する数をカウントする。この数をそのアイテムに対するスコアとして出力する。
【0030】
出力部205は、スコアの高いものから順に指定数のアイテム名を出力する。また、アイテム名だけでなく、そのアイテムに関わる情報(例えば、CDのアルバム名の検索の場合には、アルバム名のほかに、アーチスト名、価格、ジャンル、発売日、ジャケットの画像など)をあわせて出力するようにしてもよい。
【0031】
上記URL検索部201、テキスト抽出部202、スコア計数部204、出力部205は、図示を省略するROMやRAM、ハードディスク、着脱可能な記憶媒体に記憶されたプログラムをCPUが実行することによってその機能を実現する。
【0032】
次に、図3はこの発明の実施の形態1にかかるアイテム検索装置の処理の手順を示すフローチャートである。図3のフローチャートにおいて、まず、キーワードを入力する(ステップS301)。ここで、端末とサーバというシステム構成の場合には、サーバは端末からキーワードを受信する。なお、キーワードは複数個をAND条件、OR条件またはNOT条件として指定することが可能である。
【0033】
その後、入力されたキーワードをもとにインターネット上にある膨大なウェブページの情報から検索を行い、そのキーワードを含むウェブページのURLを複数個取得する(ステップS302)。
【0034】
続いて、ステップS302で得たURLにアクセスしてそのウェブページのテキスト情報を取得する(ステップS303)。ここではテキスト全体を取得してもよいし、その中でキーワードが現れる付近のテキストだけを抽出してもよい。なお、URL検索部201にウェブページのテキスト情報を記憶するキャッシュ機能を設ける場合には、インターネットにアクセスすることなく、そのキャッシュデータの記憶手段から読み出すようにすればよい。
【0035】
その後、ステップS302で得たURLリストのすべてのURLのテキスト情報を取得したか否かを判定し(ステップS304)、最後まで取得していないと判定した場合(ステップS304:No)は、ステップS303に戻る。一方、URLリストの最後まで取得したと判定した場合(ステップS304:Yes)は、ステップS305に移行する。
【0036】
続いて、アイテムリスト203からアイテム名を一つずつ読み出し、このアイテム名がステップS303で獲得したテキスト情報中にいくつ含まれるか、その出現数をカウントし、その数をそのアイテムに対するスコアとする(ステップS305)。
【0037】
その後、アイテムリスト203からすべてのアイテム名を読み出したか否かを判定し(ステップS306)、最後まで取得していないと判定した場合(ステップS306:No)は、ステップS305に戻る。一方、アイテムリストからすべてのアイテム名を読み出したと判定した場合(ステップS306:Yes)には、ステップS307へ移行する。
【0038】
なお、アイテム名を一つずつカウントせずに、ハッシュテーブルを用いるなど文字列検索の技術を用いてステップS305、ステップS306の処理を並列的に行い、処理を高速化することも可能である。
【0039】
続いて、スコアの高いものから順にアイテム名を出力し(ステップS307)、一連の処理を終了する。ここで図1に示すようなシステム構成の場合には、入出力端末103やパソコンまたはPDAなどの情報処理端末104にそれらのアイテム名を送信する。
【0040】
なお、アイテム名を出力するだけでなく、そのアイテムに関する付加情報を出力する場合には、アイテムリスト203のアイテムそれぞれに対する付加情報を記憶する手段から該当する付加情報を読み出して、アイテム名とともに出力すればよい。
【0041】
次に、この発明の実施の形態1にかかるアイテム検索装置の入出力画面の例を説明する。入出力画面は、本発明のシステム専用であってもよいし、既存のウェブページ閲覧用のブラウザで行ってもよい。なお、ここではCDのアルバム検索を例にとって説明する。図4は入力画面の例である。ここで、入力ボックス401はキーワードを入力する部分であり、ここに検索したいアイテムに関する様々なキーワードを入力する。複数のキーワードを入力するときは空白やタブなどで区切って入力する。ボタン402は検索を指示するボタンであり、キーワードを入力した後にこの検索ボタンを押すことによって、キーワードがサーバに送られ検索処理が開始される。検索処理後は図5の出力画面に移る。
【0042】
図5は出力画面の例である。ここで出力501には、アイテムの候補がスコアの高い順に表示される。図5のようにアイテム(ここではアルバム名)の表示だけでなく、アイテムに関連する付加情報、例えば、アーチスト名、ジャンル等を同時に表示してもよい。また、アイテムを選択することで、そのアイテムに関する付加情報を表示するようにしてもよい。ボタン502を選択すると、さらに次の順位の候補が表示される。
【0043】
以上説明した実施の形態1によれば、あらかじめ、候補となるアイテム名のリストを用意するだけで、インターネット上に散在する膨大でかつ自動的に日々更新されるウェブページの情報をデータベースとして利用するので、これにより任意のキーワードからアイテムの候補を出力することができる。
【0044】
また、従来のようにサイト内でキーワードのマッチングを行うのではなく、キーワードで検索した情報の中からアイテム名とのマッチングを行う点で異なり、多岐のキーワードから高精度にアイテムを検索できる。
【0045】
また、データベースにサイト内情報を用いるのでなく、インターネットのウェブ情報を用いるため、常に新しい情報から検索が可能になる。
【0046】
なお、図2のテキスト抽出部202でテキスト情報を取得した後で、テキスト情報の形態素解析を行い、あらかじめアイテムに関する品詞(例えば固有名詞や未知語)の部分だけを抜き出してもよい。これにより、スコア計数部204での処理を高速化することができる。
【0047】
また、アイテムリストを分野別(例えば、CDのアルバム検索ならジャンル別、映画の検索なら洋画・邦画など)に用意し、キーワードの指定とともに分野を指定できるようにして、指定のあった分野のアイテムリストに対してだけスコアを求めるようにすることもできる。これにより検索処理の高速化と、より所望の検索結果が得られるようになる。
【0048】
また、検索したいアイテムの属性(例えば、CDのアルバム検索ならジャンルや男性アーチストか女性アーチストなど)を複数指定できる場合は、アイテムリスト全体の中から指定した属性にあてはまるアイテムだけを抜き出して、このアイテムリストの部分集合で検索を行うようにしてもよい。これにより検索処理の高速化と、より所望の検索結果が得られるようになる。
【0049】
(実施の形態2)
さて、以下で説明する実施の形態2では、アイテムの検索を二段階に分割することで、検索処理の高速化を図るものである。例えば、検索するアイテムがCDの曲名である場合、この数はアーチスト名の2桁以上多くなることもある。このような場合には、アーチスト名で一次検索を行うことで処理の高速化を図る。
【0050】
図6は、この発明の実施の形態2にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。図6において、実施の形態2のアイテム検索装置は、URL検索部601、テキスト抽出部602、一次スコア計数部603、一次検索リスト604、アイテムリスト生成部605、属性アイテムリスト606、二次スコア計数部607、出力部608を備えている。
【0051】
URL検索部601およびテキスト抽出部602は、それぞれ実施の形態1のURL検索部201およびテキスト抽出部202と同様であるため、ここではそれらの説明を省略する。
【0052】
一次検索リスト604は、一次の検索候補となる文字列(一次検索候補)をリスト状に記憶しておく。この一次検索候補は、例えば、曲名検索の場合にはアーチスト名、また、書籍の検索の場合には著者名とすることができる。
【0053】
一次スコア計数部603は、テキスト情報と一次検索リスト604の照合を行い、一次検索候補(アーチスト名や著者名)毎に、それらがテキスト情報内に出現する数をカウントする。この数をその一次検索候補に対するスコアとして出力する。
【0054】
属性アイテムリスト606は、アイテムを一次検索候補毎に分類したものである。例えば、曲名検索の場合には、アーチスト毎にそのアーチストの曲名をリスト状に記憶したものである。また、書籍の検索の場合には、著者毎にその人の著作(書籍名)をリスト状に記憶したものである。
【0055】
アイテムリスト生成部605は、一次スコア計数部603の出力から、スコアの高い一次検索候補を一定の数だけ選択し、属性アイテムリスト606から該当する一次検索候補のアイテムを取り出し、それをまとめて一つのアイテムリストとして出力する。
【0056】
二次スコア計数部607は、テキスト情報とアイテムリストの照合を行い、アイテム毎に、そのアイテムがテキスト情報内に出現する数をカウントする。この数をそのアイテムに対するスコアとして出力する。
【0057】
出力部608は、スコアの高いものから順に指定数のアイテムを出力する。また、アイテムだけでなく、そのアイテムに関わる情報(例えば、CDのアルバム名の検索の場合には、アルバム名のほかに、アーチスト名、価格、ジャンル、発売日、ジャケットの画像など)をあわせて出力するようにしてもよい。
【0058】
次に、図7はこの発明の実施の形態2にかかるアイテム検索装置の処理の手順を示すフローチャートである。図7のフローチャートにおいて、ステップS701のキーワード入力からステップS704のURLリストの最後の判定までは、実施の形態1のステップS301からステップS304までと同様であるので、その説明は省略する。
【0059】
ステップS703を繰り返し行ってテキスト情報を取得した後、一次検索リスト604から一次検索候補を一つずつ読み出し、この一次検索候補がステップS703で獲得したテキスト情報中にいくつ含まれるか、その出現数をカウントし、その数をその一次検索候補に対するスコアとする(ステップS705)。
【0060】
その後、一次検索リスト604からすべての一次検索候補を読み出したか否かを判定し(ステップS706)、最後まで取得していないと判定した場合(ステップS706:No)は、ステップS705に戻る。一方、一次検索リスト604からすべての一次検索候補を読み出したと判定した場合(ステップS706:Yes)には、ステップS707へ移行する。
【0061】
続いて、スコア上位の一次検索候補から、アイテムリストを生成する。これには、属性アイテムリスト606を参照し、それぞれの一次検索候補から複数のアイテム名を取得し、これらのアイテム名をまとめて一つのアイテムリストとする(ステップS707)。
【0062】
続いて、ステップS707で生成したアイテムリストからアイテム名を一つずつ読み出し、このアイテム名がステップS703で獲得したテキスト情報中にいくつ含まれるか、その出現数をカウントし、その数をそのアイテムに対するスコアとする(ステップS708)。
【0063】
その後、アイテムリストからすべてのアイテム名を読み出したか否かを判定し(ステップS709)、最後まで取得していないと判定した場合(ステップS709:No)は、ステップS708に戻る。一方、アイテムリストからすべてのアイテム名を読み出したと判定した場合(ステップS709:Yes)には、ステップS710へ移行する。
【0064】
続いて、スコアの高いものから順にアイテム名を出力し(ステップS710)、一連の処理を終了する。ここで図1に示すようなシステム構成の場合には、入出力端末103やパソコンまたはPDAなどの情報処理端末104にそれらのアイテム名を送信する。
【0065】
なお、アイテム名を出力するだけでなく、そのアイテムに関する付加情報を出力する場合には、属性アイテムリスト606のアイテムそれぞれに対する付加情報を記憶する手段から該当する付加情報を読み出して、アイテム名とともに出力すればよい。
【0066】
実施の形態2において、曲名の検索を行う場合には、一次検索候補としてアーチスト名を、アイテム名として曲目を指定すればよい。また、CD等のアルバム名の検索を行う場合には、一次検索候補としてアーチスト名を、アイテム名としてアルバム名を指定すればよい。また、書籍の検索を行う場合には、一次検索候補として著者名を、アイテム名として書籍名を指定すればよい。また、商品の検索を行う場合には、一次検索候補としてメーカ名を、アイテム名として商品名を指定すればよい。
【0067】
この発明の実施の形態2にかかるアイテム検索装置の入出力例は、図4、図5に示した実施の形態1のそれと同様であるので、その説明は省略する。
【0068】
以上説明した実施の形態2によれば、検索を二段階に分割して行うことによって、検索対象のアイテム数が多い場合でも高速に検索処理を行うことができる。
【0069】
なお、図2のスコア計数部204または図6の一次スコア計数部603、二次スコア計数部607において、文字列の完全一致だけでなく、表記のゆらぎを考慮したマッチングを行うようにしてもよい。
【0070】
また、図2のスコア計数部204または図6の一次スコア計数部603、二次スコア計数部607において、一致したアイテム名または一次検索候補が、ウェブページ中のタイトルであった場合のスコアの重みを大きくしてもよい。これにより、より精度の高い検索が可能になる。
【0071】
また、本実施の形態で説明したアイテム検索方法は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【産業上の利用可能性】
【0072】
以上のように、本発明にかかるアイテム検索装置は、所望のアイテムの名称等がわからない状況において、そのアイテムに関する様々なキーワードからそのアイテム名を推定する場合に適している。
【0073】
また、本発明にかかるアイテム検索装置は、レンタルショップにおいて、レンタルされるコンテンツの検索に利用することができる。
【0074】
また、本発明にかかるアイテム検索装置は、レコード店や音楽ダウンロードサイト等において、販売されるコンテンツの検索に利用することができる。
【0075】
また、本発明にかかるアイテム検索装置は、書店において、販売される書籍の検索に利用することができる。
【0076】
また、本発明にかかるアイテム検索装置は、図書館の蔵書検索に利用することができる。
【0077】
また、本発明にかかるアイテム検索装置は、カラオケ店での楽曲の検索に利用することができる。
【0078】
また、本発明にかかるアイテム検索装置は、商店での商品の検索に利用することができる。
【図面の簡単な説明】
【0079】
【図1】この発明の実施の形態1にかかるシステムの全体を示す構成図である。
【図2】この発明の実施の形態1にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。
【図3】この発明の実施の形態1にかかるアイテム検索装置の処理の手順を示すフローチャートである。
【図4】この発明の実施の形態1にかかる入力画面の例を示す説明図である。
【図5】この発明の実施の形態1にかかる出力画面の例を示す説明図である。
【図6】この発明の実施の形態2にかかるアイテム検索装置の構成を機能的に示す機能ブロック図である。
【図7】この発明の実施の形態2にかかるアイテム検索装置の処理の手順を示すフローチャートである。
【符号の説明】
【0080】
101 本発明のアイテム検索装置を含んだサーバ
102 ウェブページを含んだインターネット
103 入出力端末
104 情報処置端末
201 URL検索部
202 テキスト抽出部
203 アイテムリスト
204 スコア計数部
205 出力部
401 キーワードを入力する入力ボックス
402 検索を指示するボタン
501 出力結果表示
502 次選択ボタン
601 URL検索部
602 テキスト抽出部
603 一次スコア計数部
604 一次検索リスト
605 アイテムリスト生成部
606 属性アイテムリスト
607 二次スコア計数部
608 出力部



【特許請求の範囲】
【請求項1】
候補として出力するアイテム名を記憶するアイテムリスト記憶手段と、
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、
前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、
前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト記憶手段に記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数手段と、
前記計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、
を備えたことを特徴とするアイテム検索装置。
【請求項2】
一次検索用の一次検索候補を記憶する一次検索リストを記憶する一時検索リスト記憶手段と、
アイテムを前記一次検索候補毎に分類した属性アイテムリストを記憶する属性アイテムリスト記憶手段と、
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力手段と、
前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、
前記検索手段によって取得されたウェブページの内容において、前記一次検索リスト記憶手段に記憶された一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数手段と、
前記一次スコア計数手段によって計数された数と前記属性アイテムリスト記憶手段に記憶された属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成手段と、
前記検索手段によって取得されたウェブページの内容において、前記アイテムリスト生成手段によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数手段と、
前記二次スコア計数手段によって計数された出現数に基づいてアイテム名を出力する出力手段と、
を備えたことを特徴とするアイテム検索装置。
【請求項3】
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、
前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、
前記検索工程によって取得されたウェブページの内容において、候補として出力するアイテム名を記憶するアイテムリストに記憶されたアイテム名が出現する数を当該アイテム名毎に計数する計数工程と、
前記計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、
を含んだことを特徴とするアイテム検索方法。
【請求項4】
検索を所望するアイテムに関連するキーワードの入力を受け付ける入力工程と、
前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、
前記検索工程によって取得されたウェブページの内容において、一次検索用の一次検索候補が出現する数を当該一次検索候補毎に計数する一次スコア計数工程と、
前記一次スコア計数工程によって計数された数と、アイテムを前記一次検索候補毎に分類した属性アイテムリストとに基づいて候補として出力する可能性のあるアイテム名をリスト化したアイテムリストを生成するアイテムリスト生成工程と、
前記検索工程によって取得されたウェブページの内容において、前記アイテムリスト生成工程によって生成されたアイテムリストに基づいて、前記アイテム名が出現する数を当該アイテム名毎に計数する二次スコア計数工程と、
前記二次スコア計数工程によって計数された出現数に基づいてアイテム名を出力する出力工程と、
を含んだことを特徴とするアイテム検索方法。
【請求項5】
請求項3または4に記載のアイテム検索方法のいずれか一つをコンピュータに実行させることを特徴とするアイテム検索プログラム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2006−85474(P2006−85474A)
【公開日】平成18年3月30日(2006.3.30)
【国際特許分類】
【出願番号】特願2004−270215(P2004−270215)
【出願日】平成16年9月16日(2004.9.16)
【出願人】(300018688)
【Fターム(参考)】