説明

データ生成装置、データの生成方法及びデータ生成プログラム

【課題】ユーザの実体験に基づいて、ユーザの嗜好に合致する商品または店舗を推薦することが可能なデータ生成装置などを提供すること。
【解決手段】データ生成用サーバ装置400は、販売商品毎または店舗サービス毎にユーザによってデータベース300に登録されて記憶されたテキストデータの形式をレビューデータに基づいて、販売商品毎または店舗サービス毎に、類似商品または類似サービスをリストアップし、端末装置100を操作してWebページデータを介して一の販売商品または一の店舗サービスの情報における閲覧要求がされた場合に、当該閲覧要求された販売商品に類似する類似商品または当該閲覧要求された店舗サービスに類似する類似サービスの情報を関連情報としてWebページデータに組み込むための関連情報提供用パーツデータを生成するようになっている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、商品またはサービスの情報提供における技術に関する。
【背景技術】
【0002】
近年、インターネットなどのネットワーク及び携帯用電話機またはパーソナルコンピュータなどの通信端末装置の発達に伴って、webサイトなどの閲覧ページに組み込まれたテキストデータまたは画像データの各種のデータに基づいてユーザの嗜好に合致した商品または店舗を検索することが一般化している(例えば、特許文献1)。特に、最近では、商品の種別、色、機能その他のスペックを示す商品情報、または、提供商品、提供場所などの店舗情報、購買履歴及び他のユーザの定量評価に基づいて、商品または店舗を検索しているユーザに対して当該ユーザの嗜好に合致しているものを予想し、商品または店舗の情報を提供するシステムが知られている(例えば、特許文献2)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−134637号公報
【特許文献2】特開2002−74142号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献2に記載のシステムにあっては、ユーザの特定した商品と、類似性を有する使用感、読後感、味覚、または、ユーザの特定した店舗と、類似性を有する雰囲気、提供される商品(料理)など、ユーザの実体験を基づいた定常的な類似性によって商品または店舗の情報を提供することが難しい。
【0005】
本発明は、上記課題を解決するためになされたものであり、その目的は、ユーザの実体験に基づいて、ユーザの嗜好に合致する商品または店舗を推薦することが可能なデータ生成装置、データの生成方法及びデータ生成プログラムを提供することにある。
【課題を解決するための手段】
【0006】
(1)上記課題を解決するため、本発明のデータ生成装置は、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成装置であって、商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段と、前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段と、前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段と、前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段と、前記商品または前記サービス毎に、前記算出された他の商品または他のサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段と、前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段と、を備える構成を有している。
【0007】
この構成により、本発明のデータ生成装置は、商品の使用者またはサービスの享受者が商品またはサービス(以下、「商品等」という。)に対して記載したレビューデータなどのコメントデータから、各商品等の類似する商品等を特定することができる。すなわち、本発明のデータ生成装置は、類似する商品等においては評価表現と被修飾語のテキストセットが類似するという特性を利用し、例えば、商品等のレビューという、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を特定することができる。
【0008】
したがって、本発明のデータ生成装置は、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。この結果、本発明のデータ生成装置は、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。
【0009】
(2)また、本発明のデータ生成装置は、前記抽出手段が、前記程度表現テキストがリスト化された程度表現辞書データを備えて前記各コメントデータから前記程度表現テキストを抽出するとともに、前記ポイント算出手段が、前記程度表現テキストが抽出されたテキストセットに関しては、前記集計された同一のテキストセットのセット数に、程度表現テキストに基づく所定の値を加算して前記評価ポイントを算出する構成を有している。
【0010】
この構成により、本発明のデータ生成装置は、テキストセットのセット数とともに、例えば、「とても」、「すごく」、「本当」または「かなり」などの程度表現テキストがコメントデータに含まれている場合には、程度表現の有無に基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本発明のデータ生成装置は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。
【0011】
(3)また、本発明のデータ生成装置は、前記程度表現辞書データには、前記程度表現テキストの程度レベルに対応する値が登録されており、前記ポイント算出手段が、前記抽出手段によって前記程度表現テキストが抽出されたテキストセットに関しては、当該テキストセットのセット数に、前記程度表現テキストの程度レベルに対応した値を加算して前記評価ポイントを算出する構成を有している。
【0012】
この構成により、本発明のデータ生成装置は、テキストセットのセット数とともに、例えば、「とても」、「すごく」、「本当」または「かなり」などの程度表現テキストがコメントデータに含まれている場合には、程度表現のレベルに基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本発明のデータ生成装置は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。
【0013】
(4)また、本発明のデータ生成装置は、前記抽出手段が、反意語の有無及び当該反意語がある場合に該当する反意語と対応付けられた評価表現テキストがリスト化された評価表現辞書データを備え、当該評価表現辞書データを用いて前記各コメントデータから前記評価表現テキストを抽出し、前記ポイント算出手段が、前記抽出手段によって前記各コメントデータに含まれる否定表現が検出された場合に、前記評価表現辞書データを参照して前記抽出された評価表現テキストに対する反意語を含むテキストセットのセット数に、所定の値を加算して前記評価ポイントを算出する構成を有している。
【0014】
この構成により、本発明のデータ生成装置は、コメントデータに否定文があった場合には、反意語を含むテキストセットの評価ポイントを変化させることができるので、使用者または享受者の評価を反映させた評価ポイントを的確に算出することができる。したがって、本発明のデータ生成装置は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。
【0015】
(5)また、本発明のデータ生成装置は、前記評価表現辞書データには、肯定的表現テキストまたは否定的表現テキストであることを示す評価極性の情報を有する評価表現テキストがリスト化されており、前記抽出手段が、前記評価表現辞書データを用いて評価極性とともに前記評価表現テキスト及びテキストセットを抽出する構成を有している。
【0016】
この構成により、本発明のデータ生成装置は、コメントデータに否定文があった場合には、反意語を含むテキストセットを的確に抽出することができるので、コメントデータにおける否定文の有無に基づいて各テキストセットの評価ポイントを的確に算出することができる。
【0017】
(6)また、本発明のデータ生成装置は、前記ポイント算出手段が、前記商品毎またはサービス毎に、前記算出された同一の前記被修飾語テキストの評価ポイントを累計するとともに前記否定的な表現を含む評価極性を有する当該同一の被修飾語テキストにおける評価ポイントを否定ポイントとして集計し、前記類似度算出手段が、前記否定ポイントが前記ポイント累計の一定の割合以上である場合には、当該否定ポイントにおける前記被修飾語テキストを含むテキストセットを、類似度算出に関して不使用に設定する、構成を有している。
【0018】
この構成により、本発明のデータ生成装置は、否定的な表現に基づいて類似度を算出せずに、肯定的な表現に基づいて評価ポイントを算出することができるので、否定的な観点によって、特定された商品等に関する情報を提供することを防止することができる。
【0019】
(7)また、上記課題を解決するため、本発明のデータの生成方法は、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータの生成方法であって、商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得工程と、前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出工程と、前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出工程と、前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出工程と、前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定工程と、前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成工程と、を含む構成を有している。
【0020】
この構成により、本発明のデータの生成方法は、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。したがって、本発明のデータの生成方法は、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。
【0021】
(8)また、上記課題を解決するため、本発明のデータの生成方法は、コンピュータによって、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成プログラムであって、前記コンピュータを、商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段、前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段、前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段、前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段、前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段、前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段、として機能させる構成を有している。
【0022】
この構成により、本発明のデータ生成プログラムは、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。したがって、本発明のデータ生成プログラムは、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。
【発明の効果】
【0023】
本発明のデータ生成装置、データの生成方法及びデータ生成プログラムは、ユーザによって一の商品等の情報に対して閲覧要求がされた場合に、当該特定された商品等に関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができる。したがって、本発明は、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。
【図面の簡単な説明】
【0024】
【図1】本発明に係る情商品/サービス情報提供システムの構成を示すシステム構成図である。
【図2】一実施形態におけるレビューデータの登録を説明するための図である。
【図3】一実施形態におけるデータ生成用サーバ装置の構成を示すブロック図である。
【図4】一実施形態の解析処理を説明するための図である。
【図5】一実施形態の評価ポイントの算出処理を説明するための図である。
【図6】一実施形態において、類似度を算出する前の前処理を説明するための図である。
【図7】は、一実施形態の類似度算出処理を説明するための図である。
【図8】は、類似サービスの情報が組み込まれた所定の店舗サービスを提供する店舗のWebページデータの一例である。
【図9】は、一の実施形態のデータ生成用サーバ装置における関連情報提供用パーツデータの生成処理の動作を示すフローチャートである。
【発明を実施するための形態】
【0025】
以下、本発明の各実施形態について、図面を参照しながら説明する。以下に説明する実施形態は、インターネット上において提供されるWorld Wide Web システム(以下、「WWWシステム」という。)などのネットワークを用いて販売商品または店舗サービスの情報の提供を行う商品/サービス情報提供システムに用いられるデータ生成用サーバ装置に、本発明のデータ生成装置、閲覧データ生成方法及びデータ生成プログラムを適用した場合の実施形態である。
【0026】
なお、各実施形態においては、文書または画像の要素データをタグと呼ばれる識別子を用いてリソースデータとして構築されるHTML(Hyper Text Markup Language)またはXML(eXtensible Markup Language)などのマークアップ言語によって形成されたWWWシステム用のリソースデータ(以下、「Webページデータ」または「閲覧データ」という。)を用いて各種の情報提供、データ通信その他の処理が実行される。
【0027】
[商品/サービス情報提供システム]
まず、図1を用いて本実施形態の商品/サービス情報提供システムSの概要構成について説明する。なお、図1は、商品/サービス情報提供システムSの構成を示すシステム構成図である。
【0028】
本実施形態の商品/サービス情報提供システムSは、図1に示すように、ユーザが個々に有する端末装置100に、販売商品の情報(以下、「販売商品情報」という。)またはレストランなどの店舗におけるサービスの情報(以下、「店舗サービス情報」という。)を、閲覧データ(すなわち、Webページデータ)として提供する情報提供用サーバ装置200と、各種のWebページデータ及びWebページデータを構成するための各種のデータ(以下、「パーツデータ」という。)が記憶されるデータベース300と、を有している。また、商品/サービス情報提供システムSは、販売商品情報及び店舗サービス情報における閲覧データの一部のデータであって、端末装置100を介してユーザからの閲覧要求がされた販売商品及び店舗サービスに類似する商品(以下、「類似商品」という。)または類似するサービス(以下、「類似サービス」という。)の情報を提供するためのパーツデータを生成するデータ生成用サーバ装置400と、から構成されている。
【0029】
複数の端末装置100、情報提供用サーバ装置200、データベース300及びデータ生成用サーバ装置400は、インターネットなどのネットワークNにそれぞれ接続され、端末装置100、情報提供用サーバ装置200、データベース300及びデータ生成用サーバ装置400との各種のデータの授受が実行されるようになっている。
【0030】
特に、データ生成用サーバ装置400は、販売商品毎または店舗サービス毎に商品の使用者またはサービスの享受者(以下、単にまとめて「ユーザ」ともいう。)によってデータベース300に登録されて記憶されたテキストデータの形式を有するコメントデータ(いわゆる、レビューデータ)に基づいて、販売商品毎または店舗サービス毎に、類似商品または類似サービスをリストアップするようになっている。そして、データ生成用サーバ装置400は、端末装置100を操作してWebページデータを介して一の販売商品または一の店舗サービスの情報における閲覧要求がされた場合に、当該閲覧要求された販売商品に類似する類似商品または当該閲覧要求された店舗サービスに類似する類似サービスの情報を関連情報としてWebページデータに組み込むためのパーツデータ(以下、「関連情報提供用パーツデータ」という。)を生成するようになっている。
【0031】
また、情報提供用サーバ装置200は、ユーザからのWebページデータの閲覧指示に基づいて、データベース300から該当するWebページデータを読み出すとともに、生成されたパーツデータを当該読み出したWebページデータに組み込みつつ、当該ユーザが使用している端末装置100に閲覧可能に提供するようになっている。なお、情報提供用サーバ装置200は、URL(Uniform Resource Locator)と呼ばれるWebページデータが格納されているアドレス(以下、「URL」という。)によって各Webページデータを管理している。
【0032】
本実施形態においては、このような構成を有することによって、ユーザによって一の販売商品または店舗サービスの情報に対して閲覧要求がされた場合に、当該特定された販売商品または店舗サービスに関する情報を、当該ユーザに対して閲覧可能に提供することができるので、ユーザに対して商品等の選択の幅を広げるための情報を提供すること、または、ユーザの要求に一致する商品等を的確に提供することができるようになっている。したがって、本実施形態においては、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができるようになっている。
【0033】
(端末装置)
次に、本実施形態の端末装置100について説明する。
【0034】
各端末装置100は、例えば、PC(Personal Computer)、PDA(Personal Digital Assistants)または携帯用電話機などの通信端末装置である。また、各端末装置100は、キーボードまたはマウスなどの入力インターフェース、ディスプレイ、CPU及びメモリなどによって構成されている。そして、各端末装置100は、Webページデータなどのリソースデータを読み込んで閲覧するためのアプリケーションプログラム(以下、「ブラウザ」という。)を搭載している。
【0035】
また、各端末装置100は、このブラウザを起動させ、URLを指定することによって、閲覧データとしてWebページデータを取得し、各端末装置100が備えるモニタなどの画面に販売商品情報または店舗サービス情報を表示することができるようになっている。特に、各端末装置100は、Webページデータによって複数の販売商品及び複数の店舗サービスから一の販売商品及び一の店舗サービスにおける情報の閲覧要求を行うと、ブラウザの機能によってWebページデータに組み込まれた該当する他の販売商品(すなわち、類似商品)または該当する他の店舗サービス(すなわち、類似サービス)の情報を閲覧可能に表示することができるようになっている。
【0036】
(情報提供用サーバ装置)
次に、本実施形態の情報提供用サーバ装置200について説明する。
【0037】
情報提供用サーバ装置200は、主にCPU、ROM、RAM及びハードディスクによって構成される。また、この情報提供用サーバ装置200は、所定のアプリケーション上で所定のプログラムが実行されることによって当該情報提供用サーバ装置200における種々の機能を実現するようになっている。
【0038】
情報提供用サーバ装置200は、データベース300と連動しつつ、端末装置100を介してユーザの指示(以下、「ユーザ指示」という。)に基づいて、データベース300に記憶されたWebページデータを閲覧させるためのデータ通信を行うようになっている。特に、情報提供用サーバ装置200は、端末装置100に入力されたユーザ指示に基づいて一の販売商品または一の店舗サービスにおける情報の閲覧要求がされた場合に、当該閲覧要求された販売商品の情報または店舗サービスの情報とともに、これらの類似商品または類似サービスの情報を有するパーツデータが組み込まれたWebページデータを端末装置100に提供するようになっている。
【0039】
(データベース)
次に、図2を用いて本実施形態のデータベース300の構成について説明する。なお、図2は、レビューデータの登録を説明するための図である。
【0040】
データベース300には、本、家電、レジャー用品など商品毎、または、レストラン、バー、美容室などの店舗サービス毎に、URLに対応付けられた商品に関するまたは店舗サービスに関するWebページデータが記録されている。特に、各Webページデータは、URLに対応付けてデータベース300に記録されている。また、類似商品データ及び類似サービスデータには、一以上の商品または一以上の店舗サービスに関する情報が含まれる。
【0041】
具体的には、Webページデータが販売商品に関する場合には、商品ID、商品名称、商品の特性、商品外観その他の商品情報(以下、「一般商品情報」という。)を示すテキストデータ及び画像データと、使用者からの商品を使用した感想などのレビューデータと、類似する商品の情報を提供するための関連情報提供用パーツデータと、が販売商品毎にデータベース300に記録されている。また、Webページデータが店舗サービスに関する場合には、店舗ID、店舗名称、提供サービスのジャンル、店舗外観その他の店舗サービスの情報(以下、「一般サービス情報」という。)を示すテキストデータ及び画像データと、使用者から実際に店舗に来訪した感想などのレビューデータと、類似する店舗サービスの情報を提供するための関連情報提供用パーツデータと、が店舗情報毎にデータベース300に記録されている。
【0042】
例えば、本実施形態においては、店舗サービスに関するレビューデータに関しては、図2(a)及び(b)に示すような、店舗名称などの一般サービス情報10が提示されたWebページデータ20上に端末装置100を介して記載したレビューデータ30を店舗サービス毎に対応付けて記録(登録)されるようになっている。また、図2(a)は、店舗Aに関するレビューデータ30aの登録時のWebページデータ20aを示し、図2(b)は、店舗Bに関するレビューデータ30bの登録時のWebページデータ20bを示す
【0043】
一方、データベース300には、販売商品または店舗サービス毎のテキストセットのデータ、同一テキストセット毎の評価ポイントのデータ、及び、生成された関連情報提供用パーツデータなど、後述する関連情報提供用パーツデータの生成処理に用いられる各種のデータが記憶される。
【0044】
(データ生成用サーバ装置)
1.データ生成用サーバ装置の構成
次に、図3を用いて本実施形態のデータ生成用サーバ装置400の構成について説明する。なお、図3は、本実施形態のデータ生成用サーバ装置400の構成を示すブロック図である。
【0045】
データ生成用サーバ装置400は、関連情報提供用パーツデータを生成すための処理(以下、「関連情報提供用パーツデータの生成処理」ともいう。)を実行するようになっている。具体的には、関連情報提供用パーツデータの生成処理には、
(1)予め定められたタイミングにおいて、登録された商品レビューデータまたは店舗サービスレビューデータを解析する処理(以下、「レビュー解析処理」という。)、
(2)レビュー解析処理の解析結果に基づいて、販売商品または店舗サービス毎に、レビューを登録した商品使用者またはサービス享受者における販売商品または店舗サービスの評価を得点化したポイント(以下、「評価ポイント」という。)を算出する処理(以下、「評価ポイント算出処理」という。)、
(3)算出された販売商品または店舗サービス毎に、該当する評価ポイントに基づいて類似する販売商品または店舗サービスを特定するための類似度を算出する処理(以下、単に「類似度算出処理」という。)、及び
(4)特定された販売商品または店舗商品に基づいて、該当する販売商品または店舗サービスのWebページデータに対応付けて類似商品データまたは類似サービスデータの関連情報提供用パーツデータを生成する処理(以下、単に「パーツデータ生成処理」という。)、
が含まれる。そして、データ生成用サーバ装置400は、レビュー解析処理の解析結果を、算出された各評価ポイントを、及び、生成された関連情報提供用パーツデータを、データとしてデータベース300に記憶するようになっている。
【0046】
データ生成用サーバ装置400は、このような処理を実行するために、図3に示すように、ネットワークNを介してデータ通信を行う通信インターフェース410と、関連情報提供用パーツデータを生成するための上述した種々の処理を行うデータ処理部420と、から構成される。そして、通信インターフェース410及びデータ処理部420は、バスBによって互いに接続され、データの授受が実行されるようになっている。
【0047】
通信インターフェース410は、ネットワークNに接続され、データ処理部420の制御の下に、各端末装置100、データ生成用サーバ装置400及びデータベース300との通信回線を確立し、種々のデータ通信及び当該データ通信に関する通信制御を行う。
【0048】
データ処理部420は、主にCPU、ROM、RAM及びハードディスクによって構成されるコンピュータであって、所定のアプリケーション上で関連情報提供用パーツデータの生成処理のプログラムを実行するようになっている。そして、データ処理部420は、当該プログラムを実行することによってデータ生成用サーバ装置400における種々の機能、すなわち、レビューデータ取得処理、レビュー解析処理、評価ポイント算出処理及び関連情報提供用パーツデータ生成処理を実現するようになっている。例えば、ROMには、データ処理部420の各部を制御するための各種制御情報が記録されるとともに、ハードディスクには、制御プログラムまたはOS(Operating System)などの各種プログラムが記録されている。また、CPUは、ハードディスクに記録されたプログラムを実行することにより、上述の各種の処理を実行し、RAMは、ワークエリアとして用いられる。
【0049】
一方、データ処理部420は、アプリケーションを起動して関連情報提供用パーツデータの生成処理のプログラムを実行することによって、図3に示すように、所定のタイミングで各レビューデータをデータベース300から取得するデータ取得処理部421と、取得した各レビューデータにおけるレビュー解析処理を実行する解析処理部422と、当該解析結果に基づいて、評価ポイント算出処理を実行するポイント算出処理部423と、算出された評価ポイントに基づいて類似算出処理を実行する類似度算出処理部424と、特定された類似商品または類似サービスに基づいて関連情報提供用パーツデータ生成処理を実行するデータ生成処理部425と、を構築するようになっている。
【0050】
なお、例えば、本実施形態のデータ取得処理部421は、本発明の取得手段を構成し、解析処理部422は、本発明の抽出手段を構成する。また、例えば、本実施形態のポイント算出部は、本発明のポイント算出手段を構成し、類似度算出処理部424は、本発明の類似度算出手段を構成する。さらに、例えば、本実施形態のデータ生成処理部425は、本発明の特定手段及び生成手段を構成する。
【0051】
2.データ処理部
次に、上記の図3及び図4〜図8の各図を用いて本実施形態のデータ処理部420における各部の構成及びその動作の詳細について説明する。
【0052】
なお、図4は、本実施形態の解析処理を説明するための図であり、図5は、本実施形態の評価ポイントの算出処理を説明するための図である。また、図6は、類似度を算出する前の前処理を説明するための図であり、図7は、本実施形態の類似度算出処理を説明するための図である。さらに、図8は、類似サービスの情報が組み込まれた所定の店舗サービスを提供する店舗のWebページデータである。
【0053】
データ取得処理部421は、予め定められた時刻となったとき、販売商品または店舗サービスにおける新たなレビューデータが登録されたとき、または、管理者の操作指示を受信したときなど、所定のタイミングに、データベース300からその時点で記憶されている全ての商品レビューデータまたは店舗サービスレビューデータを販売商品毎または店舗サービス毎に取得するようになっている。
【0054】
例えば、データ取得処理部421は、一の店舗サービス(レストランA)については、「料理Aの味はおいしい」、「料理Aはとてもおいしい」、「料理Bの味はおいしくない」、「料理Bはまずい」及び「スープCはまずくない」などのレビューデータをテキストデータとして取得するようになっている。
【0055】
解析処理部422は、取得した各レビューデータに対してそれぞれ形態素解析及び構文解析を実行して評価表現を示す評価表現テキストと当該評価表現テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、程度表現テキストの有無、当該程度表現がある場合にはそのレベル(以下、「程度レベル」という。)及び否定文の有無を検出するようになっている。そして、解析処理部422は、抽出されたテキストセットと検出された各情報を、テキストセット毎に評価表現データとしてデータベース300に記憶するようになっている。
【0056】
具体的には、解析処理部422は、「おいしい」、「高い」、「甘い」、「新しい」、「すっきり」、「べとべと」、「うるさい」その他の名詞、形容詞、形容動詞を含む質や量の対象の値を表す表現、または、感情を表す評価表現などの評価表現テキストがリスト化されたリストデータ(以下、「評価表現辞書データ」ともいう。)を備えている。特に、評価表現辞書データには、肯定的な表現(以下、「ポジティブ表現」ともいう。)及び否定的な表現(以下、「ネガティブ表現」ともいう。)を含むとともに、肯定的または否定的であることを示す評価極性の情報(以下、「極性情報」という。)が含まれる。すなわち、評価表現辞書データには、ポジティブ表現に対応するネガティブ表現またはネガティブ表現に対応するポジティブ表現(以下、単に「反意評価テキスト」という。)が当該評価表現辞書に登録されているか否かを示す極性情報と、当該反意評価テキストが登録されている場合には、その表現テキストに関する情報(以下、「反意評価テキスト情報」という。)が登録されている。
【0057】
なお、例えば、評価表現辞書データにおいては、ポジティブ表現の評価極性情報としては「P」という記号が、ネガティブ表現の評価極性情報としては「N」という記号がそれぞれ登録されている。また、評価表現辞書データにおいては、ポジティブ表現でもネガティブ表現でも無い評価表現テキストについては無極性情報(例えば、「O」を用いる)が登録されている。
【0058】
また、解析処理部422は、評価表現辞書データに基づいて、取得したレビューデータに対して形態素解析及び構文解析を実行し、当該レビューデータから当該評価表現辞書データにある評価表現テキストと一致する語句(テキスト)を抽出するようになっている。また、解析処理部422は、当該一致したテキストがレビューデータ上において係る語句、すなわち、当該テキストがレビューデータ上において修飾する語句(被修飾語テキスト)を検出し、評価表現テキストと被修飾語テキストの組み合わせ(テキストセット)を、極性情報とともに抽出するようになっている。
【0059】
一方、解析処理部422は、「とても」、「すごく」、「本当」、「かなり」その他の評価表現における程度を示す程度表現テキストと、当該程度表現テキストの程度レベルに対応する値がリスト化された程度表現辞書データを備えている。そして、解析処理部422は、取得したレビューデータに対して形態素解析及び構文解析を実行する際に、上記に加えて、程度表現辞書データに基づいて、抽出するテキストセット毎に、該当するレビューデータに程度表現テキストが含まれているか、また、当該程度表現テキストが含まれている場合には、その程度評価テキストを抽出するようになっている。
【0060】
さらに、解析処理部422は、「おいしくない」の場合における「ない」などの評価表現に対して否定を行う助動詞その他の否定表現を検出するようになっている。そして、解析処理部422は、取得したレビューデータに対して形態素解析及び構文解析を実行する際に、上記に加えて、抽出するテキストセット毎に、該当するレビューデータに否定表現テキストが含まれているか、また、当該否定表現テキストが含まれている場合には、当該否定表現が含まれていることを示すフラグ情報(以下、「否定フラグ情報」という。)を各テキストセットに登録するようになっている。
【0061】
解析処理部422は、上記のような構成を有し、例えば、データ取得処理部421によって、上述したような、一の店舗サービスに関するレビューデータが取得された場合には、図4に示すように、被修飾語テキスト(以下、「評価属性」ともいう。)、評価表現テキスト、程度評価テキスト、否定フラグ情報をテキストセット毎に抽出してデータベース300に記憶するようになっている。すなわち、解析処理部422は、上記の各レビューデータを解析することによって、
(1)「料理Aの味はおいしい」のレビューデータ30については、
「味、おいしい(P)、NULL、FALSE」、
(2)「料理Aはとてもおいしい」のレビューデータ30については、
「料理A、おいしい(P)、とても、FALSE」、
(3)「料理Bの味はおいしくない」のレビューデータ30については、
「味、おいしい(P)、NULL、TRUE」、
(4)「料理Bはまずい」のレビューデータ30については、
「料理B、まずい(N)、NULL、FALSE」、及び
(5)「スープCはまずくない」のレビューデータ30については、
「スープC、まずい(N)、NULL、TRUE」
と極性情報、程度表現テキスト及び否定フラグ情報を含んだテキストセット35を抽出し、販売商品毎または店舗サービス毎に抽出したテキストセット35のデータをデータベース300に記憶するようになっている。
【0062】
ポイント算出処理部423は、販売商品毎または店舗サービス毎に、抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、抽出された程度表現テキスト、及び、レビューデータにおける否定文の有無に基づいて同一のテキストセット毎の評価ポイントを調整するようになっている。そして、ポイント算出処理部423は、各評価ポイントを販売商品毎または店舗サービス毎に、かつ、同一のテキストセット毎にデータベース300に記憶するようになっている。
【0063】
具体的には、ポイント算出処理部423は、形態素解析及び構文解析された全てのレビューデータから、以下の処理を実行し、商品毎またはサービス毎に、かつ、同一のテキストセット毎に、評価ポイントを算出し、かつ、調整するようになっている。すなわち、ポイント算出処理部423は、
【0064】
(1)商品毎またはサービス毎に、同一のテキストセットにおけるセット数を集計し、基準となる評価ポイントを算出する処理の実行
(2)集計された同一のテキストセットのセット数(基準の評価ポイント)に、抽出された程度表現テキストに基づく所定の値の加算、及び、
(3)集計された同一のテキストセットのセット数(基準の評価ポイント)にレビューデータにおける否定文の有無に基づく所定の値の加算
を行う各演算を実行し、商品毎またはサービス毎に、かつ、同一のテキストセット毎に、評価ポイントを算出し、かつ、調整するようになっている。
【0065】
特に、ポイント算出処理部423は、程度表現テキストが抽出されたテキストセットであって、否定フラグ情報が「FALSE(無し)」のテキストセットにおける基準の評価ポイントには「1」ポイントと、程度表現辞書データを参照し、当該程度表現辞書データに登録されている対応する値、すなわち、程度表現のレベルに対応する値と、を加算するようになっている。また、ポイント算出処理部423は、程度表現テキストが抽出されなかったテキストセット(すなわち、NULLとなっているテキストセット)であって、否定フラグ情報が「TRUE(有り)」のテキストセットについては、評価表現辞書データを参照し、当該テキストセットの評価表現に対して反意語が評価表現として含まれるテキストセットの評価ポイントに「1」ポイントを加算するようになっている。さらに、ポイント算出処理部423は、程度表現テキストが抽出されたテキストセットであって、否定フラグ情報が「TRUE(有り)」のテキストセットについては、評価表現辞書データを参照し、当該テキストセットの評価表現に対して反意語が評価表現として含まれるテキストセットの評価ポイントに「1」ポイントを加算するとともに、程度表現辞書データを参照し、当該程度表現辞書データに登録されている対応する値、すなわち、程度表現のレベルに対応する値を加算するようになっている。
【0066】
ポイント算出処理部423は、上記のような構成を有することによって、レストランAまたはレストランBについて、評価対象、評価表現、評価極性を有する所定のテキストセットが抽出されている場合には、図5(a)及び(b)に示すように、当該各テキストセットに対応付けて評価ポイントを算出するようになっている。また、図5(a)は、レストランAに関するテキストセット毎の評価ポイントを表として示したものであり、図5(b)は、レストランBに関するテキストセット毎の評価ポイントを表として示したものである。
【0067】
なお、ポイント算出処理部423は、抽出されたテキストセットに反意語のテキストセットが無い場合には、同一の評価対象について反意語を評価表現テキストとしたテキストセットを新たに生成するようになっている。この場合において、ポイント算出処理部423は、基の評価極性情報が「P」の場合には「N」に、「N」の場合には「P」に、または、「O」の場合は、そのまま「O」の評価極性情報を付与するようになっている。また、ポイント算出処理部423は、否定フラグ情報が「TRUE」の場合であって、抽出されたテキストセットに反意語のテキストセットが無く、かつ、評価表現辞書データに反意語が登録されていない場合には、評価表現テキストに「否定」というテキストを付与したテキストセットを新たに生成し、当該新たに生成されたテキストセットに対して評価ポイントを算出するようになっている。この場合においても、ポイント算出処理部423は、基の評価極性情報が「P」の場合には「N」に、「N」の場合には「P」に、または、「O」の場合は、そのまま「O」の評価極性情報を付与するようになっている。
【0068】
類似度算出処理部424は、一の販売商品(以下、「評価商品」ともいう。)毎または一の店舗サービス(以下、「評価サービス」ともいう。)毎に、ネガティブ表現を基準にした類似度の算出を防止するための処理(以下、単に「前処理」という。)を行いつつ、他の各販売商品(以下、「比較対象商品」ともいう。)または他の各店舗サービス(以下、「比較対象サービス」ともいう。)と、テキストセット毎の評価ポイントに基づいて各販売商品または各店舗サービスの評価に対する類似度を算出するようになっている。
【0069】
具体的には、類似度算出処理部424は、前処理としては、図6(a)及び(b)に示すように、評価商品毎または評価サービス毎に、評価ポイントが算出されている各テキストセットにおける同一の被修飾語テキストの評価ポイントを累計するようになっている。また、類似度算出処理部424は、累計された各テキストセットの中からネガティブ表現の評価極性を有する(すなわち、「N」の情報を有する)被修飾語テキストにおける評価ポイントを否定ポイントとして集計するようになっている。そして、類似度算出処理部424は、集計された否定ポイントが累計されたポイント累計の一定の割合以上(例えば、3割以上)である場合には、当該否定ポイントにおける被修飾語テキストを含むテキストセットを、類似度算出に関して不使用に設定するようになっている。
【0070】
なお、図6(a)は、前処理の前のレストランAにおける各テキストセットの評価ポイントを表として示したものであり、図6(b)は、前処理を行った際の各評価対象におけるポイント累計、否定ポイント(以下、「Nポイント」ともいう。)及びその割合(以下、「Nの割合」ともいう。)を表として示したものである。この場合には、例えば、評価対象「接客」については、否定ポイントの割合3割以上であるので、当該被修飾語テキスト(この場合「接客」)を含むテキストセットを、類似度算出に関して不使用に設定するようになっている。
【0071】
一方、類似度算出処理部424は、一の販売商品毎または一の店舗サービス毎に、上記の前処理において使用可能となったテキストセットの評価ポイントに基づいて、各販売商品または各店舗サービスと他の各販売商品または各店舗サービスとの類似度を算出するようになっている。特に、本実施形態においては、類似度算出処理部424は、基準となる一の販売商品または一の店舗サービスと他の販売商品または店舗サービスにおける同一のテキストセット(すなわち、同一の評価表現テキスト及び同一の被修飾語テキスト)の評価ポイントに基づいて、所定の演算処理を実行し、類似度を算出するようになっている。具体的には、類似度算出処理部424は、所定の演算処理としては、(式1)に基づくベクトルの内積及びベクトルの長さを用いたコサイン類似度演算を実行し、各比較商品または各比較サービスと他の比較対象商品または各比較対象サービスとの類似度Zを算出するようになっている
【0072】
Z= (x・y)/(|x||y|) ・・・(式1)
【0073】
例えば、類似度算出処理部424によって、上記の(式1)に基づいて図7(a)に示されるレストランAの評価サービスと、図7(b)に示されるレストランBの比較対象サービスとの類似度Z(レストランA)を算出すると、すなわち、図7(c)に示す評価対象及び評価表現におけるテキストセットをベクトル要素として算出すると、類似度Z{(レストランA)by(レストランB)}は、以下のような値を示す。
【0074】
類似度Z{(レストランA)by(レストランB)} = 0.608648 ・・・(式2)
【0075】
なお、(式1)において、「x」は、評価商品または評価サービスの各テキストセットにおける評価ポイントのベクトル要素から構成されるベクトル、「y」は、他の一の比較対象商品または他の一の比較対象サービスの各テキストセットにおける評価ポイントのベクトル要素から構成されるベクトルを示し、「|x|」は、xベクトルにおけるベクトルの長さ、及び、「|y|」は、yベクトルにけるベクトルの長さを示す。また、(x・y)はベクトルの内積の演算を示す。ただし、ベクトル演算においては、評価ポイントのテキストセットは、評価商品と比較対象商品または評価サービスと比較対象サービスとを合致させるための処理を行ってから、すなわち、評価商品と比較対象商品または評価サービスと比較対象サービスとにおいて同一のテキストセット同士の評価ポイントをベクトルとして合致させてから実行するようになっている。例えば、該当するテキストセットの評価ポイントが存在しない場合には、「0」として該当するベクトル要素を設定して各演算を行うようになっている。さらに、本実施形態においては、類似度Zは、値が高いほど類似度が高くなり、完全一致する場合には、類似度Zは、「1.0」となる。
【0076】
他方、類似度算出処理部424は、販売商品毎または店舗サービス毎に、上述のように算出された各類似度Zをデータベース300に記憶するようになっている。
【0077】
データ生成処理部425は、販売商品または店舗サービス毎に、算出された他の販売商品または店舗サービスとの各類似度に基づいて、当該販売商品(すなわち、評価商品)または店舗サービス(すなわち、評価サービス)と類似する類似商品及び類似サービスを特定するようになっている。そして、データ生成処理部425は、特定された類似商品または類似サービスに関する情報を、評価商品または評価サービスのWebページデータに組み込むための関連情報提供用パーツデータを生成するようになっている。
【0078】
具体的には、データ生成処理部425は、類似商品及び類似サービスの特定にあっては、販売商品または店舗サービス毎に、算出された他の販売商品または店舗サービスとの各類似度の上位(例えば、上位3つ)を類似商品または類似サービスと特定するようになっている。
【0079】
また、データ生成処理部425は、各販売商品または各店舗サービスの情報を提供するWebページデータに、特定された類似商品または類似サービスに関する情報を、組み込むための関連情報提供用パーツデータを生成するようになっている。すなわち、データ生成処理部425は、各販売商品または各店舗サービスの情報の閲覧を要求したユーザに対して、特定された類似商品または類似サービスに関する情報をも閲覧可能に提供するためのWebページデータを生成するようになっている。特に、特定された類似商品または類似サービスに関する情報としては、商品名称、商品の特性、商品外観その他の商品情報を示すテキストデータ及び画像データ、店舗名称、提供サービスのジャンル、店舗外観その他の店舗サービスの情報を示すテキストデータ及び画像データなどの一般情報とともに、類似度を算出した際に用いた各テキストセットと各テキストセットに対応する評価ポイントとから構成される評価情報(以下、「類似評価情報」という。)とが含まれる。
【0080】
例えば、データ生成処理部425は、図8に示すように、店舗Aに関するWebページデータ20の一部に、店舗Aの一般サービス情報10及び評価情報40に関して類似度の高い上位2つの店舗である、店舗Bと店舗Dの一般サービス情報50及び評価情報60を、端末装置100を介して店舗Aの情報について閲覧要求したユーザに対して閲覧可能になるような関連情報提供用パーツデータを生成するようになっている。
【0081】
また、本実施形態においては、データ生成処理部425は、類似商品または類似サービスにおける各類似評価情報には、テキストセットを抽出する際に用いられたレビューデータが参照可能となるための情報が含まれており、図8の店舗Dのように、類似評価における一の評価テキストまたは評価ポイントの何れかを選択指示(すなわち、操作部による該当表示エリアのクリック)を実行すると、レビューデータが閲覧可能になるようなパーツデータ、すなわち、ポップアップ表示70を行うことが可能な関連情報提供用パーツデータを生成するようになっている。
【0082】
なお、データ生成処理部425は、特定された類似商品または類似サービスの一般サービス情報及び評価情報については、各販売商品または各店舗サービスの情報について提供される複数のWebページデータのうち、一のWebページデータに組み込むための関連情報提供用パーツデータを生成するようにしてもよい。
【0083】
(関連情報提供用パーツデータの生成処理)
次に、図9を用いて本実施形態のデータ生成用サーバ装置400における関連情報提供用パーツデータの生成処理の動作について説明する。なお、図9は、本実施形態のデータ生成用サーバ装置400における関連情報提供用パーツデータの生成処理の動作を示すフローチャートである。
【0084】
本動作においては、複数のレビューデータが販売商品毎または店舗サービス毎にデータベース300に既に記録(登録)されているものとする。また、所定のアプリケーションが既に起動され、レビューデータを取得するための処理、レビュー解析処理、評価ポイント算出処理及び関連情報提供用パーツデータ生成処理が実行可能な状態であるものとする。
【0085】
まず、データ取得処理部421が、予め定められた時刻になったとき、データベース300からの通知により新規なレビューデータが登録された旨を通信インターフェース410を介して受信したとき、または、システム管理者の操作指示を受信したときなど、所定のタイミングを検出すると(ステップS101)、当該データ取得処理部421は、データベース300との通信回線を確立して登録されている販売商品毎及び店舗サービス毎の各レビューデータを取得する(ステップS102)。
【0086】
次いで、解析処理部422は、取得した各レビューデータに対してそれぞれ形態素解析及び構文解析を実行してテキストセットを抽出するとともに、程度表現テキストの有無、当該程度表現がある場合にはその程度レベル及び否定文の有無を検出する(ステップS103)。例えば、解析処理部422は、上述したように、図4に示す評価属性、評価表現、程度表現及び否定フラグ情報から構成されるテキストセットを抽出する。なお、解析処理部422は、販売商品毎または店舗サービス毎に抽出したテキストセットのデータをデータベース300に記憶する。
【0087】
次いで、ポイント算出処理部423は、販売商品毎または店舗サービス毎に、抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、抽出された程度表現テキスト、及び、レビューデータにおける否定文の有無に基づいて同一のテキストセット毎の評価ポイントを調整する(ステップS104)。例えば、ポイント算出処理部423は、上述したように、図5に示す販売商品毎または店舗サービス毎の各テキストセットにおける評価ポイントを算出する。なお、ポイント算出処理部423は、各評価ポイントを販売商品毎または店舗サービス毎に、かつ、同一のテキストセット毎にデータベース300に記憶する。
【0088】
次いで、類似度算出処理部424は、類似度を算出するにあたり、一の販売商品毎または一の店舗サービス毎に、ネガティブ表現を基準にした類似度の算出を防止するための前処理を行う(ステップS105)。
【0089】
次いで、類似度算出処理部424は、テキストセット毎に、所定の演算式に基づいて、該当するテキストセットにおける各評価ポイントと他の各販売商品または他の各店舗サービスの評価ポイントとの類似度を算出する(ステップS106)。
【0090】
次いで、データ生成処理部425は、販売商品または店舗サービス毎に、算出された他の販売商品または店舗サービスとの各類似度に基づいて、各販売商品または各店舗サービスと類似する類似商品及び類似サービスを特定する(ステップS107)。例えば、データ生成処理部425は、上述の(式1)によって販売商品または店舗サービス毎に、算出された他の販売商品または他の店舗サービスとの各類似度を算出し、上位3つの類似度を有する他の販売商品または他の店舗サービスを類似商品または類似サービスを特定する。
【0091】
次いで、データ生成処理部425は、特定された類似商品または類似サービスに関する情報を、該当する販売商品または店舗サービスのWebページデータに組み込むための関連情報提供用パーツデータを生成し、生成した関連情報提供用パーツデータをデータベース300に記録する(ステップS108)。
【0092】
なお、販売商品または店舗サービス毎に、関連情報提供用パーツデータが生成されてデータベース300に記録されると、ユーザが端末装置100を介して一の販売商品(すなわち、選択商品)または一の店舗サービス(すなわち、選択サービス)の情報における閲覧要求が行われたときに、特定された類似商品または類似サービスに関する情報が、選択商品または選択サービスとともに当該端末装置100において閲覧可能に提供される。
【0093】
(作用効果)
以上、本実施形態のデータ生成用サーバ装置400は、類似商品または類似サービスにおいては評価表現が類似するという特性を利用し、販売商品または店舗サービスのレビューデータに含まれると想定される各ユーザの実体験に基づいて販売商品または店舗サービス毎に定常的な類似性を有する商品等を特定することができる。したがって、本実施形態のデータ生成用サーバ装置400は、ユーザによって一の販売商品または一の店舗サービスの情報の閲覧要求がされた場合に、当該特定された販売商品または店舗サービスに関する情報を、当該ユーザに対して閲覧可能に提供することができる。すなわち、本実施形態のデータ生成用サーバ装置400は、ユーザに対して販売商品または店舗サービスの選択の幅を広げるための情報を提供し、かつ、ユーザの要求に一致する販売商品または店舗サービスを的確に提供することができるので、効率的にかつ合理的な広告・宣伝及び商品等の情報の提供を行うことができる。
【0094】
本実施形態のデータ生成用サーバ装置400は、程度表現テキストがレビューデータに含まれている場合には、程度表現の有無に基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本実施形態のデータ生成用サーバ装置400は、的確な評価ポイントに基づいて類似商品または類似サービスを特定することができるので、複数のユーザの実体験に基づいて販売商品毎または店舗サービス毎に定常的な類似性を有する商品等を的確に特定することができる。
【0095】
また、本実施形態のデータ生成用サーバ装置400は、テキストセットのセット数とともに、程度表現のレベルに基づいて評価ポイントを算出することができるので、使用者または享受者の商品等の評価レベルを反映させた評価ポイントを的確に算出することができる。したがって、本実施形態のデータ生成用サーバ装置400は、的確な評価ポイントに基づいて類似商品等を特定することができるので、複数のユーザの実体験に基づいて商品等毎に定常的な類似性を有する商品等を的確に特定することができる。
【0096】
本実施形態のデータ生成用サーバ装置400は、レビューデータに否定文があった場合には、反意語を含むテキストセットの評価ポイントが変化させることができるので、使用者または享受者の評価を反映させた評価ポイントを的確に算出することができる。
【0097】
また、本実施形態のデータ生成用サーバ装置400は、レビューデータに否定文があった場合には、反意語を含むテキストセットを的確に抽出することができるので、コメントデータにおける否定文の有無に基づいて各テキストセットの評価ポイントを的確に算出することができる。
【0098】
また、本実施形態のデータ生成用サーバ装置400は、類似度を算出する際に否定的な表現に基づいて類似度を算出せずに、肯定的な表現に基づいて評価ポイントを算出することができるとともに、否定的な観点によって、特定された商品等に関する情報を提供することを防止することができる。
【0099】
(変形例)
次に、本実施形態の商品/サービス情報提供システムSの変形例について説明する。
【0100】
本実施形態においては、類似商品または類似サービスとして特定された販売商品または店舗サービスの情報を提供するため、Webページデータへ組み込むための関連情報提供用パーツデータを生成するようになっているが、特定された販売商品または店舗サービスの情報を提供するためのWebページデータを生成し、当該生成されたWebページデータをURLアドレスによってリンクさせ、当該リンクによって販売商品または店舗サービスの情報を提供するためのWebページデータから閲覧可能に構成するようにしてもよい。
【0101】
本実施形態においては、評価ポイントを算出する際に、程度表現テキストの程度レベルに対応させたポイントをセット数に加算して評価ポイントを算出、すなわち、評価ポイントを調整するようになっているが、程度表現テキストが抽出された場合には該当するテキストセットに一律に所定のポイント(例えば、2ポイント)を加算するようにしてもよい。
【0102】
本実施形態においては、評価ポイントを算出する際に、程度表現テキストの抽出及び否定文の検出の双方に基づいてポイントをセット数に加算して評価ポイントを算出するようになっているが、程度表現テキストの抽出または否定文の検出の何れか一方のみによって評価ポイントを算出する、すなわち、調整するようにしてもよい。
【0103】
本実施形態においては、類似度を算出する前に前処理を実行するようになっているが、当該前処理を実行しなくてもよいし、ネガティブ表現に基づいて類似度を算出することが防止できるものであれば、上記の前処理に限られない。
【産業上の利用可能性】
【0104】
本発明の情報処理システムは、インターネットなどのネットワークNを用いて商品を販売する通信販売システムなどの商品または店舗サービスに関する情報を提供するシステムに適用することができる。
【符号の説明】
【0105】
S … 商品/サービス情報提供システム
100 … 端末装置
200 … 情報提供用サーバ装置
300 … データベース
400 … データ生成用サーバ装置
410 … 通信インターフェース
420 … データ処理部
421 … データ取得処理部
422 … 解析処理部
423 … ポイント算出処理部
424 … 類似度算出処理部
425 … データ生成処理部

【特許請求の範囲】
【請求項1】
ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成装置であって、
商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段と、
前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段と、
前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段と、
前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段と、
前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段と、
前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段と、
を備えることを特徴とするデータ生成装置。
【請求項2】
請求項1に記載のデータ生成装置において、
前記抽出手段が、前記程度表現テキストがリスト化された程度表現辞書データを備えて前記各コメントデータから前記程度表現テキストを抽出するとともに、
前記ポイント算出手段が、前記程度表現テキストが抽出されたテキストセットに関しては、前記集計された同一のテキストセットのセット数に、程度表現テキストに基づく所定の値を加算して前記評価ポイントを算出する、データ生成装置。
【請求項3】
請求項2に記載のデータ生成装置において、
前記程度表現辞書データには、前記程度表現テキストの程度レベルに対応する値が登録されており、
前記ポイント算出手段が、前記抽出手段によって前記程度表現テキストが抽出されたテキストセットに関しては、当該テキストセットのセット数に、前記程度表現テキストの程度レベルに対応した値を加算して前記評価ポイントを算出する、データ生成装置。
【請求項4】
請求項1に記載のデータ生成装置において、
前記抽出手段が、反意語の有無及び当該反意語がある場合に該当する反意語と対応付けられた評価表現テキストがリスト化された評価表現辞書データを備え、当該評価表現辞書データを用いて前記各コメントデータから前記評価表現テキストを抽出し、
前記ポイント算出手段が、前記抽出手段によって前記各コメントデータに含まれる否定表現が検出された場合に、前記評価表現辞書データを参照して前記抽出された評価表現テキストに対する反意語を含むテキストセットのセット数に、所定の値を加算して前記評価ポイントを算出する、データ生成装置。
【請求項5】
請求項4に記載のデータ生成装置において、
前記評価表現辞書データには、肯定的表現テキストまたは否定的表現テキストであることを示す評価極性の情報を有する評価表現テキストがリスト化されており、
前記抽出手段が、前記評価表現辞書データを用いて評価極性とともに前記評価表現テキスト及びテキストセットを抽出する、データ生成装置。
【請求項6】
請求項5に記載のデータ生成装置において、
前記ポイント算出手段が、前記商品毎またはサービス毎に、前記算出された同一の前記被修飾語テキストの評価ポイントを累計するとともに前記否定的な表現を含む評価極性を有する当該同一の被修飾語テキストにおける評価ポイントを否定ポイントとして集計し、
前記類似度算出手段が、前記否定ポイントが前記ポイント累計の一定の割合以上である場合には、当該否定ポイントにおける前記被修飾語テキストを含むテキストセットを、類似度算出に関して不使用に設定する、データ生成装置。
【請求項7】
ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータの生成方法であって、
商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得工程と、
前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出工程と、
前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出工程と、
前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出工程と、
前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定工程と、
前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成工程と、
を含むことを特徴とするデータの生成方法。
【請求項8】
コンピュータによって、ユーザに対して商品またはサービスの情報を閲覧可能に提供するためのデータを生成するデータ生成プログラムであって、
前記コンピュータを、
商品毎またはサービス毎に、当該商品の使用者または当該サービスの享受者によって登録された複数のコメントデータを記憶されているデータベースから取得する取得手段、
前記取得された各コメントデータに対して形態素解析及び構文解析を実行し、前記商品毎または前記サービス毎に、評価表現を示す評価表現テキストと当該テキストが修飾する被修飾語テキストのテキストセットを抽出するとともに、前記コメントデータから前記抽出された評価表現テキストに関する程度表現テキストの抽出、または、前記コメントデータにおける否定文の有無における検出の少なくとも何れか一方を実行する抽出手段、
前記商品毎または前記サービス毎に、前記抽出された各テキストセットにおける同一のテキストセットのセット数を集計して同一のテキストセット毎の評価ポイントを算出するとともに、前記抽出された程度表現テキスト、または、前記コメントデータにおける否定文の有無の少なくとも何れか一方に基づいて同一のテキストセット毎の評価ポイントを調整するポイント算出手段、
前記商品または前記サービス毎に、前記テキストセット毎の評価ポイントに基づいて各商品または各サービスと他の商品または他のサービスとのユーザの評価に対する類似度を算出する類似度算出手段、
前記商品または前記サービス毎に、前記算出された他の商品またはサービスとの類似度に基づいて、当該商品または当該サービスと類似する類似商品及び類似サービスを特定する特定手段、
前記ユーザによって一の商品または一のサービスの情報に対して閲覧要求がされた場合に、前記特定された類似商品または類似サービスに関する情報を、当該ユーザに対して閲覧可能に提供するためのデータを生成する生成手段、
として機能させることを特徴とするデータ生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate