説明

情報処理システム、情報処理装置及びプログラム

【課題】ユーザの個人情報を保護しつつ、個人情報保護のための特別な操作をユーザに行わせることなく、ユーザの興味関心を精度良く推定できるようにする。
【解決手段】クライアント装置と、要求に応じてデータを送信するサーバ装置と、を含んで構成される情報処理システムであって、サーバ装置は、ネットワーク上のデータを用いて該データに出現する形態素とその概念との関連性を表す全体概念関連情報を生成してクライアント装置に送信し、クライアント装置から受信した概念と関連のあるデータ群をクライアント装置に送信し、クライアント装置は、自装置で操作されたデータを用いて該データに出現する形態素とその概念との関連性を表す個人概念関連情報を生成し、個人概念関連情報と全体概念関連情報との比較結果に基づいてユーザの興味関心を推定し、サーバ装置に対してデータ取得要求と興味関心に対応する概念を送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理装置及びプログラムに関し、特に、例えばウェブ閲覧履歴等のインターネット上の行動履歴情報(端末利用履歴)から推定したユーザの興味関心に関連する広告を提供するシステムに好ましく適用される技術に関するものである。
【背景技術】
【0002】
従来、インターネットが普及するまでは、ポスターやパンフレット、さらに様々なテレビ、新聞、雑誌等のマスメディアを利用した広告やPR等によって、企業が消費者に提供する商品やサービスの宣伝広告が行われていた(マスマーケティング)。そして、このようなマスマーケティングは、実際にその商品等に対してニーズや興味を持たず結果として購買行動を起こさない消費者に対しても非選択的に宣伝広告が打たれることが普通であった。このため、これらの宣伝広告にかかるコストは莫大なものとなり、また膨大なコストをかけて行った宣伝広告が売上げに結びつきにくく非効率であった。
【0003】
しかし、現在では、インターネットの普及及び高度な情報技術の進展により、これまで実質的には不可能であった消費者の嗜好、興味、購買履歴等を、コンピュータとネットワークを通じて収集し分析することが可能となった。これにより、消費者層化や消費者ターゲティング等を行って宣伝広告の対象を絞り込むことができ、嗜好や興味が合致する商品等の宣伝広告を特定の消費者に対して効果的に行うことができるようになった(ダイレクトマーケティング)。このようなダイレクトマーケティングは、消費者が必要とし、興味を持ち、消費者の嗜好にマッチし、消費者が購買意欲を持っている商品等が提供されるため、消費者にとってもメリットが大きいといえる。
【0004】
インターネットを活用したダイレクトマーケティングとしては、消費者が閲覧したウェブページやコンテンツのカテゴリを記憶し、消費者のプロファイル(嗜好・趣味)を推測して、消費者が今見ているウェブページに消費者の趣味や嗜好に合致する広告を表示する、コンテキスト広告と呼ばれるものがその一例である。また、インターネットを活用したダイレクトマーケティングでは、消費者のより細やかなニーズを満たす商品等を提供するために、例えばクッキーやアドウェア等の個人情報収集技術を利用して消費者のインターネット上の行動履歴情報(ウェブ閲覧履歴、メール送受信履歴、SNS(Social Networking Site)送信閲覧履歴等)を収集、蓄積し、また、自社製品に興味を持つ消費者に自社ホームページ等を通じて個人情報を登録させて、取得した個人情報等を用いて商品等の宣伝広告を行う場合が多い。
【0005】
ところで、例えば特許文献1には、プライバシーを保護しつつユーザの生活履歴に対応した適切な広告を配信できるようにする技術が開示されている。当該技術では、ユーザ端末は、ユーザの生活履歴を公開生活履歴情報と非公開生活履歴情報とに分離し、公開生活履歴情報のみ広告配信サーバに提供する。そして、広告配信サーバで、公開生活履歴情報を広告配信条件に含む広告データを選別する。また、広告配信サーバは、非公開生活履歴情報に対応する所定の広告配信条件と関連の強い公開生活履歴情報を推定し、推定された公開生活履歴情報を広告配信条件に含む広告データを優先的に配信する。ユーザ端末は、広告データをダウンロードすると、非公開生活履歴情報と広告データとを照合し、非公開生活履歴情報と合致する広告データを表示する。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2010−123011号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
確かに、消費者に対してより細やかなニーズを満たす商品等を効果的に提供するには、消費者の個人情報やインターネット上の行動履歴情報といった消費者に関する多くの詳細な情報が必要である。一方で、昨今におけるプライバシー保護の高まりや社会問題となっている個人情報の漏洩事件を考慮すると、これらの消費者に関する詳細な情報は慎重に取り扱われなければならない。例えばクッキーやアドウェア等の個人情報収集技術によって収集する個人情報は、ほとんどの場合個人の了解を得て情報収集を行っておらず、今後プライバシー保護の観点から問題となる可能性がある。つまり、広告配信側は、個人情報を入手すると、その情報の厳重な管理を行わなければならず、多大な管理コストが必要となる。
【0008】
プライバシー保護の方法としてはいくつかあるが、特許文献1で開示された発明ではユーザが許諾した個人情報のみ公開するようにしている。つまり、ユーザの個人情報(生活履歴情報)を公開情報(公開させてもよい情報)と非公開情報(公開させない情報)とに分離し、公開情報のみ広告配信側に公開している。しかし、ユーザの個人情報としてのインターネット上の行動履歴情報は、どのようなウェブサイトを閲覧したのか(ウェブサイトにどのようなキーワードが含まれているか)、どのような内容でメール送受信を行ったのか(メールにどのようなキーワードが含まれるか)といった情報であり、これらの情報をユーザ側で公開情報と非公開情報とに分離するのは非常に困難で現実的とはいえない。
【0009】
他方、プライバシー保護の他の方法としては、公開する個人情報を、そのユーザをピンポイントで特定できない程度の情報とすることが考えられる。例えば、不祥事を起こしたスポーツ選手のファンがインターネット上でその選手の情報を検索する場合、その不祥事の発覚前と発覚後とでは検索するユーザの数が全く異なる。同一キーワード(例えばその選手の名前)を用いたとき不祥事の発覚前に検索した場合の方がよりそのファンを特定でき、その傾向はその選手が有名でないほど顕著である。これに対して、キーワードがその選手のプレイするスポーツ名(野球、サッカー等)やその選手のチーム名の場合には、選手の名前を用いて検索するよりもユーザを特定することが困難になる(スポーツ名やチーム名を使って検索するユーザ数の方が多い)。このように、ユーザ側で持っているインターネット上の行動履歴情報を、そのユーザをピンポイントで特定できない程度の情報とすることはプライバシー保護の方法としては有効であり、さらに、この処理はユーザ側でなく装置やシステムの側で行うようにすることがユーザビリティの観点で好ましい。
【0010】
そこで、本発明は、ネットワークに接続される情報処理装置のユーザの個人情報を保護しつつ、該ユーザに個人情報保護のための特別な操作を行わせることなく、該ユーザの興味関心を精度良く推定できるようにすることを目的とする。
【課題を解決するための手段】
【0011】
本発明の一側面である情報処理システムは、クライアント装置と、クライアント装置からの要求に応じて該クライアント装置へデータを送信するサーバ装置と、を含んで構成される情報処理システムであって、サーバ装置は、ネットワーク上のデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す全体概念関連情報を生成してクライアント装置に送信し、クライアント装置から受信した概念と関連のあるデータ群をクライアント装置に送信し、クライアント装置は、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成し、個人概念関連情報と全体概念関連情報との比較結果に基づいてユーザの興味関心を推定し、サーバ装置に対してデータ取得要求とともに興味関心に対応する概念を送信する。
【0012】
また、上記情報処理システムにおいて、クライアント装置は、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成する個人概念関連情報生成手段と、個人概念関連情報生成手段により生成された個人概念関連情報とサーバ装置から受信した全体概念関連情報とを比較し、ユーザ個人の興味関心に関する特徴量を抽出する個人特徴量抽出手段と、個人特徴量抽出手段により抽出された特徴量に基づいて、個人概念関連情報における概念をユーザの興味関心に対応する概念としてサーバ装置に送信し、送信した概念と関連する形態素が出現するデータ群をサーバ装置から受信するデータ取得手段と、データ取得手段により受信されたデータ群から、個人概念関連情報生成手段により生成された個人概念関連情報における概念と関連のあるデータを選択するデータ選択手段と、を有するものであってもよい。
【0013】
本発明の一側面である情報処理装置は、ネットワーク上のデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す全体概念関連情報を生成するサーバ装置から全体概念関連情報を受信し、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成し、個人概念関連情報と全体概念関連情報との比較結果に基づいてユーザの興味関心を推定し、サーバ装置に対してデータ取得要求とともに興味関心に対応する概念を送信して該概念と関連のあるデータ群を前記サーバ装置から受信する。
【0014】
また、上記情報処理装置において、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成する個人概念関連情報生成手段と、個人概念関連情報生成手段により生成された個人概念関連情報とサーバ装置から受信した全体概念関連情報とを比較し、ユーザ個人の興味関心に関する特徴量を抽出する個人特徴量抽出手段と、個人特徴量抽出手段により抽出された特徴量に基づいて、個人概念関連情報における概念をユーザの興味関心に対応する概念としてサーバ装置に送信し、送信した概念と関連する形態素が出現するデータをサーバ装置から受信するデータ取得手段と、データ取得手段により受信されたデータ群から、個人概念関連情報生成手段により生成された個人概念関連情報における概念と関連のあるデータを選択するデータ選択手段と、を有するものであってもよい。
【0015】
本発明の一側面であるプログラムは、ネットワークを介してサーバ装置からデータを取得する情報処理装置に用いられるプログラムであって、ネットワーク上のデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す全体概念関連情報を生成するサーバ装置から全体概念関連情報を受信し、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成し、個人概念関連情報と全体概念関連情報との比較結果に基づいてユーザの興味関心を推定し、サーバ装置に対してデータ取得要求とともに興味関心に対応する概念を送信して該概念と関連のあるデータ群をサーバ装置から受信する処理を前記情報処理装置に実行させる。
【0016】
また、上記プログラムにおいて、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成する個人概念関連情報生成処理と、個人概念関連情報生成処理により生成された個人概念関連情報とサーバ装置から受信した全体概念関連情報とを比較し、ユーザ個人の興味関心に関する特徴量を抽出する個人特徴量抽出処理と、個人特徴量抽出処理により抽出された特徴量に基づいて、個人概念関連情報における概念をユーザの興味関心に対応する概念としてサーバ装置に送信し、送信した概念と関連する形態素が出現するデータをサーバ装置から受信するデータ取得処理と、データ取得処理により受信されたデータ群から、個人概念関連情報生成処理により生成された個人概念関連情報における概念と関連のあるデータを選択するデータ選択処理と、をコンピュータに実行させるものであってもよい。
【発明の効果】
【0017】
本発明によれば、ネットワークに接続される情報処理装置のユーザの個人情報を保護しつつ、該ユーザに個人情報保護のための特別な操作を行わせることなく、該ユーザの興味関心を精度良く推定することが可能となる。
【図面の簡単な説明】
【0018】
【図1】本発明の実施形態に係る広告提供システムのシステム構成を示した図である。
【図2】本発明の実施形態に係るクライアント装置の機能構成を示した図である。
【図3】本発明の実施形態に係るサーバ装置の機能構成を示した図である。
【図4】本発明の実施形態に係る概念関連情報の例を示した図である。
【図5】本発明の実施形態に係る広告情報の例を示した図である。
【図6】本発明の実施形態に係る概念関連情報の概念図を示した図である。
【図7】本発明の実施形態に係る広告提供の処理の流れを示した図である。
【図8】本発明の実施形態に係る個人特徴量抽出及び上位概念化を説明するための図である。
【発明を実施するための形態】
【0019】
以下、本発明の実施形態について図面を参照して説明する。なお、本発明の好適な実施形態として広告提供システムを挙げるが、本発明はこれに限定されることなく、情報検索システム等の情報処理システムに適用することも可能である。
【0020】
はじめに、構成について述べる。図1は、本発明の実施形態に係る広告提供システムのシステム構成を示した図である。当該システムは、図1に示すように、クライアント装置1、サーバ装置2、広告DB3を含んで構成され、クライアント装置1とサーバ装置2とがネットワーク5を介して接続されている。
【0021】
クライアント装置1は、一般的なPC等の装置で、ウェブブラウザを備えた情報処理装置である。また、クライアント装置1は、ネットワーク5を介してインターネット接続し、種々のウェブページを画面表示することができる。クライアント装置1は、CPU、メモリ、入出力装置等を有する一般的な情報処理装置で、CPUがメモリに格納された制御プログラムに従って装置全体の制御を行うとともに、専用プログラムを読み込んで、後述する本実施形態特有の広告提供処理をサーバ装置2との間で行う(広告を提供(配信)するのはサーバ装置2であり、クライアント装置1はユーザ個人情報(閲覧履歴情報等)の送信、広告の取得・選択・表示を行う)。
【0022】
クライアント装置1は、CPUがメモリに格納された専用プログラムを読み込むことで、図2に示すような、個人概念関連情報生成手段110、個人特徴量抽出手段120、広告情報取得手段130、広告情報選択手段140、広告表示手段150、を論理的に有する制御部100を主記憶上に構成する。
【0023】
個人概念関連情報生成手段110は、自装置で操作されたデータ(閲覧履歴のあるウェブサイト、送受信履歴のあるメール、送信閲覧履歴のあるSNS(Social Networking Site)等)を用いて、該データに出現する形態素と該形態素の概念との関連性を示す個人概念関連情報を生成する。個人概念関連情報は、ユーザが注目している単語とその概念を表している。なお、操作履歴のあるデータ中に含まれる形態素の抽出は、公知の方法で行うことが可能である。すなわち、公知の形態素解析ツールを用いて、該データ中について単語に分解し、特に名詞を抽出する処理を行う。このような形態素解析ツールでは、対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付き単語リスト)を情報源として用いて、自然言語で書かれた文を形態素(言語で意味を持つ最小単位、いわば単語)の列に分解する。名詞を抜き出すのは、ユーザの興味関心を分析するのに必要十分なためである(形態素の抽出については、後述する全体概念関連情報生成手段210も同様)。
【0024】
概念関連情報の例を図4に示す。形態素はユーザの操作したデータ(ウェブサイト、メール、SNS等)中に出現した単語であり、概念は形態素の総括的な意味内容である。例えば形態素「ID番号」はその概念が「識別情報」であり、また形態素「アカウント」はその概念の一つが「識別情報」である。また、例えば形態素「アカウント」は複数の概念「勘定書」、「取引先」、「識別情報」を持つ。このように、形態素と概念は一対一で対応するもの、一対多で対応するもの、多対一で対応するもの、多対多で対応するものがある。他方で、概念は図6に示すように階層性を持つ。
【0025】
個人特徴量抽出手段120は、個人概念関連情報生成手段110で生成した個人概念関連情報とサーバ装置2から受信した全体概念関連情報とを比較し、ユーザの興味関心に関する特徴量を抽出する。具体的には、全体概念関連情報中の概念(世間一般で注目されている事柄等)に対するユーザの興味の強弱、概念間の関連性の強弱、個人概念関連情報と全体概念関連情報における同一概念の注目度の違い等をユーザ個人の特徴量として抽出する。
【0026】
広告情報取得手段130は、個人特徴量抽出手段120で抽出された特徴量に基づいて、個人概念関連情報における概念をユーザの興味関心に対応する概念としてサーバ装置2に送信する。ここで、ある概念について個人概念関連情報における注目度が全体概念関連情報における注目度より高い(個人概念関連情報における形態素の出現頻度が全体概念関連情報における形態素(同一のもの)の出現頻度より大きい)場合に、その概念を上位概念化する。また、広告情報取得手段130は、送信した概念と関連する形態素が出現している広告の電子データ(以下、広告という)群をサーバ装置2から受信する。
【0027】
広告情報選択手段140は、広告情報取得手段130で受信した広告群から、個人概念関連情報生成で生成された個人概念関連情報(上位概念化前のもの)中の概念と関連のある広告を選択する。当該概念と関連のある広告としては、配信条件(図5参照)が同一の概念である広告や、個人概念関連情報(上位概念化前のもの)中の形態素が出現している広告が挙げられる。
【0028】
広告表示手段150は、広告情報選択手段140で選択された広告の画面表示を行う。
【0029】
サーバ装置2は、広告DB3から広告を取得してクライアント装置1に提供する装置で、広告情報を保持する広告DB3を管理するとともに、クライアント装置からのウェブ閲覧要求に応じてウェブページを送信するウェブサーバ機能を備える。サーバ装置2は、CPU、メモリ、入出力装置等を有する一般的な情報処理装置で構成してもよく、CPUがメモリに格納された制御プログラムに従って装置全体の制御を行うとともに、専用プログラムを読み込んで、後述する本実施形態特有の広告提供処理をクライアント装置1との間で行う。
【0030】
サーバ装置2は、CPUがメモリに格納された専用プログラムを読み込むことで、図3に示すような、全体概念関連情報生成手段210、全体概念関連情報送信手段220、広告情報送信手段230、を論理的に有する制御部200を主記憶上に構成する。
【0031】
全体概念関連情報生成手段210は、ネットワーク上のデータ(ウェブサイト等)を用いて、該データに出現する形態素と該形態素の概念との関連性を示す全体概念関連情報を生成する。全体概念関連情報は、世間一般で注目されている単語とその概念を表している。
【0032】
全体概念関連情報送信手段220は、全体概念関連情報生成手段210で生成した全体概念関連情報をクライアント装置1からの取得要求に応じて送信する。取得要求の都度、全体概念関連情報を全部送信してもよいし、前回送信分との差分のみ送信するようにしてもよい。後者の場合、実行効率が高くなり好適である。
【0033】
広告情報送信手段230は、クライアント装置1(広告情報取得手段130)から受信した概念が配信条件となっている広告を広告DB3から検索、抽出し、クライアント装置1に送信する。
【0034】
広告DB3は、広告情報を保持するデータベースで、例えばHDD等の記憶装置に保持される。広告情報は、例えば図5に示すように、所定の条件項目(サーバ装置2が検索、抽出する場合は広告を提供(配信)する条件の項目、広告情報選択手段140が選択する場合は広告を表示する条件の項目)とウェブページ等の広告とが関連付けられて保持される。なお、広告情報の登録、更新、削除は、本実施形態ではサーバ装置2により行われるが、サーバ装置2とは別の外部装置(広告DB3を管理する情報処理装置)により行うようにしてもよい。
【0035】
続いて、本実施形態の広告提供システムにおける広告提供処理について説明する。
【0036】
図7は、本実施形態における広告提供処理の流れを示した図である。まず、サーバ装置2において、全体概念関連情報生成手段210が全体概念関連情報を生成する(S101)。サーバ装置2による全体概念関連情報の生成は所定にタイミングで行う。
【0037】
次に、クライアント装置1において、個人概念関連情報姿勢手段110が個人概念関連情報を生成する(S102)。そして、サーバ装置2に対して、全体概念関連情報の取得要求を送信する(S103)。クライアント装置1による個人概念関連情報の生成や全体概念関連情報の取得要求送信は、ネットワーク接続をトリガとして行うように構成してもよいし、一定にタイミングで行うように構成してもよい。
【0038】
サーバ装置2では、クライアント装置1からの全体概念関連情報の取得要求を受信し(S104)、全体概念関連情報送信手段220が最新の全体概念関連情報をクライアント装置1に送信する(S105)。クライアント装置1では、サーバ装置2からの全体概念関連情報を受信する(S106)。
【0039】
続いて、クライアント装置1において、個人特徴量抽出手段120が個人概念関連情報と全体概念関連情報とを比較し、ユーザの個人特徴量を抽出する(S107)。そして、広告情報取得手段130は、個人特徴量抽出手段120で抽出した個人特徴量に基づいて、必要に応じて、個人概念関連情報生成手段110で生成した個人概念関連情報中の概念について調整(上位概念化)を行う(S108)。
【0040】
個人概念関連情報中の概念の調整(上位概念化)について図8を参照しながら説明する。図8(a)はプロ野球選手Aの不祥事が発覚する前の両概念関連情報の比較を表し、図8(b)は不祥事発覚後の両概念関連情報の比較を表している。ここで、図8中の概念関連情報は、各生成手段110及び210で生成するデータを用いて求められるもので、データ中の形態素(キーワード)、そのランキング、そのTFIDF値(TFIDF法で求められる文書の特徴ベクトル(評価値))からなる。なお、図8では、一時点のTFIDF値としているが、過去のTFIDF値を保持しておいて、現在及び過去のTFIDF値から求めた変動率をさらに用いるようにしてもよく、この場合、ユーザの興味関心の測定をより高い精度で行うことが可能である。
【0041】
図8(a)の時点において、個人概念関連情報からわかるようにユーザが着目しているのはプロ野球選手Aや球団キングス(Aの所属球団)であり、このユーザはプロ野球選手Aや球団キングスの熱狂的ファンである。一方、トレンド(世間一般)では、「スマートフォン」、「アイドル」、「就職活動」が上位3つを占めており、図示していないが、プロ野球選手Aや球団キングスは1000位以内にランクインしていない。つまり、世間一般では、プロ野球選手Aや球団キングスに対する注目度は低いということがわかる。
【0042】
プロ野球選手Aの不祥事が発覚する前の時点で個人概念関連情報と全体概念関連情報とを比較すると、「A」と「キングス」のランキング、TFIDF値ともに、個人概念関連情報の方が高く、ユーザが世間一般より注目している用語・概念と判断できる。ここで「A」と「キングス」をサーバ装置2に送信すると、サーバ側においてユーザが世間一般より「A」と「キングス」に注目しているということを特定できる可能性が高くなる(世間一般で「A」と「キングス」を検索ワードとして使っている者が極端に少なければ、「A」と「キングス」に着目しているユーザが上記ユーザと特定しやすくなる)。つまり、このユーザがプロ野球選手Aや球団キングスの熱狂的ファンであるというプライベートな情報がネットワーク上に流れてしまうのと同じような状況となる。
【0043】
この事態を回避するため本実施形態では上位概念化を行う。すなわち、個人概念関連情報中の概念の注目度が全体概念関連情報中の概念(前者と同一のもの)の注目度より高い場合に、個人概念関連情報中のその概念について上位概念化を行う。図8(a)の例では、「A」と「キングス」について上位概念化して例えば「野球」とする(図6参照)。これらの上位概念化を行った概念をユーザの興味関心のある概念としてサーバ装置2に送信する。
【0044】
他方、図8(b)の時点では、全体概念関連情報からわかるように世間一般では「A」、「キングス」、「不祥事」が上位3つを占めており、プロ野球選手Aが起こした不祥事に関心を寄せているのがわかる(世間が注目しているのは、プロ野球選手Aや球団キングスというよりむしろ不祥事である)。ユーザが着目しているのも同様にプロ野球選手Aや球団キングスであるが、実際はプロ野球選手Aや球団キングスの熱狂的ファンである。
【0045】
プロ野球選手Aの不祥事発覚後の時点で個人概念関連情報と全体概念関連情報とを比較すると、「A」と「キングス」のランキングは両概念関連情報で同じだが、TFIDF値が個人概念関連情報の方が低く、ユーザが世間一般並に注目している用語・概念と判断できる。ここで「A」と「キングス」をサーバ装置2に送信したとしても、サーバ側においてそのユーザが特に「A」と「キングス」に注目しているということを特定できる可能性は低い(世間一般で「A」と「キングス」を検索ワードとして使っている者が非常に多く、上記ユーザはそれらのうちの一人と見なされやすくなる)。つまり、図8(a)の場合のような事態とはならないため、概念の調整(上位概念化)を行う必要性はなく、個人概念関連情報生成手段110で生成された個人概念関連情報の概念をユーザの興味関心のある概念としてサーバ装置2に送信する。「不祥事」は、ユーザ側着目度が世間一般より低いため、その語を含まないデータを優先的に提示するようにクライアント側でデータを間引いてもよい。
【0046】
上述した上位概念化は、包含関係にある概念をユーザに提示し、プライバシー保護のレベルをユーザ自身に選択させるように構成してもよい。
【0047】
図7に戻って説明すると、クライアント装置1において、広告情報取得手段130が調整(上位概念化)後の個人概念関連情報、広告取得要求をサーバ装置2に送信する(S109)。
【0048】
サーバ装置2では、クライアント装置1からの個人概念関連情報(調整後)と広告取得要求を受信する(S110)。そして、広告情報送信手段230は、クライアント装置1から受信した概念を用いて広告DB3を検索し、該概念と合致する配信条件を持つ広告を抽出する(S111)。そして、抽出した広告群をクライアント装置1に表示させる候補群として送信する(S112)。
【0049】
クライアント装置1では、サーバ装置2からの広告群を受信する(S113)。そして、広告情報選択手段140は、受信した広告群の中から、調整(上位概念化)前の個人概念関連情報中の概念と配信条件が一致する広告を選択し(S114)、広告表示手段150は、広告情報選択手段140が選択した広告を画面表示する(S115)。
【0050】
なお、上述する実施形態は、本発明の好適な実施形態であり、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。
【0051】
すなわち、本実施形態におけるクライアント装置1で実行されるプログラムは、先に述べた各手段(個人概念関連情報生成手段110、個人特徴量抽出手段120、広告情報取得手段130、広告情報選択手段140、広告表示手段150)を含むモジュール構成となっており、実際のハードウエアを用いて具体的手段を実現する。すなわち、コンピュータ(CPU)が所定の記録媒体からプログラムを読み出して実行することにより上記各手段が主記憶装置上にロードされて生成される。
【0052】
本実施形態におけるクライアント装置1で実行されるプログラムは、インターネット等のネットワークに接続されたコンピュータ上に格納され、ネットワーク経由でダウンロードさせることにより提供されるように構成してもよい。また、上記プログラムをインターネット等のネットワーク経由で提供あるいは配布するように構成してもよい。
【0053】
また、上記プログラムは、インストール可能な形式又は実行可能な形式のファイルで、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD、不揮発性のメモリカード等のコンピュータで読み取り可能な記録媒体に記録されて提供されるように構成してもよい。また、上記プログラムは、ROM等にあらかじめ組み込んで提供するように構成してもよい。
【0054】
この場合、上記記録媒体から読み出された又は通信回線を通じてロードし実行されたプログラムコード自体が前述の実施形態の機能を実現することになる。そして、そのプログラムコードを記録した記録媒体は本発明を構成する。
【符号の説明】
【0055】
1 クライアント装置
2 サーバ装置
3 広告DB
5 ネットワーク
100,200 制御部
110 個人概念関連情報生成手段
120 個人特徴量抽出手段
130 広告情報取得手段
140 広告情報選択手段
150 広告表示手段
210 全体概念関連情報生成手段
220 全体概念関連情報送信手段
230 広告情報送信手段

【特許請求の範囲】
【請求項1】
クライアント装置と、前記クライアント装置からの要求に応じて該クライアント装置へデータを送信するサーバ装置と、を含んで構成される情報処理システムであって、
前記サーバ装置は、ネットワーク上のデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す全体概念関連情報を生成して前記クライアント装置に送信し、前記クライアント装置から受信した概念と関連のあるデータ群を前記クライアント装置に送信し、
前記クライアント装置は、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成し、前記個人概念関連情報と前記全体概念関連情報との比較結果に基づいてユーザの興味関心を推定し、前記サーバ装置に対してデータ取得要求とともに前記興味関心に対応する概念を送信することを特徴とする情報処理システム。
【請求項2】
前記クライアント装置は、
自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成する個人概念関連情報生成手段と、
前記個人概念関連情報生成手段により生成された個人概念関連情報と前記サーバ装置から受信した前記全体概念関連情報とを比較し、ユーザ個人の興味関心に関する特徴量を抽出する個人特徴量抽出手段と、
前記個人特徴量抽出手段により抽出された前記特徴量に基づいて、前記個人概念関連情報における概念をユーザの興味関心に対応する概念として前記サーバ装置に送信し、前記送信した概念と関連する形態素が出現するデータ群を前記サーバ装置から受信するデータ取得手段と、
前記データ取得手段により受信されたデータ群から、前記個人概念関連情報生成手段により生成された個人概念関連情報における概念と関連のあるデータを選択するデータ選択手段と、
を有することを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記データ取得手段は、前記個人概念関連情報における形態素の出現頻度が前記全体概念関連情報における該形態素と同一の形態素の出現頻度より大きい場合、該個人概念関連情報における形態素と関連する概念を上位概念化することを特徴とする請求項2に記載の情報処理システム。
【請求項4】
前記個人特徴量抽出手段は、前記個人概念関連情報と前記全体概念関連情報とを比較し、前記全体概念関連情報における概念に対するユーザの興味の強弱、概念間の関連性の強弱、前記個人概念関連情報と前記全体概念関連情報における同一概念の注目度の違いをユーザ個人の特徴量として抽出することを特徴とする請求項2又は3に記載の情報処理システム。
【請求項5】
ネットワーク上のデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す全体概念関連情報を生成するサーバ装置から前記全体概念関連情報を受信し、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成し、前記個人概念関連情報と前記全体概念関連情報との比較結果に基づいてユーザの興味関心を推定し、前記サーバ装置に対してデータ取得要求とともに前記興味関心に対応する概念を送信して該概念と関連のあるデータ群を前記サーバ装置から受信することを特徴とする情報処理装置。
【請求項6】
自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成する個人概念関連情報生成手段と、
前記個人概念関連情報生成手段により生成された個人概念関連情報と前記サーバ装置から受信した前記全体概念関連情報とを比較し、ユーザ個人の興味関心に関する特徴量を抽出する個人特徴量抽出手段と、
前記個人特徴量抽出手段により抽出された前記特徴量に基づいて、前記個人概念関連情報における概念をユーザの興味関心に対応する概念として前記サーバ装置に送信し、前記送信した概念と関連する形態素が出現するデータを前記サーバ装置から受信するデータ取得手段と、
前記データ取得手段により受信されたデータ群から、前記個人概念関連情報生成手段により生成された個人概念関連情報における概念と関連のあるデータを選択するデータ選択手段と、
を有することを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記情報取得手段は、前記個人概念関連情報における形態素の出現頻度が前記全体概念関連情報における該形態素と同一の形態素の出現頻度より大きい場合、該個人概念関連情報における形態素と関連する概念を上位概念化することを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記個人特徴量抽出手段は、前記個人概念関連情報と前記全体概念関連情報とを比較し、前記全体概念関連情報における概念に対するユーザの興味の強弱や概念間の関連性の強弱をユーザ個人の特徴量として抽出することを特徴とする請求項6又は7に記載の情報処理装置。
【請求項9】
ネットワークを介してサーバ装置からデータを取得する情報処理装置に用いられるプログラムであって、
ネットワーク上のデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す全体概念関連情報を生成する前記サーバ装置から前記全体概念関連情報を受信し、自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成し、前記個人概念関連情報と前記全体概念関連情報との比較結果に基づいてユーザの興味関心を推定し、前記サーバ装置に対してデータ取得要求とともに前記興味関心に対応する概念を送信して該概念と関連のあるデータ群を前記サーバ装置から受信する処理を前記情報処理装置に実行させることを特徴とするプログラム。
【請求項10】
コンピュータに、
自装置で操作されたデータを用いて該データに出現する形態素と該形態素の概念との関連性を表す個人概念関連情報を生成する個人概念関連情報生成処理と、
前記個人概念関連情報生成処理により生成された個人概念関連情報と前記サーバ装置から受信した前記全体概念関連情報とを比較し、ユーザ個人の興味関心に関する特徴量を抽出する個人特徴量抽出処理と、
前記個人特徴量抽出処理により抽出された前記特徴量に基づいて、前記個人概念関連情報における概念をユーザの興味関心に対応する概念として前記サーバ装置に送信し、前記送信した概念と関連する形態素が出現するデータを前記サーバ装置から受信するデータ取得処理と、
前記データ取得処理により受信されたデータ群から、前記個人概念関連情報生成処理により生成された個人概念関連情報における概念と関連のあるデータを選択するデータ選択処理と、
を実行させることを特徴とする請求項9に記載のプログラム。
【請求項11】
前記データ取得処理は、前記個人概念関連情報における形態素の出現頻度が前記全体概念関連情報における該形態素と同一の形態素の出現頻度より大きい場合、該個人概念関連情報における形態素と関連する概念を上位概念化することを特徴とする請求項10に記載のプログラム。
【請求項12】
前記個人特徴量抽出処理は、前記個人概念関連情報と前記全体概念関連情報とを比較し、前記全体概念関連情報における概念に対するユーザの興味の強弱や概念間の関連性の強弱をユーザ個人の特徴量として抽出することを特徴とする請求項10又は11に記載のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate