説明

データ処理装置、データ処理方法及び検索装置

【課題】利便性の高いデータ処理技術を提供する。
【解決手段】データ処理装置は、ユーザの目的又は志向を示す概念ツリーを設定する概念ツリー設定部22と、ユーザが生成又は取得したデータ群を概念ツリーにしたがって分類する分類部24と、分類されたデータ群を表示するブック表示部26と、概念ツリー又は概念ツリーにしたがって分類されたデータ群をクエリとして検索を要求する検索要求部28と、検索の結果として概念ツリーにしたがって分類されたデータ群を取得する検索結果取得部32と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理技術に関し、特に、ユーザの目的や志向などの価値観を概念化した情報にしたがってデータを処理するデータ処理装置及び方法、及び検索装置に関する。
【背景技術】
【0002】
インターネットを利用して多種多様なデータを入手可能な環境が整えられている。パーソナルコンピュータなどのスペックも向上し、大容量のデータを蓄積することができるようになっており、ユーザの身の回りには膨大な電子データが氾濫している。
【発明の開示】
【発明が解決しようとする課題】
【0003】
膨大なデータを入手しても、無秩序に蓄積された状態では、利用価値は低い。ユーザの価値観を反映した、より利便性の高いデータ処理技術が望まれる。
【0004】
本発明はこうした状況に鑑みてなされたものであり、その目的は、利便性の高いデータ処理技術を提供することにある。
【課題を解決するための手段】
【0005】
本発明のある態様は、データ処理装置に関する。このデータ処理装置は、ユーザの目的又は志向を示す概念情報を設定する概念情報設定部と、ユーザが生成又は取得したデータ群を格納する格納部と、前記データ群を前記概念情報にしたがって分類する分類部と、
分類された前記データ群を表示する表示部と、を備えることを特徴とする。
【0006】
前記概念情報設定部は、前記概念情報として、前記ユーザの目的又は志向を示す複数のキーワードを階層化したツリーを設定してもよく、前記分類部は、前記データ群に含まれる各データについて前記キーワードとの類似度を算出し、あるキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、前記データ群を階層的に分類してもよい。
【0007】
データ処理装置は、概念情報にしたがって分類されたデータ群を他の装置から取得する取得部を更に備えてもよく、前記分類部は、前記取得部により取得されたデータ群を、前記概念情報設定部により設定された概念情報にしたがって分類してもよい。
【0008】
データ処理装置は、前記取得部が取得した前記データ群が、前記他の装置において更新されたことを検知し、前記取得部に前記他の装置から更新された前記データ群を取得させる更新部を更に備えてもよく、前記分類部は、更新されたデータ群を前記概念情報にしたがって分類してもよい。
【0009】
データ処理装置は、前記概念情報を他の装置から取得する取得部を更に備えてもよく、前記分類部は、前記格納部に格納されたデータ群を、前記取得部により取得された概念情報にしたがって分類してもよい。
【0010】
データ処理装置は、前記取得部が取得した前記概念情報が、前記他の装置において更新されたことを検知し、前記取得部に前記他の装置から更新された前記概念情報を取得させる更新部を更に備えてもよく、前記分類部は、更新された概念情報にしたがって前記格納部に格納されたデータ群を分類してもよい。
【0011】
データ処理装置は、前記キーワード、前記概念情報、又は前記データ群をクエリとして、前記概念情報又は前記データ群の検索を要求する検索要求部と、前記検索の結果として、前記概念情報又は前記データ群を取得する検索結果取得部と、を更に備えてもよい。
【0012】
本発明の別の態様は、データ処理方法に関する。このデータ処理方法は、ユーザの目的又は志向を示す複数のキーワードを階層化したツリーを設定するステップと、ユーザが生成又は取得したデータ群に含まれる各データについて前記キーワードとの類似度を算出し、あるキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、前記データ群を階層的に分類するステップと、分類された前記データ群を表示するステップと、をコンピュータに実行させることを特徴とする。
【0013】
本発明の別の態様は、検索装置に関する。この検索装置は、ユーザの目的又は志向を示す複数のキーワードを階層化したツリーを含む概念情報をクエリとして検索要求を受け付ける検索要求受付部と、前記概念情報に含まれる各キーワードをもとにデータを検索し、それぞれのキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、前記概念情報にしたがって階層的に分類されたデータ群を生成する生成部と、生成されたデータ群を検索結果として送信する検索結果送信部と、を備えることを特徴とする。
【0014】
本発明の更に別の態様も、検索装置に関する。この検索装置は、ユーザの目的又は志向を示すキーワードを階層化したツリーを含む概念情報、前記概念情報にしたがって階層的に分類されたデータ群、又は前記キーワードをクエリとして検索要求を受け付ける検索要求受付部と、受け付けた概念情報、データ群、又はキーワードに類似する概念情報又はデータ群を検索する検索部と、検索された概念情報又はデータ群を検索結果として送信する検索結果送信部と、を備えることを特徴とする。
【0015】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0016】
本発明によれば、利便性の高いデータ処理技術を提供することができる。
【発明を実施するための最良の形態】
【0017】
ユーザがある目的をもってデータを収集したとき、収集したデータ群には、ユーザの目的、興味、志向、価値観が反映されている。図1は、例として、あるユーザが富士山に旅行に行く際に収集したデータ群を示す。このユーザは、林道をドライブしながら富士山へ行くために、インターネットを介した検索サービスを用いて、富士山周辺の林道の情報を収集している。また、富士山周辺の地場料理に関する情報を収集している。これらのデータ群から、このユーザが、目的地周辺の林道をドライブしたり、地場料理を食べたりして、ゆっくりと旅行を楽しみたいという目的や志向を有していることを把握することができる。
【0018】
しかし、このユーザが、次に東北地方に旅行する計画をたてるとき、同様に周辺の林道に関する情報や、地場料理に関する情報を収集したいと思っても、従来の検索サービスでは、再度自身でキーワードを設定して検索を行う必要があった。そこで、本実施の形態では、ユーザの所有するデータ群に含まれるユーザの目的や志向を示す情報を利用して、データを収集したり整理したりする技術を提案する。以下、ユーザの目的や志向を示す構造化された概念情報2を「概念ツリー」と呼び、概念ツリーにしたがって整理されたデータ群3を「ブック」と呼ぶ。概念ツリーは、キーワードをノードとするツリーであってもよい。また、ブックは、概念ツリーの各キーワードに関連するデータ群が付されたものであってもよい。
【0019】
図2は、実施の形態に係るデータ処理システムの構成を示す。データ処理システム1において、ユーザの端末10、端末10に情報を提供する情報提供サーバ4、端末10からの検索要求を受けて情報提供サーバ4などにより提供されている情報の中からユーザが所望する情報を検索する検索サーバ50は、インターネット5により接続されている。端末10は、ユーザの価値観を示す概念ツリーにしたがって、情報提供サーバ4から情報を収集し、ブックとして整理し、蓄積する。検索サーバ50は、端末10から概念ツリーやブックに関する検索要求を受け付けて、検索を実行する。
【0020】
図3は、実施の形態に係る端末の構成を示す。端末10は、データ処理装置の一例であり、インタフェース部12、通信部14、制御部20、記憶装置40を含む。制御部20は、概念ツリー設定部22、分類部24、ブック表示部26、検索要求部28、類推部30、検索結果取得部32、決定部34、切換部36、評価部38、及び更新部39を含む。記憶装置40は、データ格納部42、辞書格納部44、及び履歴情報データベース46を含む。これらの構成は、ハードウエアコンポーネントでいえば、任意のコンピュータのCPU、メモリ、メモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
【0021】
概念ツリー設定部22は、ユーザの目的、志向、興味、価値観などを示す概念ツリーを設定する。概念ツリーは、ユーザがブックを生成する前に設定されてもよいし、ブックの生成中にブックに含まれるデータを分類するために設定されてもよい。概念ツリー設定部22は、ユーザから、ユーザの目的、志向、興味などの価値観を概念的に示す複数のキーワードを受け付け、それらのキーワードを階層化して、概念ツリーを構成する。複数のキーワードは、階層構造を有していなくてもよいが、その場合も、1階層のみのツリー構造を有するとみなすことができる。
【0022】
概念ツリー設定部22は、ユーザにより収集されたデータ群を解析することにより自動的に概念ツリーを設定してもよい。例えば、記憶装置40のデータ格納部42に格納されたデータファイルに含まれるテキストデータを形態素解析し、名詞や動詞などの自立語の中から特徴語を抽出して、データファイルの内容を示すキーワードを取得し、複数のデータファイルに共通するキーワードを抽出して概念ツリーを構成してもよい。
【0023】
分類部24は、ユーザが生成又は取得したデータを、概念ツリー設定部22により設定された概念ツリーにしたがって分類する。分類部24は、概念ツリーに含まれるキーワードのうちいずれのキーワードに関連するデータであるかをユーザから受け付けてデータを分類してもよいし、データの内容を解析して各キーワードとの類似度を算出し、あるキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、データ群を階層的に分類してもよい。あるキーワードとデータとの類似度を算出する際に、そのノードよりも上位のノードのキーワードを継承し、それらのキーワードとデータとの類似度を更に考慮してもよい。また、そのノードの兄弟又は子孫のノードのキーワードとデータとの類似度を更に考慮してもよい。例えば、あるキーワードとデータとの類似度を算出する際に、そのノードの祖先、兄弟、又は子孫のノードのキーワードとデータとの類似度が高ければ、そのキーワードとデータとの類似度を高くし、低ければ、類似度を低くしてもよい。これにより、概念ツリー全体により規定されるユーザの目的や志向をデータの分類に反映させることができる。
【0024】
このように、ユーザが生成又は取得したデータは、分類部24により、概念ツリーにしたがって分類され、記憶装置40のデータ格納部42に蓄積される。データ格納部42において、データは、概念ツリーと同様の階層構造を有するディレクトリに格納されてもよいし、概念ツリーとは無関係に格納されてもよい。こうして、ユーザの目的、志向、興味などの価値観に沿ってブックが形成されていく。
【0025】
データ格納部42において、データが概念ツリーと同様のディレクトリツリーに格納される場合は、概念ツリーも、データ格納部42におけるディレクトリツリーとして表現できる。概念ツリーは、データの格納先を階層的に表現したXMLファイルなどにより表現されてもよい。この場合、データは、概念ツリーの階層構造とは無関係にデータ格納部42に格納されてもよい。概念ツリーがデータ格納部42におけるディレクトリツリーとして表現される場合でも、XMLファイルなどでデータの格納先が表現されている場合は、ディレクトリツリーとは無関係にデータが格納されてもよい。ブックは、静的に規定されていてもよいし、必要なときに動的に生成されてもよい。後者の場合、ブックを表示したり検索したりするたびに、分類部24がデータ格納部42に格納されているデータを分類してブックを生成する。分類部24は、ブックの内容となるデータとして、情報提供サーバ4に格納されているデータを参照してもよい。
【0026】
ブック表示部26は、ブックに含まれるデータを、概念ツリーにしたがって表示する。例えば、概念ツリーを表示するとともに、それぞれのキーワードに関連するデータファイルの一覧を表示し、ユーザがデータファイルを選択すると、そのデータファイルの内容を表示してもよい。これにより、ユーザの価値観に応じてグループ化されたデータ群を整理して表示することができる。
【0027】
ブック表示部26は、通信部14を介して他の装置から取得したデータ群を表示する際に、自装置に格納されているユーザの概念ツリーを適用して表示してもよい。ブック表示部26は、例えば、他のユーザのブックに含まれるデータ群を、分類部24により、自装置のユーザの概念ツリーにしたがって分類し直し、自装置のユーザのブックと同様に表示してもよい。複数の概念ツリーが存在する場合は、いずれの概念ツリーを適用すべきかをユーザから受け付けてもよい。また、他の装置から取得した概念ツリーと、自装置のユーザの概念ツリーを切り替えて適用してもよい。これにより、他のユーザが生成又は収集したデータ群を、自身の価値観で整理して表示することができ、ユーザの利便性を向上させることができる。また、他の概念ツリーを適用することにより、自身とは異なる価値観でデータ群を整理して表示することができ、新たな視点でデータ群を分析する支援をすることができる。
【0028】
例えば、他のユーザが蓄積している楽曲データを、自身のプレイリスト・カテゴリーのジャンル種別にしたがって分類し、試聴することができる。また、他のユーザのブログに掲載されている記事を、自身のブログで用いているカテゴリーに振り分けて閲覧することができる。また、掲示板やニュースサイトなどに投稿されている記事を、自身が設定したカテゴリーに自動的に分類して閲覧することができる。この場合、ブログや記事などを提供するサーバが、内容を分割して部分単位で提供するAPIを有していれば、同じウェブページに記述された内容であっても、異なるカテゴリーに振り分けて閲覧することができる。また、ブックマークされたURLや電話番号などを、自身の価値観に沿って分類して参照することができる。
【0029】
検索要求部28は、キーワード、概念ツリー又はブックをクエリとして、検索サーバ50に検索を要求する。後述するように、検索サーバ50は、クエリとして受け付けた概念ツリーに含まれるキーワードをもとに検索を行ってブックを生成したり、クエリとして受け付けたキーワード、概念ツリー、又はブックに類似した概念ツリー又はブックを検索したりする機能を有している。検索結果取得部32は、検索サーバ50から検索結果として概念ツリーやブックなどを取得する。
【0030】
類推部30は、検索要求部28が概念ツリーをクエリとして検索を要求する際に、概念ツリーに含まれるキーワードに基づいて、ユーザの目的、志向、興味、価値観を推測し、検索キーワードを拡張する。類推部30は、辞書格納部44に格納された類推辞書を参照して、概念ツリーに含まれるキーワードの同義語、類義語、上位概念語、下位概念語を抽出し、検索要求部28がクエリとして送信する検索キーワードに追加する。例えば、概念ツリーに「鄙びた」というキーワードが含まれる場合、類推部30は、類推辞書を参照して、「田舎」という類義語を検索キーワードに追加してもよい。また、国語辞書を参照して「鄙びた」という語の意味を取得し、その意味に類似する語を国語辞書などから逆引きして検索キーワードに追加してもよい。この場合、「人口が少なく辺鄙な場所」という意味に類似する「穴場」、「閑静」などの語を抽出してもよい。
【0031】
決定部34は、検索結果として得られたブックに含まれるデータ群の中から、いずれのデータを優先して表示するかを決定する。決定部34は、履歴情報データベース46を参照して、優先して表示するデータを決定する。例えば、図1に示したブックにおいて、ユーザが「地場料理」に関連するデータを参照した履歴が履歴情報データベース46に格納されている場合、決定部34は、「地場料理」に関連するデータを優先して表示してもよい。
【0032】
切換部36は、決定部34により優先して表示すると決定されたデータの一部又は全部を別のデータに切り換える。例えば、図1に示したブックにおいて、「地場料理」に関連するデータを表示しているときに、それを「林道」に関連するデータに切り換える。
【0033】
評価部38は、ユーザの操作などに応じて、履歴情報データベース46に格納された履歴情報を変更する。評価部38は、切換部36により表示するデータが切り換えられたときに、優先して表示すべきデータの情報を履歴情報データベース46に登録してもよい。このとき、ユーザの価値観がどのように変更されたのかを評価しても良い。例えば、概念ツリーの「林道」というキーワードが「高速道路」に変更されたとき、ユーザの価値観が、目的地へ至る経路として景色よりも時間を優先するという価値観に変わったと評価し、履歴情報データベース46に記録してもよい。
【0034】
評価部38は、ユーザの価値観の変遷に伴って、分類部24が概念ツリーにしたがってデータ群を分類するために概念ツリーのキーワードとデータとの類似度を算出する際の重みを変更してもよい。例えば、「林道」が「高速道路」に変更されたときに、「地場料理」のノードに分類すべきデータを評価する際のキーワードとして、「高速道路」に正の重みを付加してもよい。これにより、例えば、地場料理を提供する料理店の情報として、林道沿いにある店舗よりも、高速道路のサービスエリアなどにある店舗の情報が優先されることになり、よりユーザの価値観を反映したブックを生成することが可能となる。
【0035】
評価部38は、重みを変更したときに、既に分類されているデータの分類を再評価してもよい。評価部38は、既に分類されているデータと、概念ツリーのキーワードとの類似度を再度計算してデータ群を再分類し、類似度が所定値よりも低いデータをブックから外してもよい。このとき、ブックから外したデータの代わりとなるデータを、検索要求部28により検索サーバ50から検索してブックに加えてもよい。あるキーワードに分類されるデータの数が所定値よりも少なくなったときに、検索サーバ50からデータを再検索して追加するようにしてもよい。
【0036】
更新部39は、他の装置から取得した概念ツリー又はブックが、他の装置において更新されたことを検知すると、更新された概念ツリー又はブックを他の装置から取得する。更新部39は、概念ツリー又はブックの取得元の装置から、概念ツリー又はブックが更新された旨の通知を受け付けてもよいし、所定のタイミングで取得元の装置に更新の有無を問い合わせてもよい。更新部39は、概念ツリー又はブックの更新を検知したときに、更新された概念ツリー又はブックを識別可能な態様で表示してもよい。更新部39は、概念ツリー又はブックの更新を検知したときに、更新を反映させてもよいし、更新を反映するか否かの選択をユーザから受け付けてもよい。更新部39は、ユーザからの指示に応じて、更新前の概念ツリー又はブックを保存してもよいし、更新後の概念ツリー又はブックを保存してもよい。更新部39は、概念ツリー又はブックのログを保存し、更新後も更新前の状態に戻れるようにしてもよい。
【0037】
図4は、検索サーバ50の構成を示す。検索サーバ50は、通信部52及び制御部60を備える。制御部60は、検索要求受付部62、検索部64、検索結果生成部66、検索結果送信部68を備える。これらの機能ブロックも、ハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できる。
【0038】
検索要求受付部62は、端末10から、キーワード、概念ツリー又はブックを検索のクエリとして受け付ける。検索部64は、検索要求受付部62が受け付けたキーワード、概念ツリー又はブックをもとに、情報提供サーバ4などが公開しているコンテンツなどを検索する。検索結果生成部66は、検索部64による検索結果をもとに、端末10に送信する検索結果を生成する。検索結果送信部68は、生成された検索結果を端末10に送信する。
【0039】
検索部64は、キーワードをクエリとして受け付けたときは、情報提供サーバ4又は検索サーバ50などに蓄積されている概念ツリーの中から、受け付けたキーワードに類似するキーワードを含む概念ツリーを検索する。検索結果生成部66は、類似度の高い概念ツリーを検索結果とする。
【0040】
検索部64は、概念ツリーをクエリとして受け付けたときは、概念ツリーに含まれる複数のキーワードと、類推部30により追加された検索キーワードをクエリとしてコンテンツを検索する。検索結果生成部66は、それぞれのキーワードについて、スコアの高いコンテンツを抽出して、概念ツリーにしたがってブックを生成する。このとき、概念ツリーに含まれる他のキーワードや、概念ツリーの階層構造を参照して、スコアを決定してもよい。検索要求受付部62がブックをクエリとして受け付けたときも、ブックに適用されている概念ツリーをクエリとして受け付けたものとして、同様に検索を行ってもよい。
【0041】
検索部64は、ブックをクエリとして受け付けたときは、情報提供サーバ4により公開されているブックの中から、類似するブックを検索してもよい。このとき、ブックに適用されている概念ツリーのキーワードの類似度、概念ツリーの構造の類似度、それぞれのキーワードに関連するデータ群の類似度、などを参照して、ブックの類似度が決定されてもよい。検索結果生成部66は、類似度の高いブック又はそのブックに適用されている概念ツリーを検索結果とする。
【0042】
検索部64は、概念ツリーをクエリとして受け付けたときに、その概念ツリーに類似する概念ツリーを検索してもよい。また、その概念ツリーに類似する概念ツリーが適用されたブックを検索してもよい。
【0043】
このような技術を利用して、例えば、オークションやショッピングサイトなどにおいて、ユーザの価値観に近い商品の検索をおこない、購買履歴を参照して提案を行うことができる。また、AV機器において、利用者の価値観・興味に沿ったコンテンツを提示することができる。また、地図サイトにおいて、利用者の価値観に沿った店舗情報や目的地などを地図上に表示することができる。サーバ、携帯電話端末、カーナビゲーションシステムなどでブックを共有し、利用者の価値観に沿った場所や店舗などの情報を検索し、表示したり、カーナビゲーションシステムの目的地として設定したりすることができる。また、実際に走行した経路や、撮影した写真などをブックに取り込むことができる。また、宿泊施設などの予約サイトにおいて、予め用意された条件からでなく、利用者の価値観に沿った基準で情報を絞り込むことができる。その際に、近隣の店舗などに関する情報など、利用者のニーズに合った情報を合わせて表示することができる。
【0044】
ユーザは、概念ツリー設定部22により、検索結果として得られたブックの概念情報を変更したり、分類部24により、ブックに含まれるデータを分類し直したり、データを取捨したり、新たにデータを追加したりして、ブックを編集することができる。このように編集されたブックには、ユーザの価値観が投影されていく。編集したブックをクエリとして検索を行うことにより、より自身の価値観に近いブックを検索することもできる。
【0045】
概念ツリーやブックは、ユーザの価値観を反映した情報であるから、マーケティングなどに利用することもできる。例えば、広告提供者が閲覧者のブックを得ることで、閲覧者の価値観・興味に合った広告を表示することができる。また、サービス・商品に対する評価などを、調査者の定める様々な価値観の別に分類し閲覧することができる。
【0046】
図5は、本実施の形態に係るデータ処理方法の手順を示すフローチャートである。図5は、端末10において、ユーザが作成した概念ツリーにしたがって、ユーザが収集したデータ群を分類してブックを生成する手順を示す。まず、ユーザが、概念ツリー設定部22により提供されるユーザインタフェースを用いて、データ群を分類すべき階層構造を設計し、その階層構造の各ノードをキーワードで表現した概念ツリーを生成する(S10)。つづいて、ユーザが、情報提供サーバ4や検索サーバ50などを用いてデータ群を収集すると(S12)、分類部24は、各データと、概念ツリーの各ノードのキーワードとの類似度に応じてデータ群を分類し、ブックを生成する(S14)。ブック表示部26は、生成されたブックを表示する(S16)。
【0047】
図6は、本実施の形態に係るデータ処理方法の別の手順を示すフローチャートである。図6は、端末10において、ユーザが収集したデータ群を自動的に分類してブックを生成する手順を示す。まず、ユーザが、情報提供サーバ4や検索サーバ50などを用いてデータ群を収集すると(S20)、概念ツリー設定部22は、収集されたデータ群を解析することにより自動的に概念ツリーを生成する(S22)。分類部24は、収集された各データと、生成された概念ツリーの各ノードのキーワードとの類似度に応じてデータ群を分類し、ブックを生成する(S24)。ブック表示部26は、生成されたブックを表示する(S26)。
【0048】
図7は、分類部24によりデータを分類するときのユーザインタフェースの例を示す。ユーザは、分類部24が表示する概念ツリー2の各ノードへ、所望のデータをドラッグ&ドロップすることにより、そのノード又はそのノードの下位のノードにデータを分類させることができる。例えば、ユーザが、「富士山林道チェックリスト」の文書80をドラッグして「富士山」のノードにドロップすると、分類部24は、「富士山」のノード及びその下位のノードのキーワードと、「富士山林道チェックリスト」の文書80に含まれる特徴語との類似度を算出し、類似度の高いノードに文書80を分類する。また、ユーザが、「旅館ホームページ」のウィンドウ82をドラッグして「富士山」のノードにドロップすると、分類部24は、「富士山」のノード及びその下位のノードのキーワードと、「旅館ホームページ」に含まれる特徴語との類似度を算出し、類似度の高いノードに旅館ホームページ82を分類する。ここでは、図8に示すように、富士山林道チェックリスト80は、「林道」のノードに、旅館ホームページ82は、「宿」のノードに、それぞれ分類される。
【0049】
ユーザが、分類部24により自動的に分類されたノードとは異なるノードにデータを分類させたい場合は、分類すべきノードをユーザが指定できるようにしてもよい。例えば、旅館ホームページ82に記述された旅館が、地場料理を提供している場合に、ユーザが、「旅館ホームページ」のウィンドウ82を「地場料理」のノードへドロップすると、分類部24は、旅館ホームページ82を「地場料理」のノードに分類する。分類部24により自動的に「宿」のノードに分類された旅館ホームページ82を、「地場料理」のノードへドラッグ&ドロップなどにより移動できるようにしてもよい。また、1つのデータを複数のノードに分類させてもよい。例えば、「富士山林道チェックリスト」の文書80を「宿」のノードにも分類させたい場合、分類部24により自動的に「林道」のノードに分類された文書80を「宿」のノードにコピーできるようにしてもよい。
【0050】
図9は、本実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。図9は、端末10がキーワードをもとに検索サーバ50から概念ツリーを検索する手順を示す。まず、端末10の検索要求部28は、検索サーバ50へ複数のキーワードを送り、概念ツリーの検索を要求する(S30)。検索サーバ50は、蓄積されている多数の概念ツリーの中から、受け付けた複数のキーワードと類似度の高い概念ツリーを検索し(S32)、検索された概念ツリーを端末10へ回答する(S34)。これにより、ユーザは、データを分類する枠組みとなる概念ツリーを取得し、自身のデータを適切に分類することができる。
【0051】
図10は、本実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。図10は、端末10が概念ツリーをもとに検索サーバ50からブックを検索する手順を示す。まず、端末10の検索要求部28は、概念ツリー設定部22により設定された概念ツリーを検索サーバ50へ送り、ブックの検索を要求する(S40)。検索サーバ50は、蓄積されている多数のブックの中から、受け付けた概念ツリーと同様の概念ツリーにより構造化されているブックを検索し(S42)、検索されたブックを端末10へ回答する(S44)。これにより、ユーザは、所望のデータの枠組みとなる概念ツリーを設計して検索を要求することにより、その枠組みの中身のデータを取得することができる。
【0052】
図11は、本実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。図11は、端末10が概念ツリーをもとに検索サーバ50にブックの生成を要求する手順を示す。まず、端末10の検索要求部28は、概念ツリー設定部22により設定された概念ツリーを検索サーバ50へ送り、ブックの生成を要求する(S50)。検索サーバ50の検索結果生成部66は、概念ツリーに含まれるそれぞれのキーワードについて検索を行ってデータを収集し、概念ツリーにしたがって分類してブックを生成し(S52)、生成したブックを端末10へ回答する(S54)。この方法によっても、ユーザは、所望のデータの枠組みとなる概念ツリーを設計して検索を要求することにより、その枠組みの中身のデータを取得することができる。
【0053】
図12は、本実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。図12は、端末10がブックをもとに検索サーバ50に概念ツリーの検索を要求する手順を示す。まず、端末10の検索要求部28は、データ格納部42に格納されているブックを検索サーバ50へ送り、概念ツリーの検索を要求する(S60)。検索サーバ50は、ブックに含まれるデータに類似するデータを含むブックを検索し(S62)、検索されたブックの概念ツリーを端末10へ回答する(S64)。これにより、ユーザは、既に生成したブックを他の概念ツリーをもとに分類することができる。
【0054】
図13は、本実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。図13は、端末10がブックをもとに検索サーバ50にブックの検索を要求する手順を示す。まず、端末10の検索要求部28は、データ格納部42に格納されているブックを検索サーバ50へ送り、ブックの検索を要求する(S70)。検索サーバ50は、ブックの概念ツリーに類似する概念ツリーにより分類されているブックを検索し(S72)、検索されたブックを端末10へ回答する(S74)。これにより、ユーザは、既に生成したブックに類似するブックを取得することができる。
【0055】
検索サーバ50は、端末10から検索を要求されたときに、検索要求に含まれる概念ツリーやブックを蓄積してもよい。
【0056】
図14は、ブック表示部26により表示された画面の例を示す。画面には、図1に示した概念ツリーの各ノードのキーワードがタブ形式で表示されている。ユーザは、表示したいノードのタブを選択することにより、そのノードに分類されているデータを表示させることができる。図14の例では、「旅行」−「富士山」−「林道」に分類されている「富士山林道チェックリスト」の文書80が表示されている。
【0057】
図14に示した画面において、ユーザは、概念ツリーを編集することができる。例えば、ユーザが、「富士山」のノードの兄弟ノードとして「徳島」のノードを追加する編集指示を入力すると、概念ツリー設定部22は、概念ツリーに「徳島」のノードを追加する。このとき、概念ツリー設定部22は、「富士山」のノードの下位にあるノードを「徳島」のノードの下位にコピーしてもよい。図15は、編集の結果、ブック表示部26により表示された画面の例を示す。「富士山」のタブと同じ階層に「徳島」のタブが追加されており、「徳島」のタブのアイコンは、他の通常のアイコンとは異なる態様で表示されている。これにより、「徳島」のノードが新規に追加されたことが示される。「徳島」のノードの下位の「林道」のノードには、徳島県の林道の情報である「剣山スーパー林道レポート」の文書84などが分類される。
【0058】
図14に示した画面において、ユーザは、概念ツリーなどをクエリとした検索を要求することができる。例えば、図16に示すように、ユーザが、概念ツリーを示すタブをドラッグして検索アイコン90にドロップすると、検索要求部28は、概念ツリーをクエリとした検索を要求するための画面を表示する。図17は、検索要求部28により表示された検索画面の例を示す。画面には、概念ツリー2が表示されており、ユーザが概念ツリー2を編集できるようになっている。例えば、ユーザが「富士山」のノードのキーワードを「東北」に変更して検索を要求すると、検索要求部28は、変更された概念ツリー2をクエリとして検索サーバ50に検索を要求する。検索サーバ50は、変更された概念ツリー2にしたがって分類されたブックを検索又は生成する。検索結果取得部32は、検索サーバ50から検索結果のブックを取得する。図18は、検索されたブックの表示画面の例を示す。例えば、「旅行」−「東北」−「林道」には、東北地方の林道の情報である「東北林道レポート」の文書86などが分類される。
【0059】
図19は、検索サーバ50によるブックの検索結果を示す画面の例を示す。画面右側には、検索サーバ50による検索の結果得られたブックの種類、タイトル、キーワードの一覧が表示されている。各ブックのアイコン92には、そのブックの概略的な構造が表示されている。ブックに適用されている概念ツリーの各ノードを示す矩形は、そのノードに含まれるデータ量に応じて大きさが決定され、検索のもとになった概念ツリー又はブックとの類似度に応じて色が決定される。また、検索のもとになったブックとの間で共通のデータが存在する場合には、旗が表示されている。旗の丸印は、最近更新されている場合に黒く塗り潰される。
【0060】
図19に示した画面において、ユーザは、検索結果のブックに自身の概念ツリーを適用して表示させることができる。例えば、図19に示すように、ブックのアイコン92をドラッグして画面左側の自身の概念ツリーが表示された領域にドロップすると、分類部24は、表示されている概念ツリーにしたがって、ブックに含まれるデータを再分類する。例えば、「北東北の旅」のブックには、林道の情報である各種のレポートが含まれている。
【0061】
図20は、検索サーバ50による概念ツリーの検索結果を示す画面の例を示す。画面右側には、検索サーバ50による検索の結果得られた概念ツリーの構造が表示されている。図20に示した画面において、ユーザは、検索結果の概念ツリーを自身のブックに適用して表示させることができる。例えば、図20に示すように、概念ツリーをドラッグして画面左側の自身のブックが表示された領域にドロップすると、分類部24は、概念ツリーにしたがって表示されているブックを再分類する。例えば、「富士山林道チェックリスト」の文書80は、「キャンプ」−「山」−「道路情報」に分類される。
【0062】
図20に示した画面において、他の装置から取得した概念ツリーが他の装置において更新されたことを更新部39が検知すると、更新部39は、更新された部分を他の部分とは識別可能な態様で表示する。図21は、更新部39により更新された画面の例を示す。図21の例では、「店舗」のノードが追加されており、「店舗」のタブがアイコンは、他の通常のアイコンとは異なる態様で表示されている。これにより、「店舗」のノードが新規に追加されたことが示される。更新部39は、新たに追加された「店舗」のノードに分類すべきデータを検索サーバ50から検索し、ブックに追加してもよい。
【0063】
ブック表示部26が、データ格納部42に格納されたブックを表示する際に、検索要求部28が、表示されるブックに関連又は類似するデータ、概念ツリー、又はブックの検索を自動的に検索サーバ50に要求してもよい。例えば、図16に示した画面において、検索要求部28は、表示されているブック又は概念ツリーをもとに、関連又は類似するブックを検索サーバ50から検索し、図19に示したようなUIにて検索結果を表示してもよいし、関連又は類似する概念ツリーを検索サーバ50から検索し、図20に示したようなUIにて検索結果を表示してもよい。また、例えば「林道」のタブが選択されたときに、検索要求部28は、「旅行」−「富士山」−「林道」というキーワードをもとに、「林道」タブに分類されるデータを検索サーバ50から自動的に検索して表示してもよい。つづいて、「地場料理」のタブが選択されると、検索要求部28は、「旅行」−「富士山」−「地場料理」というキーワードをもとに、「地場料理」タブに分類されるデータを検索サーバ50から自動的に検索して表示し、検索結果を自動的に切り替えてもよい。
【0064】
以上、説明したように、本実施の形態の技術によれば、データ群をユーザの価値観にしたがって適切に分類し、表示させることができる。また、概念ツリーの変化に応じてデータ群を再分類し、ユーザの価値観の変化を反映させることができる。さらに、既に生成して蓄積しているブックに類似したデータ群を入手したいときに、その概念ツリーを適宜編集することにより、容易にデータを検索したり分類したりすることができる。
【0065】
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者解されるところである。
【図面の簡単な説明】
【0066】
【図1】概念ツリーとブックの例を示す図である。
【図2】実施の形態に係るデータ処理システムの構成を示す図である。
【図3】実施の形態に係る端末の構成を示す図である。
【図4】検索サーバの構成を示す図である。
【図5】実施の形態に係るデータ処理方法の手順を示すフローチャートである。
【図6】実施の形態に係るデータ処理方法の別の手順を示すフローチャートである。
【図7】分類部によりデータを分類するときのユーザインタフェースの例を示す図である。
【図8】分類部によりデータを分類するときのユーザインタフェースの例を示す図である。
【図9】実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。
【図10】実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。
【図11】実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。
【図12】実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。
【図13】実施の形態に係るデータ処理方法の別の手順を示すシーケンス図である。
【図14】ブック表示部により表示された画面の例を示す図である。
【図15】ブック表示部により表示された画面の例を示す図である。
【図16】ブック表示部により表示された画面の例を示す図である。
【図17】検索要求部により表示された検索画面の例を示す図である。
【図18】ブック表示部により表示された画面の例を示す図である。
【図19】検索サーバによるブックの検索結果を示す画面の例を示す図である。
【図20】検索サーバによる概念ツリーの検索結果を示す画面の例を示す図である。
【図21】更新部により更新された画面の例を示す図である。
【符号の説明】
【0067】
1 データ処理システム、4 情報提供サーバ、10 端末、12 インタフェース部、14 通信部、20 制御部、22 概念ツリー設定部、24 分類部、26 ブック表示部、28 検索要求部、30 類推部、32 検索結果取得部、34 決定部、36 切換部、38 評価部、39 更新部、40 記憶装置、42 データ格納部、44 辞書格納部、46 履歴情報データベース、50 検索サーバ、52 通信部、60 制御部、62 検索要求受付部、64 検索部、66 検索結果生成部、68 検索結果送信部。

【特許請求の範囲】
【請求項1】
ユーザの目的又は志向を示す概念情報を設定する概念情報設定部と、
ユーザが生成又は取得したデータ群を格納する格納部と、
前記データ群を前記概念情報にしたがって分類する分類部と、
分類された前記データ群を表示する表示部と、
を備えることを特徴とするデータ処理装置。
【請求項2】
前記概念情報設定部は、前記概念情報として、前記ユーザの目的又は志向を示す複数のキーワードを階層化したツリーを設定し、
前記分類部は、前記データ群に含まれる各データについて前記キーワードとの類似度を算出し、あるキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、前記データ群を階層的に分類することを特徴とする請求項1に記載のデータ処理装置。
【請求項3】
概念情報にしたがって分類されたデータ群を他の装置から取得する取得部を更に備え、
前記分類部は、前記取得部により取得されたデータ群を、前記概念情報設定部により設定された概念情報にしたがって分類することを特徴とする請求項2に記載のデータ処理装置。
【請求項4】
前記取得部が取得した前記データ群が、前記他の装置において更新されたことを検知し、前記取得部に前記他の装置から更新された前記データ群を取得させる更新部を更に備え、
前記分類部は、更新されたデータ群を前記概念情報にしたがって分類することを特徴とする請求項3に記載のデータ処理装置。
【請求項5】
前記概念情報を他の装置から取得する取得部を更に備え、
前記分類部は、前記格納部に格納されたデータ群を、前記取得部により取得された概念情報にしたがって分類することを特徴とする請求項2に記載のデータ処理装置。
【請求項6】
前記取得部が取得した前記概念情報が、前記他の装置において更新されたことを検知し、前記取得部に前記他の装置から更新された前記概念情報を取得させる更新部を更に備え、
前記分類部は、更新された概念情報にしたがって前記格納部に格納されたデータ群を分類することを特徴とする請求項5に記載のデータ処理装置。
【請求項7】
前記キーワード、前記概念情報、又は前記データ群をクエリとして、前記概念情報又は前記データ群の検索を要求する検索要求部と、
前記検索の結果として、前記概念情報又は前記データ群を取得する検索結果取得部と、
を更に備えることを特徴とする請求項2から6のいずれかに記載のデータ処理装置。
【請求項8】
ユーザの目的又は志向を示す複数のキーワードを階層化したツリーを設定するステップと、
ユーザが生成又は取得したデータ群に含まれる各データについて前記キーワードとの類似度を算出し、あるキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、前記データ群を階層的に分類するステップと、
分類された前記データ群を表示するステップと、
をコンピュータに実行させることを特徴とするデータ処理方法。
【請求項9】
ユーザの目的又は志向を示す複数のキーワードを階層化したツリーを設定するステップと、
ユーザが生成又は取得したデータ群に含まれる各データについて前記キーワードとの類似度を算出し、あるキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、前記データ群を階層的に分類するステップと、
分類された前記データ群を表示するステップと、
をコンピュータに実行させることを特徴とするデータ処理プログラム。
【請求項10】
ユーザの目的又は志向を示す複数のキーワードを階層化したツリーを含む概念情報をクエリとして検索要求を受け付ける検索要求受付部と、
前記概念情報に含まれる各キーワードをもとにデータを検索し、それぞれのキーワードとの類似度が所定値よりも高いデータを、そのキーワードに対応するノードに分類することにより、前記概念情報にしたがって階層的に分類されたデータ群を生成する生成部と、
生成されたデータ群を検索結果として送信する検索結果送信部と、
を備えることを特徴とする検索装置。
【請求項11】
ユーザの目的又は志向を示すキーワードを階層化したツリーを含む概念情報、前記概念情報にしたがって階層的に分類されたデータ群、又は前記キーワードをクエリとして検索要求を受け付ける検索要求受付部と、
受け付けた概念情報、データ群、又はキーワードに類似する概念情報又はデータ群を検索する検索部と、
検索された概念情報又はデータ群を検索結果として送信する検索結果送信部と、
を備えることを特徴とする検索装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2008−204444(P2008−204444A)
【公開日】平成20年9月4日(2008.9.4)
【国際特許分類】
【出願番号】特願2008−11973(P2008−11973)
【出願日】平成20年1月22日(2008.1.22)
【出願人】(390024350)株式会社ジャストシステム (123)
【Fターム(参考)】