方法およびシステム
【課題】書籍、雑誌、および/またはカタログなどの一部の文書はスキャンされ、それらのテキストはOCRを通じて認識され得る。文書に関連付けられた1つまたは複数の属性(「文書属性」とも称される)に関係する付加的な情報を自動的に検索し、この付加的な情報を文書に関連して提供する。
【解決手段】システムは、文書を識別し、その文書に関連付けられた属性に関係するウェブ文書を識別するための検索を行ない、当該ウェブ文書および当該文書に関連付けられた情報を提供する。
【解決手段】システムは、文書を識別し、その文書に関連付けられた属性に関係するウェブ文書を識別するための検索を行ない、当該ウェブ文書および当該文書に関連付けられた情報を提供する。
【発明の詳細な説明】
【技術分野】
【0001】
背景
発明の分野
この発明の原則に一致するシステムおよび方法は、一般に情報検索に関し、特に、特定の文書に関連する情報の提供に関する。
【背景技術】
【0002】
関連技術の説明
現在のコンピュータネットワーク、特に、インターネットは、広くかつ容易に利用可能な情報の大きな塊を作り上げている。無料のインターネット検索エンジンは、たとえば、インターネットにリンクされる何百万のウェブ文書に索引を付ける。インターネットに接続されるユーザは、検索クエリに関連するウェブ文書をすばやく見つけるために単純な検索クエリを入力することができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、インターネット上で広く利用可能でない内容の1つのカテゴリは、書籍および雑誌などのより伝統的な印刷された著作物を含む。そのような作品をデジタル的に利用可能にすることに対する1つの障害は、作品の印刷版をデジタルの形に変換することが困難であり得るということである。光学文字認識(OCR)は光学スキャン装置を使用して、後にコンピュータの読取可能なフォーマット(たとえば、ASCIIファイル)の文字に変換されるテキストの画像を生成する動作であり、印刷されたテキストを有用なデジタルの形に変換するための既知の技術である。OCRシステムは、一般に印刷されたページの画像を生成するための光学スキャナ、および画像を分析するためのソフトウェアを含む。
【課題を解決するための手段】
【0004】
概要
一局面によると、ある方法は、検索クエリを受取るステップと、検索クエリに基づいて文書を識別するために第1の検索を行なうステップと、文書に関連付けられた属性に基づいて第2の検索を行なうステップと、第2の検索の結果を表示するステップとを含んでもよい。
【0005】
別の局面によると、あるシステムは、命令を記憶するためのメモリと、命令を実行するためのプロセッサとを含んでもよい。このシステムは、文書を識別し、文書に関連付けられた属性に関係する情報を備えたウェブ文書を識別するために検索を行ない、ウェブ文書に関連付けられた情報を表示してもよい。
【0006】
さらに別の局面によると、コンピュータ読取可能な媒体に組込まれたグラフィカルユーザインターフェイスは、文書の部分への1組のリンクと、文書の内容の説明と、文書に関連付けられた書誌情報とを含んでもよい。グラフィカルユーザインターフェイスは、文書に関連付けられた属性に関係する情報を備えたウェブ文書に対する検索を行なわせるリンクも含んでもよい。
【0007】
別の局面によると、ある方法は、ユーザから文書の識別を受取るステップと、文書に関連付けられた属性に関係するウェブ文書を識別するために複数の検索を自動的に行なうステップと、ウェブ文書に関連付けられた情報をユーザに提供するステップとを含んでもよい。
【0008】
さらに別の局面によると、コンピュータ読取可能な媒体は、文書を識別するための命令と、文書に関連付けられた属性に関係する情報を備えたウェブ文書を識別するために検索を行なうための命令と、ウェブ文書から情報を抽出するための命令と、抽出された情報を文書に関連付けられた情報とともに表示するための命令とを含むコンピュータの実行可能な命令を含んでもよい。
【図面の簡単な説明】
【0009】
【図1】この発明の原則に一致するシステムおよび方法が実現され得るネットワークの例示的な図である。
【図2】この発明の原則に一致する実現例による図1のクライアントまたはサーバの例示的な図である。
【図3A】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図3B】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図3C】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図3D】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図4】この発明の原則に一致する一実現例による、文書に関連付けられた情報が検索結果として表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図5】この発明の原則に一致する一実現例による、文書に関連付けられた参照ページの表示の例示的な図である。
【図6】この発明の原則に一致する一実現例による、ウェブ文書に関連付けられた情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図7】この発明の原則に一致する別の実現例による、参照ページの一部分の例示的な図である。
【図8】この発明の原則に一致するさらに別の実現例による、参照ページの一部分の例示的な図である。
【図9】この発明の原則に一致する代替の実現例による、文書に関連付けられた情報が検索結果の形で表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図10A】この発明の原則に一致する2つの異なる実現例による、関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図10B】この発明の原則に一致する2つの異なる実現例による、関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【発明を実施するための形態】
【0010】
この明細書に組込まれかつこの明細書の一部を構成する添付の図面は、説明とともにこの発明の実施例を例示し、この発明を説明する。
【0011】
詳細な説明
この発明の以下の詳細な説明は添付の図面を参照する。異なる図面中の同じ参照番号は同じかまたは類似の要素を識別し得る。以下の詳細な説明はこの発明を制限しない。
【0012】
概略
より多くのタイプの文書が検索エンジンを通じて検索可能となっている。たとえば、書籍、雑誌、および/またはカタログなどの一部の文書はスキャンされ、それらのテキストはOCRを通じて認識され得る。これら文書についてより理解し、かつ、この付加的な情報をユーザに利用可能にすることは有益である。
【0013】
この発明の原則に一致するシステムおよび方法は、文書に関連付けられた1つまたは複数の属性(「文書属性」とも称される)に関係する付加的な情報を自動的に検索し、この付加的な情報を文書に関連して提供してもよい。
【0014】
例示的なネットワーク構成
図1は、この発明の原則に一致するシステムおよび方法が実現され得るネットワーク100の例示的な図である。ネットワーク100は、ネットワーク150を通じて複数のサーバ120〜140に接続された複数のクライアント110を含み得る。簡略化のために、2つのクライアント110および3つのサーバ120〜140がネットワーク150に接続されるように示される。実際には、より多く、または、より少ないクライアントおよびサーバがあってもよい。場合によっては、クライアントがサーバの機能を実行してもよく、サーバがクライアントの機能を実行してもよい。
【0015】
クライアント110はクライアントエンティティを含み得る。エンティティは、無線電話、パーソナルコンピュータ、携帯情報端末(PDA)、ラップトップ、もしくは別のタイプの計算または通信装置、これら装置のうちの1つの上で作動するスレッドまたはプロセス、および/またはこれら装置のうちの1つによって実行可能なオブジェクトなどの装置として規定されてもよい。サーバ120〜140は、この発明の原則に一致する態様で文書を集め、処理し、検索しおよび/または維持するサーバエンティティを含んでもよい。
【0016】
この発明の原則に一致する実現例では、サーバ120はクライアント110によって使用可能な検索エンジン125を含んでもよい。サーバ120は文書(たとえば、ウェブ文書)のコーパスを巡回し、文書に索引を付け、文書に関連付けられた情報を文書のリポジトリに保存してもよい。これに代えて、またはこれに加えて、サーバ120は、文書(たとえば、書籍、雑誌、新聞、記事、カタログ等)のデータベース(または1組のデータベース)を分析し、文書に関連付けられた情報を同一の、または異なるリポジトリに保存してもよい。サーバ130および140は、サーバ120によって巡回または分析され得る文書を保存または維持してもよい。
【0017】
サーバ120〜140は別々のエンティティとして示されるが、サーバ120〜140のうちの1つまたは複数がサーバ120〜140のうちの別の1つまたは複数の機能のうちの1つまたは複数を実行することが可能であり得る。たとえば、サーバ120〜140のうちの2つ以上が単一のサーバとして実現されることが可能であり得る。サーバ120〜140のうちの1つを2つ以上の別々の(おそらく分散される)装置として実現することも可能であり得る。
【0018】
ネットワーク150は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、公衆交換電話網(PSTN)などの電話網、イントラネット、インターネット、記憶装置またはネットワークの組合せを含んでもよい。クライアント110およびサーバ120〜140は、有線接続、無線接続、および/または光接続を通じてネットワーク150に接続してもよい。
【0019】
ここで使用されるように、「文書」という用語は、書籍、雑誌、カタログ、新聞、記事等の伝統的な印刷された著作物を含むものと広く理解されるべきである。ここで使用されるように、「ウェブ文書」という用語は、ネットワーク150などのネットワークを通じて利用可能な機械が読取可能、かつ機械が記憶可能な作業生産物を含むものと広く理解されるべきである。ウェブ文書は、たとえば、ウェブサイト、ファイル、ファイルの組合せ、他のファイルへの埋込リンクを備えた1つまたは複数のファイル、ニュースグループのポスティング、ブログ、ウェブ広告等を含んでもよい。インターネットの文脈では、一般的なウェブ文書はウェブページである。ウェブページはしばしばテキスト情報を含み、埋込情報(メタ情報、画像、ハイパーリンク等)および埋込命令(ジャバスクリプト等)を含んでもよい。ここで使用されるように、「リンク」という用語は、ウェブ文書へまたはウェブ文書からの参照を含むものと広く理解されるべきである。
【0020】
例示的なクライアント/サーバアーキテクチャ
図2は、この発明の原則に一致する実施例による、クライアント110およびサーバ120〜140のうちの1つまたは複数に対応し得るクライアントまたはサーバエンティティ(以降は「クライアント/サーバエンティティ」と呼ばれる)の例示的な図である。クライアント/サーバエンティティは、バス210、プロセッサ220、メインメモリ230、読出専用メモリ(ROM)240、記憶装置250、入力装置260、出力装置270、および通信インターフェイス280を含んでもよい。バス210はクライアント/サーバエンティティの要素間での通信を可能にする経路を含んでもよい。
【0021】
プロセッサ220は、命令を理解し実行する従来のプロセッサ、マイクロプロセッサ、または処理ロジックを含んでもよい。メインメモリ230は、プロセッサ220によって実行するために情報および命令を保存し得るランダムアクセスメモリ(RAM)または別のタイプの動的な記憶装置を含んでもよい。ROM240は、プロセッサ220によって使用するために静的な情報および命令を保存し得る従来のROM装置または別のタイプの静的な記憶装置を含んでもよい。記憶装置250は、磁気および/または光記憶媒体およびその対応するドライブを含んでもよい。
【0022】
入力装置260は、キーボード、マウス、ペン、音声認識および/またはバイオメトリック機構等のオペレータが情報をクライアント/サーバエンティティに入力するのを可能にする従来の機構を含んでもよい。出力装置270は、ディスプレイ、プリンタ、スピーカ等を含む、オペレータに情報を出力する従来の機構を含んでもよい。通信インターフェイス280は、クライアント/サーバエンティティが他の装置および/またはシステムと通信することを可能にするトランシーバのような機構を含んでもよい。たとえば、通信インターフェイス280は、ネットワーク150などのネットワークを通じて別の装置またはシステムと通信するための機構を含んでもよい。
【0023】
以下に詳細に説明するように、この発明の原則に一致するクライアント/サーバエンティティは、ある検索に関係する動作を実行してもよい。クライアント/サーバエンティティは、プロセッサ220がメモリ230などのコンピュータ読取可能な媒体に含まれるソフトウェア命令を実行することに応答してこれらの動作を行なってもよい。コンピュータ読取可能な媒体は、物理的または論理的な記憶装置および/または搬送波として規定されてもよい。
【0024】
ソフトウェアの命令は、データ記憶装置250などの別のコンピュータ読取可能な媒体から、または通信インターフェイス280を通じて別の装置からメモリ230に読出されてもよい。メモリ230に含まれるソフトウェア命令は、後に説明されるプロセスをプロセッサ220に行なわせてもよい。またはこれに代えて、この発明の原則に一致するプロセスを実行するために、配線接続された回路がソフトウェア命令の代わりに、またはソフトウェア命令と組合せて使用されてもよい。したがって、この発明の原則に一致する実現例はハードウェア回路およびソフトウェアの特定の命令に制限されない。
【0025】
例示的な処理
図3A〜3Dは、この発明の原則に一致する一部の実現例による文書に関係するウェブ文書に関する情報を表示するための例示的なプロセスのフローチャートである。処理は、ユーザが文書のリポジトリを検索するために検索用語(または検索用語のグループ)を検索クエリとして提供することで開始してもよい。一実現例では、文書のリポジトリはインターネットおよび/またはデータベース(または1組のデータベース)から利用可能な文書を含み、このリポジトリを検索するための手段は、検索エンジン125(図1)などの検索エンジンである。ユーザは、クライアント110(図1)などのクライアント上のウェブブラウザソフトウェアを通じて検索クエリを提供してもよい。
【0026】
検索クエリは検索エンジンによって受取られ、検索クエリに関係する文書(たとえば、書籍、雑誌、新聞、記事、カタログ等)を識別するために使用されてもよい(動作305および310)(図3A)。検索クエリに関係する文書を識別するためのいくつかの技術が存在する。1つのそのような技術は、検索用語またはおそらく検索用語の類義語を含む文書を識別することを含み得る。検索クエリが2つ以上の検索用語を含む場合、ある技術は、検索用語を語句として含む文書、検索用語を含むが必ずしも一緒には含まない文書、または検索用語のすべてより少ない検索用語を含む文書を識別することを含み得る。さらに他の技術が当業者には知られている。
【0027】
任意で、文書は何らかの態様でスコアを与えられてもよい(動作315)。たとえば、文書に対するスコアは情報検索(IR;information retrieval)スコアに基づいてもよい。IRスコアを生成するためのいくつかの技術が存在する。たとえば、文書に対するIRスコアは、文書テキスト内の検索用語の出現の数に基づいて生成されてもよく、ここで検索用語は文書内(たとえば、タイトル、本文、フッタ、ヘッダ等)に出現し、または検索用語の出現の特性(たとえば、フォント、サイズ、色等)に基づいて生成されてもよい。さらに他の技術が当業者には知られている。
【0028】
検索結果は文書およびそれらの任意のスコアに基づいて形成され、ユーザに表示されてもよい(動作320)。一実現例では、検索結果は、文書のスコアに基づいて任意でソートされ得る、文書へのリンクなどの文書に関連付けられた情報を含み得る。検索結果は、従来の検索エンジンによって提供される検索結果と同様に、HTML文書として提供されてもよい。またはこれに代えて、検索結果は、検索エンジンおよびクライアントによって合意された別のフォーマットに従って提供されてもよい(たとえば、拡張可能マークアップ言語(XML))。
【0029】
図4は、この発明の原則に一致する一実現例による、文書に関連付けられた情報が検索結果400の形で表示され得るグラフィカルユーザインターフェイスの例示的な図である。図4に示されるように、検索結果400は、文書のタイトル410、著者情報420、文書からの抜粋430、および任意で文書内の他の関連する抜粋へのリンク440を含んでもよい。この例に対し、および以下の例に対して、ユーザが検索用語“軍隊”に関連する文書の検索を行ない、1つの結果的な文書が“9/11 報告書”を含むと仮定する。
【0030】
文書のタイトル410は文書に関連付けられたタイトルを含んでもよい。文書のタイトル410の選択は、おそらく参照ページ(以下に説明する)の形で、文書に関連付けられた詳細な情報を表示させる。著者情報420は文書の著者の名前を含んでもよい。抜粋430は、検索クエリの検索用語を含む文書の一部分を含んでもよい。検索用語の出現は、抜粋430内で視覚的に区別(たとえば、ハイライト表示)されてもよい。リンク440は、検索用語を含む文書からの1つまたは複数の他の抜粋をユーザに表示するのを可能にしてもよい。
【0031】
図3Aに戻ると、検索結果の文書のうちの1つがユーザによって選択され得る(動作325)。選択のためにさまざまな周知の技術が使用されてもよい。たとえば、選択はクリック、マウスホバー、マウスオーバー、キーボードを打つこと等によって行なわれてもよい。一実現例では、文書の選択は、図4に示されるように文書のタイトル410の選択などの、文書に関連付けられたリンクの選択を含んでもよい。
【0032】
この発明の原則に一致する一実現例では、おそらく参照ページの形の、文書に関する詳細な情報が、ユーザが文書を選択することに応答してユーザに表示されてもよい(動作330)(図3B)。図5は、この発明の原則に一致する一実現例による文書に関連付けられた参照ページ500の例示的な図である。図5に示されるように、参照ページ500は文書からの抜粋510、文書に関する概略520、文書に関連付けられたジャケットまたはフラップ説明530、関係情報540、書誌情報550、および文書の異なる部分への1組のリンク560を含んでもよい。他の実現例では、参照ページ500はより多い、より少ない、または異なるタイプの情報を含んでもよい。
【0033】
抜粋510は、検索クエリの検索用語を含み得る文書からのテキストの一部分を含んでもよい。テキストの一部分は、文書テキストの画像またはテキストのバージョンに対応してもよい。検索用語の出現はテキストの一部分内で視覚的に区別(たとえば、ハイライト表示)されてもよい。概略520は文書の内容の簡単な説明を含んでもよい。ジャケットまたはフラップ説明530は、文書に関連付けられたジャケット、カバーまたはフラップからのテキストを含んでもよい。
【0034】
書誌情報550は、ISBN、ISSN、出版社名、文書の話題内容のカテゴリを識別するカテゴリコード、および/または出版日などの情報を含んでもよい。別の実現例では、書誌情報550は、より多い、より少ない、または異なる情報片を含んでもよい。リンク560は文書のさまざまな部分へのリンクを含んでもよい。たとえば、リンクは、表紙、目次、関連抜粋、索引、および/または文書の裏表紙を参照してもよい。リンクのうちの1つの選択によって、対応する文書の部分の画像が表示されてもよい。
【0035】
関係情報540は、ユーザが有用であると考え得るさまざまなタイプの情報を含んでもよい。この情報は、関連ウェブ文書を識別するために文書属性(たとえば、タイトル、著者、カテゴリ、出版社、出版日等)に関係する検索を行なうことによって入手されてもよい。
【0036】
検索によって入手され得る情報の例は、文書の批評に関連付けられた情報、文書の話題に関連付けられた情報、文書の主題またはカテゴリに関連付けられた情報、文書と同じシリーズの書籍に関連付けられた情報、文書と同じ雑誌の号に関連付けられた情報、同じ会議からの同じ定期刊行物内または文書と同じ雑誌内の記事に関連付けられた情報、文書または文書の著者に言及する新聞記事、ブログまたは別のタイプのポスティングに関連付けられた情報、文書または文書の話題に関係する製品に関連付けられた情報、文書の出版社に関連付けられた情報、文書に関連付けられた出版日に関連付けられた情報、著者の伝記に関連付けられた情報、著者のウェブページなど著者に関係するウェブ文書に関連付けられた情報、著者の画像に関連付けられた情報、および/または同じ著者による別の文書に関連付けられた情報を含んでもよい。
【0037】
一実現例では、関係情報540は1つまたは複数の文書属性に関連付けられたリンクのリストを含んでもよい。図5に示されるように、2つの例示的なリンク542および544が示される。実際には、他のリンクがあってもよい。リンクのうちの1つの選択によって特定の文書属性に関係する検索が行なわれてもよい。たとえば、著者の伝記544に関連付けられたリンクの選択によって、文書の著者の伝記に関係する情報を含むウェブ文書を識別するために検索が行なわれてもよい。さまざまな話題に関係する検索クエリを形成するための技術が当該技術分野で知られている。
【0038】
関係情報540は、文書属性547のうちの1つまたは複数に関係する1組の広告も任意で含んでもよい。たとえば、広告は、文書、文書の一部分、著者に関連付けられた他の文書、または文書と同じ話題に関係する他の文書を販売してもよい。1組の広告547はさらに、またはこれに代えて、検索クエリの用語、別の(たとえば、関係する)文書、またはユーザの挙動(たとえば、検索または履歴の閲覧)などの他の情報と関連付けられるかまたはそこから導かれてもよい。
【0039】
図3Bに戻ると、文書属性に関係する情報が所望されているか否かが判定されてもよい(動作335)。たとえば、ユーザがリンクのうちの1つまたは関係情報540に関連付けられた広告を選択したか否かが判定されてもよい。文書属性に関係する情報が所望される場合、次に関係するウェブ文書を識別するための文書属性に関係する検索が行なわれてもよい(動作340)。たとえば、ユーザが文書の批評に関する情報を所望した場合、たとえば、文書のタイトルまたは著者の名前に関連付けられた言葉、および「批評」のような言葉を検索クエリとして使用して検索が行なわれてもよい。上述のものと類似の技術を使用して検索クエリに関連のウェブ文書を識別してもよい。
【0040】
ウェブ文書は、IRスコアおよび/またはリンクに基づくスコアに基づいてスコアを任意で与えられてもよい。IRおよびリンクに基づくスコアを生成するためのいくつかの技術が存在する。IRスコアを生成するための例示的な技術は、文書内での検索用語の出現数に基づいてもよい。リンクに基づくスコアの生成のための例示的な技術は、米国特許第6,285,999号に記載される。さらに他の技術が当業者に知られている。
【0041】
別の実現例では、バックグラウンドのタスクとして、関係情報540に関連付けられたリンクのすべてに対して検索が行なわれてもよい。言い換えると、関連ウェブ文書は関係情報540に関連付けられた異なるタイプの情報に対して識別されてもよく、これら関連ウェブ文書は、ユーザがそのような情報を所望したときに、後にユーザに表示するためにキャッシュされてもよい。
【0042】
検索結果は、ウェブ文書およびそれらのスコアに基づいて形成され、ユーザに表示されてもよい(動作345)。一実現例では、検索結果は、ウェブ文書のスコアに基づいて任意でソートされ得る、ウェブ文書へのリンクなどのウェブ文書に関連付けられた情報を含んでもよい。検索結果は、従来の検索エンジンによって提供される検索結果と同様に、HTML文書として提供されてもよい。またはこれに代えて、検索結果は、検索エンジンおよびクライアントによって合意されたフォーマットに従って提供されてもよい(たとえば、XML)。
【0043】
図6は、この発明の原則に一致する一実現例に従って関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。この例示的な実現例では、ユーザが、関係情報540に関連付けられた対応するリンクを選択することによって文書の批評に関係する付加的な情報を所望したと仮定する。この場合、文書の批評を備えたウェブ文書を識別するために検索が行なわれてもよい。たとえば、文書のタイトル(たとえば、「9/11報告書」)または著者の名前および「批評」のような言葉(または文書の批評を備えたウェブ文書を識別しそうな他の検索用語)などの検索用語を使用して関連ウェブ文書を識別してもよい。
【0044】
1組の結果がユーザに表示されてもよく、その2つの例が図6に示される。図6では、例示的な検索結果は書籍−9/11報告書の批評に対応する。検索結果600は、たとえば、ウェブ文書識別子610、ウェブ文書からの抜粋620、およびウェブ文書に関連付けられた他の情報630を含んでもよい。識別子610はウェブ文書を識別してもよい。識別子610の選択によってウェブ文書が表示されてもよい。抜粋620は、検索クエリの検索用語を含み得る文書の一部分を含んでもよい。検索用語の出現は抜粋620内で視覚的に区別(たとえば、ハイライト表示)されてもよい。他の情報630は、ウェブ文書のアドレス、ウェブ文書のサイズ、ウェブ文書に関連付けられた日付、またはウェブ文書に関連付けられた他の情報を含んでもよい。
【0045】
この発明の原則に一致する他の実現例では、ユーザが検索結果内の文書を選択することに応答して検索が行なわれてもよい(動作325)(図3A)。この実現例では、関係するウェブ文書を識別するために文書属性のうちの1つまたは複数に関係する検索が、行なわれてもよい(動作350)(図3C)。たとえば、異なる文書属性に対する検索クエリが形成され、関連ウェブ文書を識別するための検索が行なわれてもよい。上述のものと類似の技術を使用して検索クエリに関連のあるウェブ文書を識別し、かつスコアを与えてもよい。
【0046】
関連するウェブ文書に関する情報を含む文書に関する詳細な情報が、おそらく参照ページの形でユーザに表示されてもよい(動作355)。一実現例では、参照ページは、図5に関して上述の参照ページ500と似ていてもよい。この実現例では、しかしながら、関係情報540に関連付けられたリンクは、関連文書に関連付けられた情報で置換されるか、または補われる。
【0047】
図7は、この発明の原則に一致する別の実現例に従った参照ページ700の一部分の例示的な図である。この実現例では、1つまたは複数の文書属性に関係する1組の検索結果がユーザに表示されてもよい。図7に示されるように、文書の批評542に対応して2つの例示的な検索結果が表示される。図7に示されるように、付加的な検索結果に対するリンクが提供されてもよい。
【0048】
検索結果710は、たとえば、ウェブ文書ソース712、ウェブ文書からの抜粋714、ウェブ文書に関連付けられた他の情報716を含んでもよい。ソース712はウェブ文書のソースを含んでもよい。ソース712の選択によって、対応するウェブ文書が表示されてもよい。抜粋714は、検索クエリの検索用語を含み得るウェブ文書の一部分を含んでもよい。検索用語の出現は、抜粋714内で視覚的に区別(たとえば、ハイライト表示)されてもよい。他の情報716は、ウェブ文書のアドレス、ウェブ文書のサイズ、ウェブ文書に関連付けられた日付、またはウェブ文書に関連付けられた他の情報を含んでもよい。
【0049】
この発明の原則に一致するさらに他の実現例では、ユーザが検索結果内の文書を選択することに応答して検索が行なわれてもよい(動作325)(図3A)。この実現例では、関係するウェブ文書を識別するために1つまたは複数の文書属性に関係する検索が行なわれてもよい(動作360)(図3D)。たとえば、検索クエリは異なる文書属性に対して形成されてもよく、関連のあるウェブ文書を識別するための検索が行なわれてもよい。上述のものと類似の技術を使用して、検索用語に関連のあるウェブ文書を識別し、かつ、スコアを与えてもよい。
【0050】
情報は関連ウェブ文書から抽出されてもよい(動作365)。参照ページの形であり得るページが、抽出された情報に基づいて作成されてもよく、ページはユーザに表示されてもよい(動作370および375)。一実現例では、参照ページは図5に関して上述の参照ページ500と似ていてもよい。この実現例では、しかしながら、関係情報540に関連付けられたリンクは、関連のあるウェブ文書から抽出された情報で置換されるかまたは補足されてもよい。
【0051】
図8は、この発明の原則に一致するさらに別の実現例による参照ページ800の一部分の例示的な図である。この実現例では、情報は、1組の検索結果に対応するウェブ文書から抽出されてもよく、この情報は関係情報540の各タイプに対してユーザに表示されてもよい。その検索結果から抽出された特定のタイプの情報は、ユーザが有用であると考え得る情報を含んでもよい。
【0052】
図8に示されるように、2つの例示的な検索結果から抽出された情報が文書の批評に関係して表示される。情報810は、たとえば、情報ソース812、任意の顧客評価814、批評816、および他の情報818を含んでもよい。ソース812は情報のソース(たとえば、Amazon.com)を含んでもよい。ソース812の選択によって、そのソースからのウェブ文書が表示されてもよい。顧客評価814は、ソース812(たとえば、Amazon.com)の顧客による文書の評価を含んでもよい。批評816は、ソース812(たとえば、Amazon.com)によって提供されるような文書の批評(または批評の一部分)を含んでもよい。他の情報818は、ウェブ文書のアドレス、ウェブ文書のサイズ、ウェブ文書に関連付けられた日付、またはウェブ文書に関連付けられた他の情報を含んでもよい。
【0053】
代替のグラフィカルユーザインターフェイス
この発明の原則に一致する代替の実現例では、情報は図4に関して上述のものと類似の文書に関して表示されてもよい。この場合、しかしながら、関係情報540(図5)と類似の関係情報に付加的なリンクが提供されてもよい。図9は、この発明の原則に一致するこの代替の実現例による、文書に関連付けられた情報が検索結果900の形で表示され得るグラフィカルユーザインターフェイスの例示的な図である。図9に示されるように、検索結果900は、文書のタイトル410、著者情報420、文書からの抜粋430、文書内の他の関連の抜粋への任意のリンク440、関係情報へのリンク910を含んでもよい。文書のタイトル410、著者情報420、抜粋430および任意のリンク440は図4に関して上述のものと類似であってもよい。
【0054】
リンク910は関係情報を表示させてもよい。図10Aおよび図10Bは、この発明の原則に一致する2つの異なる実現例による、関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。図10Aに示されるように、リンク910の選択によって、1組のリンクが提供されてもよく、当該1組のリンクはそれらが関連付けられた異なるタイプの文書属性に基づいて任意で分離されてもよい。1組のリンク内のリンクの選択によって上述のように検索が行なわれ、結果が表示されてもよい。
【0055】
図10Bに示されるように、リンク910の選択によって検索が行なわれ、かつ結果が、それらが関連付けられた異なるタイプの文書属性に関して表示されてもよい。一実現例では、1組の検索結果が提供され得る(図7と同様)。検索結果のうちの1つの選択によって、上述のように対応するウェブ文書が表示されてもよい。別の実現例では、1組の検索結果に対応するウェブ文書からの抽出された情報が提供されてもよい(図8と同様)。
【0056】
結論
この発明の原則に一致するシステムおよび方法は、1つまたは複数の文書属性に関係する付加的な情報を検索し、かつ、この付加的な情報を文書に関連して提供してもよい。
【0057】
この発明の好ましい実施例の上述の説明は例示および説明を提供するが、網羅的であること、またはこの発明を開示された正確な形に制限することは意図されない。上述の教示に鑑みて変形および修正が可能であり、または変形および修正はこの発明の実施から獲得されてもよい。
【0058】
たとえば、一連の動作が図3A〜3Dに関して説明されているが、動作の順序はこの発明の原則に一致する他の実現例では変更されてもよい。さらに、非従属の動作は並行して行なわれてもよい。
【0059】
文書は検索の結果として識別され、文書またはその文書の著者に関係するウェブ文書が表示されてもよいと説明されている。他の実現例では、しかしながら、文書は、ディレクトリ、カテゴリ、または文書の他の一覧などの他の方法で識別されてもよい。
【0060】
例示的なグラフィカルユーザインターフェイスが図4〜10Bに関して説明されている。この発明の原則に一致する他の実現例では、グラフィカルユーザインターフェイスは、より多い、より少ない、または異なる情報を含んでもよい。
【0061】
当業者には、上述のように、この発明の局面は、図面に示される実現例において、多くの異なる形のソフトウェア、ファームウェア、ハードウェアで実現され得ることが明らかであろう。この発明の原則に一致する局面を実現するために使用される実際のソフトウェアコードまたは特化された制御ハードウェアはこの発明の制限ではない。したがって、当該局面の動作および挙動は特定のソフトウェアコードに言及することなく説明されており、当業者はここでの説明に基づいてその局面を実現するためにソフトウェアを設計し、ハードウェアを制御することができることが理解される。
【0062】
この出願で使用される要素、動作または命令は、そのようなものと明示的に示されない限り、この発明にとって重要または本質的であるものと理解されるべきではない。また、ここで使用されるように、冠詞“a”は1つまたは複数の品目を含むことを意図される。1つのみの品目が意図される場合、「1つ(“one”)」または類似の言葉が使用される。さらに、「に基づいて(“based on”)」は、明示的に別段の記載がない限り「に少なくとも部分的に基づいて(“based, at least in part, on”)」を意味することを意図される。
【技術分野】
【0001】
背景
発明の分野
この発明の原則に一致するシステムおよび方法は、一般に情報検索に関し、特に、特定の文書に関連する情報の提供に関する。
【背景技術】
【0002】
関連技術の説明
現在のコンピュータネットワーク、特に、インターネットは、広くかつ容易に利用可能な情報の大きな塊を作り上げている。無料のインターネット検索エンジンは、たとえば、インターネットにリンクされる何百万のウェブ文書に索引を付ける。インターネットに接続されるユーザは、検索クエリに関連するウェブ文書をすばやく見つけるために単純な検索クエリを入力することができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、インターネット上で広く利用可能でない内容の1つのカテゴリは、書籍および雑誌などのより伝統的な印刷された著作物を含む。そのような作品をデジタル的に利用可能にすることに対する1つの障害は、作品の印刷版をデジタルの形に変換することが困難であり得るということである。光学文字認識(OCR)は光学スキャン装置を使用して、後にコンピュータの読取可能なフォーマット(たとえば、ASCIIファイル)の文字に変換されるテキストの画像を生成する動作であり、印刷されたテキストを有用なデジタルの形に変換するための既知の技術である。OCRシステムは、一般に印刷されたページの画像を生成するための光学スキャナ、および画像を分析するためのソフトウェアを含む。
【課題を解決するための手段】
【0004】
概要
一局面によると、ある方法は、検索クエリを受取るステップと、検索クエリに基づいて文書を識別するために第1の検索を行なうステップと、文書に関連付けられた属性に基づいて第2の検索を行なうステップと、第2の検索の結果を表示するステップとを含んでもよい。
【0005】
別の局面によると、あるシステムは、命令を記憶するためのメモリと、命令を実行するためのプロセッサとを含んでもよい。このシステムは、文書を識別し、文書に関連付けられた属性に関係する情報を備えたウェブ文書を識別するために検索を行ない、ウェブ文書に関連付けられた情報を表示してもよい。
【0006】
さらに別の局面によると、コンピュータ読取可能な媒体に組込まれたグラフィカルユーザインターフェイスは、文書の部分への1組のリンクと、文書の内容の説明と、文書に関連付けられた書誌情報とを含んでもよい。グラフィカルユーザインターフェイスは、文書に関連付けられた属性に関係する情報を備えたウェブ文書に対する検索を行なわせるリンクも含んでもよい。
【0007】
別の局面によると、ある方法は、ユーザから文書の識別を受取るステップと、文書に関連付けられた属性に関係するウェブ文書を識別するために複数の検索を自動的に行なうステップと、ウェブ文書に関連付けられた情報をユーザに提供するステップとを含んでもよい。
【0008】
さらに別の局面によると、コンピュータ読取可能な媒体は、文書を識別するための命令と、文書に関連付けられた属性に関係する情報を備えたウェブ文書を識別するために検索を行なうための命令と、ウェブ文書から情報を抽出するための命令と、抽出された情報を文書に関連付けられた情報とともに表示するための命令とを含むコンピュータの実行可能な命令を含んでもよい。
【図面の簡単な説明】
【0009】
【図1】この発明の原則に一致するシステムおよび方法が実現され得るネットワークの例示的な図である。
【図2】この発明の原則に一致する実現例による図1のクライアントまたはサーバの例示的な図である。
【図3A】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図3B】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図3C】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図3D】この発明の原則に一致する一部の実現例による、文書に関係するウェブ文書に関する情報を表示するための例示的な処理のフローチャートである。
【図4】この発明の原則に一致する一実現例による、文書に関連付けられた情報が検索結果として表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図5】この発明の原則に一致する一実現例による、文書に関連付けられた参照ページの表示の例示的な図である。
【図6】この発明の原則に一致する一実現例による、ウェブ文書に関連付けられた情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図7】この発明の原則に一致する別の実現例による、参照ページの一部分の例示的な図である。
【図8】この発明の原則に一致するさらに別の実現例による、参照ページの一部分の例示的な図である。
【図9】この発明の原則に一致する代替の実現例による、文書に関連付けられた情報が検索結果の形で表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図10A】この発明の原則に一致する2つの異なる実現例による、関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【図10B】この発明の原則に一致する2つの異なる実現例による、関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。
【発明を実施するための形態】
【0010】
この明細書に組込まれかつこの明細書の一部を構成する添付の図面は、説明とともにこの発明の実施例を例示し、この発明を説明する。
【0011】
詳細な説明
この発明の以下の詳細な説明は添付の図面を参照する。異なる図面中の同じ参照番号は同じかまたは類似の要素を識別し得る。以下の詳細な説明はこの発明を制限しない。
【0012】
概略
より多くのタイプの文書が検索エンジンを通じて検索可能となっている。たとえば、書籍、雑誌、および/またはカタログなどの一部の文書はスキャンされ、それらのテキストはOCRを通じて認識され得る。これら文書についてより理解し、かつ、この付加的な情報をユーザに利用可能にすることは有益である。
【0013】
この発明の原則に一致するシステムおよび方法は、文書に関連付けられた1つまたは複数の属性(「文書属性」とも称される)に関係する付加的な情報を自動的に検索し、この付加的な情報を文書に関連して提供してもよい。
【0014】
例示的なネットワーク構成
図1は、この発明の原則に一致するシステムおよび方法が実現され得るネットワーク100の例示的な図である。ネットワーク100は、ネットワーク150を通じて複数のサーバ120〜140に接続された複数のクライアント110を含み得る。簡略化のために、2つのクライアント110および3つのサーバ120〜140がネットワーク150に接続されるように示される。実際には、より多く、または、より少ないクライアントおよびサーバがあってもよい。場合によっては、クライアントがサーバの機能を実行してもよく、サーバがクライアントの機能を実行してもよい。
【0015】
クライアント110はクライアントエンティティを含み得る。エンティティは、無線電話、パーソナルコンピュータ、携帯情報端末(PDA)、ラップトップ、もしくは別のタイプの計算または通信装置、これら装置のうちの1つの上で作動するスレッドまたはプロセス、および/またはこれら装置のうちの1つによって実行可能なオブジェクトなどの装置として規定されてもよい。サーバ120〜140は、この発明の原則に一致する態様で文書を集め、処理し、検索しおよび/または維持するサーバエンティティを含んでもよい。
【0016】
この発明の原則に一致する実現例では、サーバ120はクライアント110によって使用可能な検索エンジン125を含んでもよい。サーバ120は文書(たとえば、ウェブ文書)のコーパスを巡回し、文書に索引を付け、文書に関連付けられた情報を文書のリポジトリに保存してもよい。これに代えて、またはこれに加えて、サーバ120は、文書(たとえば、書籍、雑誌、新聞、記事、カタログ等)のデータベース(または1組のデータベース)を分析し、文書に関連付けられた情報を同一の、または異なるリポジトリに保存してもよい。サーバ130および140は、サーバ120によって巡回または分析され得る文書を保存または維持してもよい。
【0017】
サーバ120〜140は別々のエンティティとして示されるが、サーバ120〜140のうちの1つまたは複数がサーバ120〜140のうちの別の1つまたは複数の機能のうちの1つまたは複数を実行することが可能であり得る。たとえば、サーバ120〜140のうちの2つ以上が単一のサーバとして実現されることが可能であり得る。サーバ120〜140のうちの1つを2つ以上の別々の(おそらく分散される)装置として実現することも可能であり得る。
【0018】
ネットワーク150は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、公衆交換電話網(PSTN)などの電話網、イントラネット、インターネット、記憶装置またはネットワークの組合せを含んでもよい。クライアント110およびサーバ120〜140は、有線接続、無線接続、および/または光接続を通じてネットワーク150に接続してもよい。
【0019】
ここで使用されるように、「文書」という用語は、書籍、雑誌、カタログ、新聞、記事等の伝統的な印刷された著作物を含むものと広く理解されるべきである。ここで使用されるように、「ウェブ文書」という用語は、ネットワーク150などのネットワークを通じて利用可能な機械が読取可能、かつ機械が記憶可能な作業生産物を含むものと広く理解されるべきである。ウェブ文書は、たとえば、ウェブサイト、ファイル、ファイルの組合せ、他のファイルへの埋込リンクを備えた1つまたは複数のファイル、ニュースグループのポスティング、ブログ、ウェブ広告等を含んでもよい。インターネットの文脈では、一般的なウェブ文書はウェブページである。ウェブページはしばしばテキスト情報を含み、埋込情報(メタ情報、画像、ハイパーリンク等)および埋込命令(ジャバスクリプト等)を含んでもよい。ここで使用されるように、「リンク」という用語は、ウェブ文書へまたはウェブ文書からの参照を含むものと広く理解されるべきである。
【0020】
例示的なクライアント/サーバアーキテクチャ
図2は、この発明の原則に一致する実施例による、クライアント110およびサーバ120〜140のうちの1つまたは複数に対応し得るクライアントまたはサーバエンティティ(以降は「クライアント/サーバエンティティ」と呼ばれる)の例示的な図である。クライアント/サーバエンティティは、バス210、プロセッサ220、メインメモリ230、読出専用メモリ(ROM)240、記憶装置250、入力装置260、出力装置270、および通信インターフェイス280を含んでもよい。バス210はクライアント/サーバエンティティの要素間での通信を可能にする経路を含んでもよい。
【0021】
プロセッサ220は、命令を理解し実行する従来のプロセッサ、マイクロプロセッサ、または処理ロジックを含んでもよい。メインメモリ230は、プロセッサ220によって実行するために情報および命令を保存し得るランダムアクセスメモリ(RAM)または別のタイプの動的な記憶装置を含んでもよい。ROM240は、プロセッサ220によって使用するために静的な情報および命令を保存し得る従来のROM装置または別のタイプの静的な記憶装置を含んでもよい。記憶装置250は、磁気および/または光記憶媒体およびその対応するドライブを含んでもよい。
【0022】
入力装置260は、キーボード、マウス、ペン、音声認識および/またはバイオメトリック機構等のオペレータが情報をクライアント/サーバエンティティに入力するのを可能にする従来の機構を含んでもよい。出力装置270は、ディスプレイ、プリンタ、スピーカ等を含む、オペレータに情報を出力する従来の機構を含んでもよい。通信インターフェイス280は、クライアント/サーバエンティティが他の装置および/またはシステムと通信することを可能にするトランシーバのような機構を含んでもよい。たとえば、通信インターフェイス280は、ネットワーク150などのネットワークを通じて別の装置またはシステムと通信するための機構を含んでもよい。
【0023】
以下に詳細に説明するように、この発明の原則に一致するクライアント/サーバエンティティは、ある検索に関係する動作を実行してもよい。クライアント/サーバエンティティは、プロセッサ220がメモリ230などのコンピュータ読取可能な媒体に含まれるソフトウェア命令を実行することに応答してこれらの動作を行なってもよい。コンピュータ読取可能な媒体は、物理的または論理的な記憶装置および/または搬送波として規定されてもよい。
【0024】
ソフトウェアの命令は、データ記憶装置250などの別のコンピュータ読取可能な媒体から、または通信インターフェイス280を通じて別の装置からメモリ230に読出されてもよい。メモリ230に含まれるソフトウェア命令は、後に説明されるプロセスをプロセッサ220に行なわせてもよい。またはこれに代えて、この発明の原則に一致するプロセスを実行するために、配線接続された回路がソフトウェア命令の代わりに、またはソフトウェア命令と組合せて使用されてもよい。したがって、この発明の原則に一致する実現例はハードウェア回路およびソフトウェアの特定の命令に制限されない。
【0025】
例示的な処理
図3A〜3Dは、この発明の原則に一致する一部の実現例による文書に関係するウェブ文書に関する情報を表示するための例示的なプロセスのフローチャートである。処理は、ユーザが文書のリポジトリを検索するために検索用語(または検索用語のグループ)を検索クエリとして提供することで開始してもよい。一実現例では、文書のリポジトリはインターネットおよび/またはデータベース(または1組のデータベース)から利用可能な文書を含み、このリポジトリを検索するための手段は、検索エンジン125(図1)などの検索エンジンである。ユーザは、クライアント110(図1)などのクライアント上のウェブブラウザソフトウェアを通じて検索クエリを提供してもよい。
【0026】
検索クエリは検索エンジンによって受取られ、検索クエリに関係する文書(たとえば、書籍、雑誌、新聞、記事、カタログ等)を識別するために使用されてもよい(動作305および310)(図3A)。検索クエリに関係する文書を識別するためのいくつかの技術が存在する。1つのそのような技術は、検索用語またはおそらく検索用語の類義語を含む文書を識別することを含み得る。検索クエリが2つ以上の検索用語を含む場合、ある技術は、検索用語を語句として含む文書、検索用語を含むが必ずしも一緒には含まない文書、または検索用語のすべてより少ない検索用語を含む文書を識別することを含み得る。さらに他の技術が当業者には知られている。
【0027】
任意で、文書は何らかの態様でスコアを与えられてもよい(動作315)。たとえば、文書に対するスコアは情報検索(IR;information retrieval)スコアに基づいてもよい。IRスコアを生成するためのいくつかの技術が存在する。たとえば、文書に対するIRスコアは、文書テキスト内の検索用語の出現の数に基づいて生成されてもよく、ここで検索用語は文書内(たとえば、タイトル、本文、フッタ、ヘッダ等)に出現し、または検索用語の出現の特性(たとえば、フォント、サイズ、色等)に基づいて生成されてもよい。さらに他の技術が当業者には知られている。
【0028】
検索結果は文書およびそれらの任意のスコアに基づいて形成され、ユーザに表示されてもよい(動作320)。一実現例では、検索結果は、文書のスコアに基づいて任意でソートされ得る、文書へのリンクなどの文書に関連付けられた情報を含み得る。検索結果は、従来の検索エンジンによって提供される検索結果と同様に、HTML文書として提供されてもよい。またはこれに代えて、検索結果は、検索エンジンおよびクライアントによって合意された別のフォーマットに従って提供されてもよい(たとえば、拡張可能マークアップ言語(XML))。
【0029】
図4は、この発明の原則に一致する一実現例による、文書に関連付けられた情報が検索結果400の形で表示され得るグラフィカルユーザインターフェイスの例示的な図である。図4に示されるように、検索結果400は、文書のタイトル410、著者情報420、文書からの抜粋430、および任意で文書内の他の関連する抜粋へのリンク440を含んでもよい。この例に対し、および以下の例に対して、ユーザが検索用語“軍隊”に関連する文書の検索を行ない、1つの結果的な文書が“9/11 報告書”を含むと仮定する。
【0030】
文書のタイトル410は文書に関連付けられたタイトルを含んでもよい。文書のタイトル410の選択は、おそらく参照ページ(以下に説明する)の形で、文書に関連付けられた詳細な情報を表示させる。著者情報420は文書の著者の名前を含んでもよい。抜粋430は、検索クエリの検索用語を含む文書の一部分を含んでもよい。検索用語の出現は、抜粋430内で視覚的に区別(たとえば、ハイライト表示)されてもよい。リンク440は、検索用語を含む文書からの1つまたは複数の他の抜粋をユーザに表示するのを可能にしてもよい。
【0031】
図3Aに戻ると、検索結果の文書のうちの1つがユーザによって選択され得る(動作325)。選択のためにさまざまな周知の技術が使用されてもよい。たとえば、選択はクリック、マウスホバー、マウスオーバー、キーボードを打つこと等によって行なわれてもよい。一実現例では、文書の選択は、図4に示されるように文書のタイトル410の選択などの、文書に関連付けられたリンクの選択を含んでもよい。
【0032】
この発明の原則に一致する一実現例では、おそらく参照ページの形の、文書に関する詳細な情報が、ユーザが文書を選択することに応答してユーザに表示されてもよい(動作330)(図3B)。図5は、この発明の原則に一致する一実現例による文書に関連付けられた参照ページ500の例示的な図である。図5に示されるように、参照ページ500は文書からの抜粋510、文書に関する概略520、文書に関連付けられたジャケットまたはフラップ説明530、関係情報540、書誌情報550、および文書の異なる部分への1組のリンク560を含んでもよい。他の実現例では、参照ページ500はより多い、より少ない、または異なるタイプの情報を含んでもよい。
【0033】
抜粋510は、検索クエリの検索用語を含み得る文書からのテキストの一部分を含んでもよい。テキストの一部分は、文書テキストの画像またはテキストのバージョンに対応してもよい。検索用語の出現はテキストの一部分内で視覚的に区別(たとえば、ハイライト表示)されてもよい。概略520は文書の内容の簡単な説明を含んでもよい。ジャケットまたはフラップ説明530は、文書に関連付けられたジャケット、カバーまたはフラップからのテキストを含んでもよい。
【0034】
書誌情報550は、ISBN、ISSN、出版社名、文書の話題内容のカテゴリを識別するカテゴリコード、および/または出版日などの情報を含んでもよい。別の実現例では、書誌情報550は、より多い、より少ない、または異なる情報片を含んでもよい。リンク560は文書のさまざまな部分へのリンクを含んでもよい。たとえば、リンクは、表紙、目次、関連抜粋、索引、および/または文書の裏表紙を参照してもよい。リンクのうちの1つの選択によって、対応する文書の部分の画像が表示されてもよい。
【0035】
関係情報540は、ユーザが有用であると考え得るさまざまなタイプの情報を含んでもよい。この情報は、関連ウェブ文書を識別するために文書属性(たとえば、タイトル、著者、カテゴリ、出版社、出版日等)に関係する検索を行なうことによって入手されてもよい。
【0036】
検索によって入手され得る情報の例は、文書の批評に関連付けられた情報、文書の話題に関連付けられた情報、文書の主題またはカテゴリに関連付けられた情報、文書と同じシリーズの書籍に関連付けられた情報、文書と同じ雑誌の号に関連付けられた情報、同じ会議からの同じ定期刊行物内または文書と同じ雑誌内の記事に関連付けられた情報、文書または文書の著者に言及する新聞記事、ブログまたは別のタイプのポスティングに関連付けられた情報、文書または文書の話題に関係する製品に関連付けられた情報、文書の出版社に関連付けられた情報、文書に関連付けられた出版日に関連付けられた情報、著者の伝記に関連付けられた情報、著者のウェブページなど著者に関係するウェブ文書に関連付けられた情報、著者の画像に関連付けられた情報、および/または同じ著者による別の文書に関連付けられた情報を含んでもよい。
【0037】
一実現例では、関係情報540は1つまたは複数の文書属性に関連付けられたリンクのリストを含んでもよい。図5に示されるように、2つの例示的なリンク542および544が示される。実際には、他のリンクがあってもよい。リンクのうちの1つの選択によって特定の文書属性に関係する検索が行なわれてもよい。たとえば、著者の伝記544に関連付けられたリンクの選択によって、文書の著者の伝記に関係する情報を含むウェブ文書を識別するために検索が行なわれてもよい。さまざまな話題に関係する検索クエリを形成するための技術が当該技術分野で知られている。
【0038】
関係情報540は、文書属性547のうちの1つまたは複数に関係する1組の広告も任意で含んでもよい。たとえば、広告は、文書、文書の一部分、著者に関連付けられた他の文書、または文書と同じ話題に関係する他の文書を販売してもよい。1組の広告547はさらに、またはこれに代えて、検索クエリの用語、別の(たとえば、関係する)文書、またはユーザの挙動(たとえば、検索または履歴の閲覧)などの他の情報と関連付けられるかまたはそこから導かれてもよい。
【0039】
図3Bに戻ると、文書属性に関係する情報が所望されているか否かが判定されてもよい(動作335)。たとえば、ユーザがリンクのうちの1つまたは関係情報540に関連付けられた広告を選択したか否かが判定されてもよい。文書属性に関係する情報が所望される場合、次に関係するウェブ文書を識別するための文書属性に関係する検索が行なわれてもよい(動作340)。たとえば、ユーザが文書の批評に関する情報を所望した場合、たとえば、文書のタイトルまたは著者の名前に関連付けられた言葉、および「批評」のような言葉を検索クエリとして使用して検索が行なわれてもよい。上述のものと類似の技術を使用して検索クエリに関連のウェブ文書を識別してもよい。
【0040】
ウェブ文書は、IRスコアおよび/またはリンクに基づくスコアに基づいてスコアを任意で与えられてもよい。IRおよびリンクに基づくスコアを生成するためのいくつかの技術が存在する。IRスコアを生成するための例示的な技術は、文書内での検索用語の出現数に基づいてもよい。リンクに基づくスコアの生成のための例示的な技術は、米国特許第6,285,999号に記載される。さらに他の技術が当業者に知られている。
【0041】
別の実現例では、バックグラウンドのタスクとして、関係情報540に関連付けられたリンクのすべてに対して検索が行なわれてもよい。言い換えると、関連ウェブ文書は関係情報540に関連付けられた異なるタイプの情報に対して識別されてもよく、これら関連ウェブ文書は、ユーザがそのような情報を所望したときに、後にユーザに表示するためにキャッシュされてもよい。
【0042】
検索結果は、ウェブ文書およびそれらのスコアに基づいて形成され、ユーザに表示されてもよい(動作345)。一実現例では、検索結果は、ウェブ文書のスコアに基づいて任意でソートされ得る、ウェブ文書へのリンクなどのウェブ文書に関連付けられた情報を含んでもよい。検索結果は、従来の検索エンジンによって提供される検索結果と同様に、HTML文書として提供されてもよい。またはこれに代えて、検索結果は、検索エンジンおよびクライアントによって合意されたフォーマットに従って提供されてもよい(たとえば、XML)。
【0043】
図6は、この発明の原則に一致する一実現例に従って関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。この例示的な実現例では、ユーザが、関係情報540に関連付けられた対応するリンクを選択することによって文書の批評に関係する付加的な情報を所望したと仮定する。この場合、文書の批評を備えたウェブ文書を識別するために検索が行なわれてもよい。たとえば、文書のタイトル(たとえば、「9/11報告書」)または著者の名前および「批評」のような言葉(または文書の批評を備えたウェブ文書を識別しそうな他の検索用語)などの検索用語を使用して関連ウェブ文書を識別してもよい。
【0044】
1組の結果がユーザに表示されてもよく、その2つの例が図6に示される。図6では、例示的な検索結果は書籍−9/11報告書の批評に対応する。検索結果600は、たとえば、ウェブ文書識別子610、ウェブ文書からの抜粋620、およびウェブ文書に関連付けられた他の情報630を含んでもよい。識別子610はウェブ文書を識別してもよい。識別子610の選択によってウェブ文書が表示されてもよい。抜粋620は、検索クエリの検索用語を含み得る文書の一部分を含んでもよい。検索用語の出現は抜粋620内で視覚的に区別(たとえば、ハイライト表示)されてもよい。他の情報630は、ウェブ文書のアドレス、ウェブ文書のサイズ、ウェブ文書に関連付けられた日付、またはウェブ文書に関連付けられた他の情報を含んでもよい。
【0045】
この発明の原則に一致する他の実現例では、ユーザが検索結果内の文書を選択することに応答して検索が行なわれてもよい(動作325)(図3A)。この実現例では、関係するウェブ文書を識別するために文書属性のうちの1つまたは複数に関係する検索が、行なわれてもよい(動作350)(図3C)。たとえば、異なる文書属性に対する検索クエリが形成され、関連ウェブ文書を識別するための検索が行なわれてもよい。上述のものと類似の技術を使用して検索クエリに関連のあるウェブ文書を識別し、かつスコアを与えてもよい。
【0046】
関連するウェブ文書に関する情報を含む文書に関する詳細な情報が、おそらく参照ページの形でユーザに表示されてもよい(動作355)。一実現例では、参照ページは、図5に関して上述の参照ページ500と似ていてもよい。この実現例では、しかしながら、関係情報540に関連付けられたリンクは、関連文書に関連付けられた情報で置換されるか、または補われる。
【0047】
図7は、この発明の原則に一致する別の実現例に従った参照ページ700の一部分の例示的な図である。この実現例では、1つまたは複数の文書属性に関係する1組の検索結果がユーザに表示されてもよい。図7に示されるように、文書の批評542に対応して2つの例示的な検索結果が表示される。図7に示されるように、付加的な検索結果に対するリンクが提供されてもよい。
【0048】
検索結果710は、たとえば、ウェブ文書ソース712、ウェブ文書からの抜粋714、ウェブ文書に関連付けられた他の情報716を含んでもよい。ソース712はウェブ文書のソースを含んでもよい。ソース712の選択によって、対応するウェブ文書が表示されてもよい。抜粋714は、検索クエリの検索用語を含み得るウェブ文書の一部分を含んでもよい。検索用語の出現は、抜粋714内で視覚的に区別(たとえば、ハイライト表示)されてもよい。他の情報716は、ウェブ文書のアドレス、ウェブ文書のサイズ、ウェブ文書に関連付けられた日付、またはウェブ文書に関連付けられた他の情報を含んでもよい。
【0049】
この発明の原則に一致するさらに他の実現例では、ユーザが検索結果内の文書を選択することに応答して検索が行なわれてもよい(動作325)(図3A)。この実現例では、関係するウェブ文書を識別するために1つまたは複数の文書属性に関係する検索が行なわれてもよい(動作360)(図3D)。たとえば、検索クエリは異なる文書属性に対して形成されてもよく、関連のあるウェブ文書を識別するための検索が行なわれてもよい。上述のものと類似の技術を使用して、検索用語に関連のあるウェブ文書を識別し、かつ、スコアを与えてもよい。
【0050】
情報は関連ウェブ文書から抽出されてもよい(動作365)。参照ページの形であり得るページが、抽出された情報に基づいて作成されてもよく、ページはユーザに表示されてもよい(動作370および375)。一実現例では、参照ページは図5に関して上述の参照ページ500と似ていてもよい。この実現例では、しかしながら、関係情報540に関連付けられたリンクは、関連のあるウェブ文書から抽出された情報で置換されるかまたは補足されてもよい。
【0051】
図8は、この発明の原則に一致するさらに別の実現例による参照ページ800の一部分の例示的な図である。この実現例では、情報は、1組の検索結果に対応するウェブ文書から抽出されてもよく、この情報は関係情報540の各タイプに対してユーザに表示されてもよい。その検索結果から抽出された特定のタイプの情報は、ユーザが有用であると考え得る情報を含んでもよい。
【0052】
図8に示されるように、2つの例示的な検索結果から抽出された情報が文書の批評に関係して表示される。情報810は、たとえば、情報ソース812、任意の顧客評価814、批評816、および他の情報818を含んでもよい。ソース812は情報のソース(たとえば、Amazon.com)を含んでもよい。ソース812の選択によって、そのソースからのウェブ文書が表示されてもよい。顧客評価814は、ソース812(たとえば、Amazon.com)の顧客による文書の評価を含んでもよい。批評816は、ソース812(たとえば、Amazon.com)によって提供されるような文書の批評(または批評の一部分)を含んでもよい。他の情報818は、ウェブ文書のアドレス、ウェブ文書のサイズ、ウェブ文書に関連付けられた日付、またはウェブ文書に関連付けられた他の情報を含んでもよい。
【0053】
代替のグラフィカルユーザインターフェイス
この発明の原則に一致する代替の実現例では、情報は図4に関して上述のものと類似の文書に関して表示されてもよい。この場合、しかしながら、関係情報540(図5)と類似の関係情報に付加的なリンクが提供されてもよい。図9は、この発明の原則に一致するこの代替の実現例による、文書に関連付けられた情報が検索結果900の形で表示され得るグラフィカルユーザインターフェイスの例示的な図である。図9に示されるように、検索結果900は、文書のタイトル410、著者情報420、文書からの抜粋430、文書内の他の関連の抜粋への任意のリンク440、関係情報へのリンク910を含んでもよい。文書のタイトル410、著者情報420、抜粋430および任意のリンク440は図4に関して上述のものと類似であってもよい。
【0054】
リンク910は関係情報を表示させてもよい。図10Aおよび図10Bは、この発明の原則に一致する2つの異なる実現例による、関係情報が表示され得るグラフィカルユーザインターフェイスの例示的な図である。図10Aに示されるように、リンク910の選択によって、1組のリンクが提供されてもよく、当該1組のリンクはそれらが関連付けられた異なるタイプの文書属性に基づいて任意で分離されてもよい。1組のリンク内のリンクの選択によって上述のように検索が行なわれ、結果が表示されてもよい。
【0055】
図10Bに示されるように、リンク910の選択によって検索が行なわれ、かつ結果が、それらが関連付けられた異なるタイプの文書属性に関して表示されてもよい。一実現例では、1組の検索結果が提供され得る(図7と同様)。検索結果のうちの1つの選択によって、上述のように対応するウェブ文書が表示されてもよい。別の実現例では、1組の検索結果に対応するウェブ文書からの抽出された情報が提供されてもよい(図8と同様)。
【0056】
結論
この発明の原則に一致するシステムおよび方法は、1つまたは複数の文書属性に関係する付加的な情報を検索し、かつ、この付加的な情報を文書に関連して提供してもよい。
【0057】
この発明の好ましい実施例の上述の説明は例示および説明を提供するが、網羅的であること、またはこの発明を開示された正確な形に制限することは意図されない。上述の教示に鑑みて変形および修正が可能であり、または変形および修正はこの発明の実施から獲得されてもよい。
【0058】
たとえば、一連の動作が図3A〜3Dに関して説明されているが、動作の順序はこの発明の原則に一致する他の実現例では変更されてもよい。さらに、非従属の動作は並行して行なわれてもよい。
【0059】
文書は検索の結果として識別され、文書またはその文書の著者に関係するウェブ文書が表示されてもよいと説明されている。他の実現例では、しかしながら、文書は、ディレクトリ、カテゴリ、または文書の他の一覧などの他の方法で識別されてもよい。
【0060】
例示的なグラフィカルユーザインターフェイスが図4〜10Bに関して説明されている。この発明の原則に一致する他の実現例では、グラフィカルユーザインターフェイスは、より多い、より少ない、または異なる情報を含んでもよい。
【0061】
当業者には、上述のように、この発明の局面は、図面に示される実現例において、多くの異なる形のソフトウェア、ファームウェア、ハードウェアで実現され得ることが明らかであろう。この発明の原則に一致する局面を実現するために使用される実際のソフトウェアコードまたは特化された制御ハードウェアはこの発明の制限ではない。したがって、当該局面の動作および挙動は特定のソフトウェアコードに言及することなく説明されており、当業者はここでの説明に基づいてその局面を実現するためにソフトウェアを設計し、ハードウェアを制御することができることが理解される。
【0062】
この出願で使用される要素、動作または命令は、そのようなものと明示的に示されない限り、この発明にとって重要または本質的であるものと理解されるべきではない。また、ここで使用されるように、冠詞“a”は1つまたは複数の品目を含むことを意図される。1つのみの品目が意図される場合、「1つ(“one”)」または類似の言葉が使用される。さらに、「に基づいて(“based on”)」は、明示的に別段の記載がない限り「に少なくとも部分的に基づいて(“based, at least in part, on”)」を意味することを意図される。
【特許請求の範囲】
【請求項1】
コンピュータシステムによって実行される方法であって、
前記コンピュータシステムによって、ネットワーク上のクライアント装置から検索クエリを受取るステップと、
前記コンピュータシステムによって、前記検索クエリに基づいて検索結果の組を識別するために第1の検索を行なうステップと、
前記コンピュータシステムによって、前記クライアント装置上のディスプレイに前記検索結果の組を表示するステップと、
前記コンピュータシステムによって、前記検索結果のうちの1つの選択を、前記クライアント装置から受取るステップと、
前記コンピュータシステムによって、前記検索結果のうちの1つの選択を受取ることに応答して、前記検索結果のうちの前記選択された一つに関連付けられたスキャンされた文書に関連付けられ、前記スキャンされた文書に関する情報および検索に関連付けられたリンクを含む参照ページを、前記クライアント装置上のディスプレイに表示するステップと、
前記コンピュータシステムによって、前記クライアント装置から、前記リンクの選択を受取るステップと、
前記リンクの選択を受取ることに応答して、前記コンピュータシステムによって、前記スキャンされた文書に関連付けられた属性に基づいてウェブ文書を識別するために第2の検索を行なうステップと、
前記コンピュータシステムによって、前記クライアント装置上のディスプレイに前記第2の検索の結果を表示するステップとを備える、方法。
【請求項2】
命令を記憶するためのメモリと、
検索クエリに基いて第1の検索を実行することに応答して、検索結果の組を識別する命令と、
前記検索結果のうちの1つの選択を受取る命令と、
前記検索結果のうちの1つの選択を受取ることに応答して、前記検索結果のうちの前記選択された一つに関連付けられたスキャンされた文書に関連付けられ、検索を実行するためのリンクを含む参照ページを表示する命令と、
リンクの選択を受取る命令と、
リンクの選択を受取ることに応答して、前記スキャンされた文書に関連付けられた属性に関係する情報を備えたウェブ文書を識別するための第2の検索を実行する命令と、
前記ウェブ文書に関連付けられた情報を表示する命令とを実行するプロセッサとを備える、システム。
【請求項1】
コンピュータシステムによって実行される方法であって、
前記コンピュータシステムによって、ネットワーク上のクライアント装置から検索クエリを受取るステップと、
前記コンピュータシステムによって、前記検索クエリに基づいて検索結果の組を識別するために第1の検索を行なうステップと、
前記コンピュータシステムによって、前記クライアント装置上のディスプレイに前記検索結果の組を表示するステップと、
前記コンピュータシステムによって、前記検索結果のうちの1つの選択を、前記クライアント装置から受取るステップと、
前記コンピュータシステムによって、前記検索結果のうちの1つの選択を受取ることに応答して、前記検索結果のうちの前記選択された一つに関連付けられたスキャンされた文書に関連付けられ、前記スキャンされた文書に関する情報および検索に関連付けられたリンクを含む参照ページを、前記クライアント装置上のディスプレイに表示するステップと、
前記コンピュータシステムによって、前記クライアント装置から、前記リンクの選択を受取るステップと、
前記リンクの選択を受取ることに応答して、前記コンピュータシステムによって、前記スキャンされた文書に関連付けられた属性に基づいてウェブ文書を識別するために第2の検索を行なうステップと、
前記コンピュータシステムによって、前記クライアント装置上のディスプレイに前記第2の検索の結果を表示するステップとを備える、方法。
【請求項2】
命令を記憶するためのメモリと、
検索クエリに基いて第1の検索を実行することに応答して、検索結果の組を識別する命令と、
前記検索結果のうちの1つの選択を受取る命令と、
前記検索結果のうちの1つの選択を受取ることに応答して、前記検索結果のうちの前記選択された一つに関連付けられたスキャンされた文書に関連付けられ、検索を実行するためのリンクを含む参照ページを表示する命令と、
リンクの選択を受取る命令と、
リンクの選択を受取ることに応答して、前記スキャンされた文書に関連付けられた属性に関係する情報を備えたウェブ文書を識別するための第2の検索を実行する命令と、
前記ウェブ文書に関連付けられた情報を表示する命令とを実行するプロセッサとを備える、システム。
【図2】
【図3A】
【図3B】
【図3C】
【図3D】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図1】
【図3A】
【図3B】
【図3C】
【図3D】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図1】
【公開番号】特開2012−104149(P2012−104149A)
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願番号】特願2012−9022(P2012−9022)
【出願日】平成24年1月19日(2012.1.19)
【分割の表示】特願2007−534602(P2007−534602)の分割
【原出願日】平成17年8月29日(2005.8.29)
【出願人】(502208397)グーグル インコーポレイテッド (161)
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願日】平成24年1月19日(2012.1.19)
【分割の表示】特願2007−534602(P2007−534602)の分割
【原出願日】平成17年8月29日(2005.8.29)
【出願人】(502208397)グーグル インコーポレイテッド (161)
[ Back to top ]