説明

自然言語によってモバイル情報にアクセスするための方法及び装置

少なくともモバイル情報アクセスサーバ及び一つ又は複数の情報検索システムを含み、ネットワークコンピュータシステムにおいて実行されるモバイル情報にアクセスするための方法であって、移動通信装置からのメッセージを受信する工程、受信したメッセージを分析する工程、分析したメッセージに基づいて、一つ又は複数のクエリを形成する工程、前記一つ又は複数のクエリに基づいて文書を取得する工程、前記文書から応答候補を抽出する工程、応答候補を検証する工程、応答サマリを構成する工程、及び、前記応答サマリを前記移動通信装置に送り返す工程から成り、前記応答サマリが所定のサイズであることを特徴とする、モバイル情報にアクセスするための方法。また、モバイル情報にアクセスするための装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、移動通信装置を用いてモバイル情報にアクセスするための方法及び装置に関する。更に詳細には、アクセスした情報を受信及び発信する能力が限られている小型の移動通信装置を用いてモバイル情報にアクセスするための方法及び装置に関する。
【背景技術】
【0002】
個人的な、人間対人間の通信のための実用的な手段を提供する以外に、移動通信装置のさらなる用途の一つとして、ユーザに対し、一台の機械によってホストされる遠隔情報源にアクセスすることによって、情報に関するユーザのニーズを満足させる能力を与えることが挙げられる。
【0003】
重要な一つの例として、移動通信装置を情報検索に使用することがある。
【0004】
情報検索目的に使用される場合の、移動通信装置の効果を制約する重要な要因を以下に挙げる。
チャネルの容量が限られているため、大量のデータ送信に時間がかかる。
移動通信装置と情報プロバイダの間でメッセージを送るためのメッセージプロトコルによって実行されるフォーマットが限られている(例えば、短いテキストメッセージ(SMS)の場合、160文字)。
テキストを入力するに際して、移動通信装置のキーボードは小さく、使いにくい。
出力側において、移動電話又はその他の装置は、ユーザに情報を表示するために、通常、非常に小さいディスプレーしか有していない。
【0005】
メッセージ、キーボードおよびディスプレーのサイズと共に、情報伝達能力の限界に伴い、一般に、検索クエリ及びレスポンスもそのサイズが限られていなければならない。検索クエリに関し、ユーザは、非常に短くて簡潔なクエリを提供できなければならない。レスポンスに関しては、レスポンスシステムは非常に簡潔で関連するレスポンスを生成しなければならない。
【0006】
クエリとレスポンスの簡潔さは、ドメイン固有のシステムによって達成される。ドメイン固有のシステムは、クエリの範囲を非常に狭く限定し、事前に構築されたデータへのアクセスを可能にする。これは、考えられるクエリのセット(set)が周知であり、クエリが周知の構造を有している状況/ドメインにおいて十分である。クエリが周知である場合、キャッシェ又は特殊化されたデータベースエンジンにおけるルックアップは、通常、正確で関連するレスポンスを検索するのに十分である。このアプローチの一例として、電車の運行時間に関するクエリがある。これは、認知でき、単純なテンプレート(出発時刻、行き先、時間)に解析でき、構築されたデータベースから高い精度で情報が検索できる。
【0007】
ドメイン固有の情報検索システムに関する著書には以下のものが挙げられる。
Gallwitz, F.,M,Aretoulaki, M. Boros, J.Haas, S. Harbeck, R. Huber, H. Niemann及びE.Noeth著:「The Erlangen Spoken Dialogue System EVAR:A State−of−Art Information Retrieval System」 (In Proceedings of 1998 International Symposium on Spoken Dialogue (ISSD 98),p.19−26、オーストラリア、シドニー、1998年11月、Huang, Xuedong, Alex Acero 及び Hsiao−Wuen Hon(2001)著:「Spoken Language Processing: A Guide to Theory, Algorithm and System Development」、Prentice Hall PTR 及びYoung,S(2002)著:「The Statistical Approach to the Design of Spoken Dialogue Systems」 Tech Report CUED/F−INFENG/TR.433,Cambridge University Engineering Department
【0008】
しかし、ドメイン固有のアプローチは、取り扱えるクエリに関して非常に融通が利くわけではない。さらに、実行するにはコストがかかり、通常、非常に限られた興味の分野しかカバーできない。
【0009】
代替として、そして、特にクエリのドメインが周知ではない場合、第二のアプローチを採ってもよい。これは、一般には、オープンドメインアプローチ、あるいはさらに一般には、ハイブリッド(ドメイン固有とオープンドメインの)アプローチである。このアプローチでは、クエリに関する理解とそのドメインに関する知識がほとんどなしに、結果を解析することによって関連するレスポンスを検索しようと試みられている。
【0010】
最近、ハイパーテキスト文書の形式で、インターネット上で自由に利用できる情報量が膨大となり、その結果、この第二のアプローチに対する関心が高まっている。この状況下では、ワールドワイドウェブ(WWW:World Wide Web)を通じてアクセス可能な検索エンジンは全て、移動電話で、ワイヤレスアクセスプロトコル(WAP:Wireless Access Protocol)を使用してもアクセスできる。その例は、キーワードベースの「グーグルワイヤレス」検索サービス(http://www.google.com/options/wireless.html)及びキーワードベースの「ヤフーモバイル」検索サービス(http://mobile.yahoo.com/search)があり、両方ともWAPを通じてアクセスできる。
【0011】
しかし、もし入出力がモバイル用に特別に改変されていないならば、使用はきわめて面倒なものとなるかもしれない。モバイルスペースの情報検索は、現在、二段階の工程から成る。第一の工程で、ユーザは自分が欲する情報を得られる場所を探し出し、第二の工程で、ユーザはその場所にアクセスし、欲しい情報を得る。
【0012】
デスクトップでは、第一の工程は、通常、キーワードベースのインターネット検索エンジン(例えばグーグルやヤフーのようなもの)で行われる。それは情報そのものが見つかるアドレスであるところの、ハイパーリンクのリストを返してくる。デスクトップは、画面が大きいため、多くの検索結果が示され、キーワードベースの検索が効果的に行われる。このプロセスは、検索結果の全てが関連するものでなくてもうまくいく。ユーザはマウスをクリックして、関連すると思われるサイトに手動でアクセスし、ウェブサイトが探している情報を有しているようならば、ブラウズして探し出そうとする。これは、さらに多くの工程が含まれるため複雑である。
【0013】
一方、モバイルの世界では、マウスを使用せず、画面も小さいため、ナビゲーションはより困難である。その結果、より多くの手動でのナビゲーション工程(スクロールする、ページをめくる等)を必要とする。このため、デスクトップでのメカニズムを移動通信装置に単に模倣するだけでは十分ではない。
【0014】
上述の理由から、クエリとレスポンスのメカニズムは、検索エンジンなどのウェブベースの検索システムにアクセスしようとするモバイルユーザのニーズにより適するように改変されなくてはならない。
【0015】
一つのアプローチは、J.−D.Ruvini著「Adapting to the user’s internet search strategy on small devices」(in:Proceedings of the 8th International Conference on Intelligent User Interfaces, Miami, Florida, U.S.A. p.284−286,2003)に記載されている。これには、ウェブブラウジングを提供する、携帯電話用グーグル検索エンジンのフロントエンドが示されている。
【0016】
もう一つのアプローチは、SMSを経由したキーワードベースのグーグルSMS検索である(http://www.google.com/sms)。
【0017】
このアプローチでは、カバーできる範囲が、トップダウンのアプローチに比べて通常大きい。しかし、基礎となるデータが未構築な性質であるため、レスポンスの関連性と正確性を達成するのが困難である。結果として、数個の短いメッセージを送って、関連する応答が含まれているかどうかを確認しなければならない。このため、移動通信装置の容量を増やさなければならず、ユーザはそれを読まなければならないという面倒さがある。しかし、それでも、関連する応答が受理されたかどうかは確かではない。
【発明の開示】
【発明が解決しようとする課題】
【0018】
本発明の目的は、現在の移動通信装置のリソース限度が満たされるように、レスポンスの構成を改変し、同時に、応答の関連性を保持/獲得し、レスポンスが、質問に対する正しい応答を含んでいる可能性を高めることにある。
【0019】
本発明の別の目的は、モバイルのクエリ‐レスポンスシステムの使用性を高めることにある。
【課題を解決するための手段】
【0020】
上述の目的は、独立項1に記載のモバイル情報にアクセスするための方法、及び、独立項15に記載のモバイル情報にアクセスするための装置によって達成される。有利な実施態様は従属項に規定されている。
【0021】
自然言語による質問や言語表現としてのクエリをポストするためのインターフェースを提供し、それらを分析する言語ツールを使用することによって、検索結果の関連性が高まり、その結果、レスポンスのサイズが対応して減少し、通信装置のリソース限度にも関わらず、関連する応答をユーザに提供することができる。
【0022】
ユーザプロファイルを付加的に提供することにより、移動通信装置又はユーザは、識別番号によってシステムに知られるか、判別され、特に、装置のパラメータに対するもともとの知識によって、その特定のユーザに対して自動的に提供された応答の関連付けをさらに高めることができる。さらに、ユーザプロファイルは、ユーザに関する情報及びユーザの移動通信装置に関する情報を使用するため、プロファイル情報の再エントリを再要求することなく、ポジティブなユーザエクスペリエンスを確実に実現し、さらに、このような事前のコンテキストに関する知識によって、考えられる応答(工程650)を、ユーザにより関連すると思われる一連の応答に制約することができる。
【0023】
本請求項による、自然言語による質問をポストするためのインターフェースは、構築、及び未構築の情報リソースへの統一されたアクセスを提供する。
【0024】
さらなる特徴及び利点は、添付図面に参照した、下記の発明の詳細な説明からより明らかとなる。
【発明を実施するための最良の形態】
【0025】
図1は、モバイル情報にアクセスする方法を、本発明によるモバイル情報アクセスサーバにおいて実行するシステムの一例を示す概略図である。
【0026】
図1において、参照番号100は、携帯電話、スマート電話、小型携帯情報端末(PDA)、ウェアラブル装置などの移動通信装置を示す。
【0027】
それぞれの移動通信装置100は、例えば、テレフォンネットワークあるいはワイヤレスLANなどの、ワイヤレス通信ネットワーク110、ゲートウェイ120、及び本発明のモバイル情報アクセスサーバ160を有するインターネット140上で通信する。ゲートウェイ120は、ワイヤレス通信ネットワーク110からインターネット140への通信の橋渡しをする。また、その逆のこともする。
【0028】
移動通信アクセスサーバ160は、未構築のデータを提供する、未構築のデータリソース130の一つ又は複数、そして、構築データを提供する、構築データリソース150の一つ又は複数に接続している。
【0029】
未構築データには、ローカルインデックス付きのフルテキストコレクション、イントラネット検索エンジン、そして特に、インターネット/ウェブ検索エンジンが含まれるが、これらに限定されない。
【0030】
構築データには、SOAP(Simple Online Access Protocol)ウェブサービス、リレーショナルデータベースあるいは半構築XMLリポジトリ(インデックス付きリソース記述フォーマットデータ(RDF))およびリアルシンプルシンディケーションストリーム(RSS)など)が含まれるが、これらに限定されない。
【0031】
図1には示されていないが、本発明によるモバイル情報アクセスサーバにおいて実行されるモバイル情報にアクセスする方法の例示システムには、文書を提供する、インターネットに接続した多くのドキュメントサーバが存在している。ドキュメントサーバによって提供される文書としては、例えば、インターネット検索エンジン130でインデックス付けされた、HTML(Hypertext Markup Language)形式の文書がある。
【0032】
図2は、本発明によるモバイル情報にアクセスするための方法の、一つの実施態様を示す概略図である。
【0033】
工程200において、移動通信装置100から配信されたメッセージは、モバイル情報アクセスサーバ160によって受信される。
【0034】
工程210において、受信されたメッセージが分析される。特に、自然言語による質問あるいは言語表現が、クエリから抽出される。分析プロセスの詳細は、図3を参照しながら以下に説明する。「エジンバラにあるレストラン」などの言語表現は、質問のように扱われるだろう。それらにはデフォルトの質問タイプが割り当てられてもよい。
【0035】
工程220においては、クエリは、メッセージから抽出された質問や表現に基づいて構築され、また、工程210における次の分析に基づいて構築される。まず、一連のキーワードおよびキーフレーズが、基本的な検索エンジンのクエリ構成要素として発生する。これらは次に、文書検索エンジンシンタックスにおけるそれぞれの特異性を考慮しながら、質問の種類に固有の、そしてドメインに固有のキーワードに拡張される。
【0036】
さらに、検索エンジンクエリを、トピックに関連する一連の文書あるいはウェブサイトに集中させるため、検索エンジンクエリに制限演算子を付けてもよい。そして、このようなトピックに固有の検索は一般の検索と統合(merge)される。
【0037】
工程230では、情報は、構築及び未構築のデータリソースからウェブページ、データベース集合体、あるいはXMLツリーの形式で検索される。工程220において取得されたクエリは、それぞれの検索エンジンで実行される。検索エンジンとしては、グーグル、ヤフー、MSNサーチ、あるいはデータベースのような構築された情報源がある。
【0038】
文書検索エンジンによって提供される文書識別子あるいはリンクのリストは、必要な文書として既に見られているかもしれない。なぜならば、それらは往々にして、関連する情報を、文書識別子と共にいわゆる「スニペット(snippets)」の形で提供するからである。これらの文書はこのようにして直接ダイジェストされるか、あるいは、サーバが検索エンジン結果によって参照した文書をダウンロードし、ダウンロードした文書を分析/ダイジェストする。本発明の一つの実施形態において、さらなる全ての処理は検索エンジンサマリスニペット上で実行される。別の態様においては、一定の数の文書識別子(例:ハイパーリンク)が検索エンジンで検索され、関連する文書がダウンロードされる。
【0039】
未構築及び構築データリソースから結果を取得した後、それらは統合される。
【0040】
工程240では、検索結果は、応答候補を指定するためにテキスト分析を使用して分析される。応答候補は、テキスト分析及び上述した質問分析からの情報を用いて、工程230で取得した文書から抽出する。
【0041】
工程250において、応答候補が検証される。すなわち、不要なものが除去され、もっともらしさ/応答との類似性が低くなる順番でランクがつけられる。応答候補は、応答の類似性を反映するために、相対的基準(応答aは応答bより良い)によってランク付けされる。
【0042】
工程260では、出力データを所定のサイズに限定する必要性を考慮に入れて、応答のサマリが上位n個の候補となる要素から構成される。所定のサイズは、出力装置のディスプレーサイズ、一つのテキストメッセージの最大サイズあるいは個々のユーザの嗜好に依拠する。所定のサイズおよび検索された候補となる、ミニマムコンフィデンスの閾値を超える応答フラグメントの数nによって、応答候補A1,A2,・・・,AN215の数c=f(s,n)が考慮され、統合され、フォーマットされるか特殊記号(線あるいは’/’などの分離記号)で分離されて応答サマリが形成される。
【0043】
応答サマリはモバイルユニット(108)に返される。必要であれば、応答サマリは音声合成ユニットによって音声に変換される。
【0044】
図3は工程210におけるメッセージ分析をより詳細に示したものである。
【0045】
メッセージ分析では、共に検索エンジンが提供されるクエリを発生させ、質問を広範であるが既知のカテゴリあるいは質問の種類毎に分類し、後でユーザがパイプライン処理(pipeline)において使用するキーワードの主題を発生させる。
【0046】
工程300では、そのメッセージが移動通信装置100から音声によって発生したものかどうかを最初に決定する。音声でのメッセージであれば、そのメッセージは工程310の自動音声認識(ASR)にかけられる。
【0047】
工程320では、質問や表現がメッセージから抽出される。質問や表現が一旦単離されると、単離された質問は、その質問又は表現を理解できるようにするため、或いは、期待される応答の種類に関するある種の推論を引き出せるようにするため、さらに分析される。
【0048】
工程330では、言語的質問分類モデルを使用して、質問や表現の種類(どんな種類の情報を探しているか)を算出する。「ガリレオの誕生日はいつか?」という質問は、時間的情報を探しているため、その応答は、人の名前であるはずがない。質問や表現の焦点(探している情報の実体)もまた派生する(この例では、ガリレオ)。
【0049】
工程340では、質問テキストは質問を言語的に分析するために使用される。ここでは、POS(part−of−speech)タギング、ステミング(stemming)、リメタイゼーション(lemmatization)、チャンキング、固有表現(named entity)のタグ付け、語義のあいまい性解消、地名に由来する名詞による解決法などを含む言語モデルが用いられる。
【0050】
図4は、図3に示されるメッセージ分析の間に抽出される質問の言語的分析の詳細を示す。
【0051】
トークン化(工程400)は、質問をトークン(token)に分離する。
【0052】
リメタイゼーション(図示せず)は、語句の基本形を生成する。例えば、「are」から「be」が引き出される。
【0053】
POSタギング(工程410)はトークンに文法的なタグを付ける。例えば、「large」という語には、形容詞を意味するJJを付ける。
【0054】
固有表現のタグ付けは、例えば、人名、地名、日時、時間などの固有名詞のクラスを認識し、分類する。
【0055】
チャンキングは、動詞群、名詞群、前置詞群などの非再帰的統語表現を認識し分類する。
【0056】
図5は、本発明によるモバイル情報にアクセスする方法の1実施形態における検索結果の言語的な処理手順を示す。
【0057】
工程510では、検索結果が規定化されるかもしれない。すなわち、テキストが検索エンジンに関連するメタデータから分離するか、或いは、特殊なフォーマット(例:HTML)から通常のテキストに変換される。
【0058】
工程520では、図4に示し、上述したものと類似した分析が、今度は規定化された検索結果について行われる。
【0059】
工程530では、質問分類ユニット(Question Type Unit)と相和する、テキストの全てのユニット(例えば、「2月14日」は日付であり、「いつ」を問う質問と相和し、「イザベル」は人名であり、「誰」を問う質問と相和する)は、質問に対する応答である可能性の高さによって検証/ランク付けされる。その結果、応答候補が抽出された文書のコンテキスト及び言語的な質問分析ユニット(Question Analysis Unit)を考慮した、「ランク」と称されるスコアが生じる。
【0060】
最高ランクのN個の応答候補が、応答サマリ構成工程540においてインプットとして使用される。この工程においては、メッセージサイズに関する制約およびユーザプロファイルから検索されるその他の特性を考慮して、応答サマリが構成される。
【0061】
図6は、本発明によるモバイル情報にアクセスする方法のさらに別の実施態様を示す。以下の説明は、図2に示した方法との特別な違いに焦点を合わせている。
【0062】
この実施態様では、メッセージは、受信したメッセージに基づいて、例えば電話番号などの、移動通信装置を識別するための識別子も含む。この識別子は工程610で抽出され、保存される。
【0063】
工程620では、メッセージが生成された移動通信装置を識別する識別子が、ユーザプロファイルを検索するために使用される。
【0064】
ユーザプロファイルは、それが移動通信装置の特定の特徴(ディスプレーのサイズ、解像度、色の数、グラフィックの表示能力、音に関する能力、動画を再生する能力などを含むが、これらに限定されない)に関する知識を含むかどうかを問うために調べられ、及び、ユーザの好むトピックの範疇(雑学/一般知識、スポーツ、映画、あるいはカスタムサイトを含むが、これらに限定されない)が検索される。
【0065】
質問分析工程においては、プロファイルストアからの情報は、一連のトピック領域における事前に表された関心の高さの順位を適宜使用して、ユーザの好ましい領域に向けて、同様に、応答候補の抽出と検証を好ましい領域に向けて,クエリ構築を改善するために使用される。
【0066】
工程630においては、一つの検索エンジンクエリあるいは一連の検索エンジンクエリが、決められた質問の種類及び抽出されたキーワード/キーフレーズに基づいて構築される。この場合、個々の好み、例えば、ユーザが自分のプロファイルをワールドカップのシーズン中だけ、フットボールの領域だけに限定したい(それによって、フットボールのウェブサイト及びウェブサービスだけがターゲットとなる)とか、あるいは、ユーザが、質問に対する応答が財政に関するウェブサイトからは発生しないように、自分のファッションに関する関心が財政に関する情報を上回ることを単に表現したい、といった好みが考慮される。
【0067】
さらに、特殊なサイトの特殊な検索が、ユーザプロファイルから検索されたトピック領域情報に基づいて行われる。このように抽出あるいは形成された表現やキーワードが、情報検索クエリに変換される。この場合、検索エンジン/情報検索エンジンのシンタックスの特異性が考慮される(例えば、「+」のような特殊な演算子を使用して、ある種の言葉が「+フットボール−法(law)」といったページに確実に現れるようにする)。
【0068】
工程650は、応答候補の抽出および検証の工程であるが、ユーザの好みやお気に入りも考慮される。例えば、スポーツ領域に強い関心があることと政治領域に関心が欠けていることの事前の表明を、そのユーザプロファイルが反映しているユーザは、クエリ構築(工程630)において、それぞれの領域を示すクエリの要素を付け加え、除去することによって、前者の領域からの文書が探され、後者の領域からの文書は避けられる。これによって、スポーツ領域及び政治領域を示すコンテキストからの応答候補のランクが上がったり、下がったりする。
【0069】
応答サマリ構成ステップである工程660においては、アウトプットを限定する所定のサイズが、ユーザプロファイルに保存された移動電話そのものの型式に関する情報から派生する。
【0070】
上述の情報に基づき、ユーザが自分のプロファイル記録を識別するために質問を送ったコーラID(caller ID)を使用して、応答サマリが、移動装置用に最適化される。好ましいあるいは技術的に限られた(例えば、SMSの場合)、ユーザプロファイルから検索された移動装置の最大メッセージサイズs、及び、ミニマムコンフィデンスの閾値を超える、検索された応答候補フラグメントの数nに依拠して、応答候補A1,A2,・・・,AN215の数c=f(s,n)が、応答サマリ構成モジュール216によって考慮され、統合され、恐らくはフォーマットされるか、特殊記号(線あるいは’/’などの分離記号)で分離されて応答サマリ217を形成する。
【0071】
さらに、ユーザプロファイルに保持されている、ユーザの移動通信装置の特性は、移動通信装置の能力を使用するサマリを構築するために、応答サマリ構成において使用される。例えば、考えられる本発明の一つの態様において、ユーザの移動通信装置がカラーディスプレーを有していれば、応答サマリの重要部分(例えば、応答候補のヘッドライン、表現の冒頭)が別の色で表示される。
【0072】
さらに、ユーザプロファイルの設定によっては、結果として生じる応答サマリは、テキスト(画像及び動画を含む場合もある)あるいは音声(その中で音声合成モジュールが呼び出される)の形になる。
【0073】
最後に、アウトプットが移動通信装置に送られる。
【0074】
図7は、モバイルユーザプロファイルの考えられるコンテンツを示した表であり、コンテンツは、移動装置に固有であり、移動装置の所有者に固有であるパラメータから成る。
【0075】
ユーザプロファイルは、ユーザ及びその移動通信装置の識別に関するデータ、認証、ユーザに対する移動通信アクセスサーバの挙動を微調整するために使用される一連の特性を保存する。
【0076】
ユーザ識別子(ユーザID)は、移動通信アクセスサーバにおいて、互いを一意に識別するために使用される。秘密のパスワード(Password)が、ウェブベースのユーザプロファイルメンテナンス、GUIにおける、ユーザプロファイルへのアクセスを、ユーザのみに制限する。ユーザを識別するリスト(コーラID)が保持される。コーラIDには、ユーザのコーラID、例えば移動電話の番号などの、ユーザプロファイルからの情報を検索する時のキーとなる、ユーザコーラIDが含まれるが、それらに限定されない。色や強調表示に対応しているか、スクリーンのサイズおよび解像度はどうか、移動通信装置がSMS、EMSおよびMMSにそれぞれ対応しているか、3Gフォンであるか、複数のテキストメッセージを一つに統合できるかといった、ユーザの移動装置の性質や能力は、ストア(Mobile Device Info)に保持される。ユーザの嗜好(User Preferences)リストには、ユーザの好むシステム挙動が保存される。それには、トピック領域の絶対的及び相対的重要度、希望する応答メッセージの最大数(例えば、SMSの最大数)、送信しているMMSが適当と思われるか、付随する広告がユーザに受け入れられるかどうかといったものが含まれるが、これらに限定されない。
【0077】
ブーリアンレジスタ(ロケーション認識フラグ)は、自動的なロケーションの検知に対する、ユーザの同意の可否を保存し、これによって、クエリが送られたユーザの移動通信装置が考慮され(ロケーションベースの検索)検索が向上する。ユーザの過去の質問の履歴によって、以前の情報ニーズが考慮され、検索結果が向上する。お気に入りのウェブサイト及びサービスのリスト(お気に入り)によって、一般のユーザにより関連するように思われるサイトに検索を集中させる。ユーザの電子メールストアにどのように接続するかに関する情報(電子メールアカウント)によって、ユーザの個人情報からの検索が可能になる。アカウントバランスは、報酬スキームにおける金銭アカウントあるいは仮想クレジットポイントアカウントなどの、ユーザの請求情報を保存する。
【0078】
図8は、本発明によるモバイル情報検索方法によって生成された応答の一態様のフォーマットを示す。応答サマリは一連の応答候補ウィンドウ(802から807)から成り、それらは、それぞれ左(804)及び右(805)のコンテキストに囲まれた、正解である803を一つ含む(すなわち、応答候補が見つかった文書中で応答候補を囲んでいたテキスト)。
【0079】
一つの態様において、応答候補ウィンドウは分離記号(’/’などを含むがこれに限定されない)によって、808で分離し、これによって境界に印がつけられ、ユーザの混乱を避けることができる。一つの態様において、最も可能性の高い応答を含む応答候補が、コンテキストなしで初期の位置806に挿入され、これによって、応答が長い場合、最後の応答候補ウィンドウ807以降のカットによって、最も良い応答候補が喪失されることを確実に避けることができる。
【0080】
図9は、本発明によるモバイル情報アクセスサーバの一つの態様のブロックダイアグラムである。
【0081】
移動通信装置アクセスサーバは、移動通信装置からのメッセージを受信するためのレシーバ900、移動通信装置にメッセージを送り返すセンダー901から成る。
【0082】
音声認識ユニット910、質問分類ユニット920、質問分析ユニット921、及びユーザプロファイルストア940のインプットがレシーバ900のアウトプットに接続されている。音声認識ユニット910は又、質問分類ユニット920、質問分析ユニット921、及びレシーバ900に接続している。質問分類ユニット920及び質問分析ユニット921のアウトプットはクエリ構築ユニット930のインプットに接続されている。クエリ構築ユニットのアウトプットは検索ユニット950のインプットに接続されている。
【0083】
ユーザプロファイルのアウトプットは、クエリ構築ユニット930のインプット、ランキング/検証ユニット970、及び応答サマリユニット980に接続する。
【0084】
検索ユニットのアウトプットは、応答候補及び抽出ユニット960のインプットに接続する。応答候補及び抽出ユニットのアウトプットは、応答サマリ構成ユニット(980)のインプットに接続する。応答サマリ構成ユニット(980)のインプットは、音声合成ユニット(911)のインプット及びセンダー(901)に接続する。音声合成ユニットのアウトプットは、センダーにも接続している。
【図面の簡単な説明】
【0085】
【図1】本発明によるモバイル情報アクセスサーバ上で実行される、モバイル情報にアクセスするための方法の例示システムの概略図である。
【図2】本発明によるモバイル情報にアクセスするための方法の概略図である。
【図3】本発明によるモバイル情報にアクセスするための方法の一つの態様における、一つのメッセージの分析を示す図である。
【図4】図3に示したメッセージの分析中に抽出した質問の言語分析の詳細を示す図である。
【図5】本発明による情報検索方法の一つの態様における、クエリレスポンスの言語処理を示す図である。
【図6】本発明によるモバイル情報にアクセスするための方法の、別の態様を示す概略図である。
【図7】図2に示した本発明の態様で使用する、考えうるユーザプロファイルコンテンツの表である。
【図8】本発明によるモバイル情報にアクセスするための方法の、典型的なアウトプットを示す図である。
【図9】本発明による、モバイル情報にアクセスするための装置の一つの態様を示す図である。

【特許請求の範囲】
【請求項1】
少なくともモバイル情報アクセスサーバ及び一つ又は複数の情報検索システムを含み、ネットワークコンピュータシステムにおいて実行されるモバイル情報にアクセスするための方法であって、
移動通信装置からのメッセージを受信する工程、
受信したメッセージを分析する工程、
分析したメッセージに基づいて、一つ又は複数のクエリを形成する工程、
前記一つ又は複数のクエリに基づいて文書を取得する工程、
前記文書から応答候補を抽出する工程、
応答候補を検証する工程、
応答サマリを構成する工程、及び
前記応答サマリを前記移動通信装置に送り返す工程を含み、前記応答サマリが所定のサイズであることを特徴とする、モバイル情報にアクセスするための方法。
【請求項2】
前記応答サマリのサイズの限界が、
移動通信装置の最大表示サイズ、
移動通信プロトコルの最大メッセージサイズ、及び
個々のユーザの嗜好の、一つ以上に依拠することを特徴とする、請求項1に記載の方法。
【請求項3】
前記受信したメッセージを分析する工程が、自然言語による質問あるいは言語表現を前記メッセージから抽出する工程を含むことを特徴とする、請求項1又は2に記載の方法。
【請求項4】
前記受信したメッセージを分析する工程が、さらに、前記メッセージから抽出した、前記自然言語による質問あるいは言語表現の種類及び言語的特徴を決定する工程を含むことを特徴とする、請求項3に記載の方法。
【請求項5】
受信したメッセージが音声であるかどうかをチェックする工程、もし音声であるならば、前記メッセージを音声からテキストに自動音声認識手段によって変換させる工程をさらに含むことを特徴とする、前記請求項のいずれか1項に記載の方法。
【請求項6】
前記一つ又は複数のクエリ形成が、抽出された質問あるいは表現が、固有表現に関するかどうかを考慮して行われることを特徴とする、請求項4又は5に記載の方法。
【請求項7】
ユーザが自動的に識別され、前記ユーザのプロファイルがその識別によって検索されることを特徴とする、前記請求項のいずれか1項に記載の方法。
【請求項8】
移動通信装置の最大表示サイズ、
移動通信プロトコルの最大メッセージサイズ、
個々のユーザの嗜好、
のうちの一つ以上が、ユーザプロファイルから派生することを特徴とする、請求項7に記載の方法。
【請求項9】
前記一つ又は複数のクエリを形成する工程も、ユーザプロファイルから派生した情報に基づいていることを特徴とする、請求項7又は8に記載の方法。
【請求項10】
前記応答候補を抽出する工程において、ユーザプロファイルから派生する情報がさらに考慮されることを特徴とする、請求項7から9のいずれか1項に記載の方法。
【請求項11】
前記応答候補を検証する工程において、ユーザプロファイルから派生する情報がさらに考慮されることを特徴とする、請求項7から10のいずれか1項に記載の方法。
【請求項12】
前記応答サマリを構成する工程において、ユーザプロファイルから派生する情報がさらに考慮されることを特徴とする、請求項7から11のいずれか1項に記載の方法。
【請求項13】
前記応答サマリを構成する工程において、それぞれ左右をコンテキストで囲まれた一つの正しい応答候補を含む一連の応答候補ウィンドウから成る、応答サマリが生成されることを特徴とする、前記請求項のいずれかに記載の方法。
【請求項14】
前記応答サマリを構成する工程において、最も妥当性の高いスコアを有する応答を含む応答候補が、コンテキストなしで初期の位置に挿入される応答サマリが生成されることを特徴とする、前記請求項のいずれか1項に記載の方法。
【請求項15】
移動通信装置からメッセージを受信するためのユニット、受信したメッセージを分析するためのユニット、
前記受信したメッセージに基づいて一つ又は複数のクエリを形成するユニット、
前記一つ又は複数のクエリに基づいて、文書を取得するためのユニット、
前記文書から応答候補を抽出するユニット、
前記応答候補を検証するユニット、
応答サマリを構成するユニットであって、前記応答サマリは所定のサイズに限定され、
前記応答サマリを移動通信装置に送り返すユニットを含む、モバイル情報にアクセスするための装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2008−529179(P2008−529179A)
【公表日】平成20年7月31日(2008.7.31)
【国際特許分類】
【出願番号】特願2007−553466(P2007−553466)
【出願日】平成17年2月6日(2005.2.6)
【国際出願番号】PCT/EP2005/001198
【国際公開番号】WO2006/081835
【国際公開日】平成18年8月10日(2006.8.10)
【出願人】(507263597)リンギット ゲーエムベーハー (1)
【Fターム(参考)】