説明

カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム

本開示のある特定の実施形態は、異なる再構成レベルで、画像の特徴を抽出し、画像の表示を構築するための、カスケード式のオーバ・コンプリート・ディクショナリ(すなわち、基底の集合)を用いた画像の再構成のための技法に関する。異なる再構成レベルでの各ディクショナリは、一般的な特徴または識別的な特徴のいずれかを獲得する目的で、学習させられ最適化されることができる。カスケード式のディクショナリを通してスパースな表示を見つけることにより、画像が再構成され認識されることができる。

【発明の詳細な説明】
【優先権の主張】
【0001】
本特許出願は、2010年2月1日に出願され、この譲受人に譲渡され、引用によりここに明確に組み込まれる、「カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システムおよび方法」(IMAGE RECOGNITION SYSTEM AND METHOD BASED ON CASCADED OVER-COMPLETE DICTIONARIES)と題する、米国仮出願番号第61/300,408号の優先権を主張する。
【技術分野】
【0002】
本開示は、一般的に、信号処理に関し、より詳細には、異なる再構成レベルで、画像の特徴を抽出し、画像の表示を構築するための、カスケード式の基底の集合に基づいて、画像を認識するための方法に関する。
【背景技術】
【0003】
画像認識では、基底の集合としてのオーバ・コンプリート・ディクショナリが、画像を表示および再構成するために利用され得る。このディクショナリは、基底の大きなセットを含むように最適化され得るが、典型的には、基底の小さなグループのみを使用して特定の画像を再構成する。したがって、表示は一般的にスパース(sparse)である。画像を分類するために、異なる分類との識別的な特徴を含むことがディクショナリにとって望ましいので、そのスパースな表示は分類ラベルを示すだろう。
【0004】
しかしながら、画像は典型的に、一般的な特徴と分類特有の特徴の両方を含み得る。したがって、再構成方式による認識に基づいた画像認識システムのために、ディクショナリが、分類を目的とした識別力だけでなく、誤差の許容のために再構成力をも有することが望ましい。
【発明の概要】
【0005】
本開示のある特定の実施形態は、信号処理のための方法を提供する。この方法は一般的に、1つ以上の対象またはカテゴリに関連する1つ以上の信号を得ることと、これらの信号に基づいて上記対象の1つ以上の一般的な特徴を構成することと、各対象のための1つ以上の更新されたパターンを得るために、上記信号から上記一般的な特徴を抽出し、取り除くことと、更新されたパターンに基づいて各対象のための識別的な特徴のセットを得ることと、識別的な特徴のみを使用して、更新されたパターンを認識することとを含む。
【0006】
本開示のある特定の実施形態は、信号処理のための方法を提供する。この方法は一般的に、複数の対象のうちのある対象に関連する画像を得ることと、すべての対象またはカテゴリの一般的な情報を備える一般的なディクショナリに基づいて、上記画像の1つ以上の一般的な特徴を再構成することと、識別的な特徴の1つ以上のセットであって、各セットが上記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える識別的なディクショナリを使用して対象を認識するために、一般的な特徴が再構成され取り除かれた画像を再構成することとを含む。
【0007】
本開示のある特定の実施形態は、信号処理のための装置を提供する。この装置は一般的に、1つ以上の対象またはカテゴリに関連する1つ以上の信号を得る手段と、これらの信号に基づいて上記対象の1つ以上の一般的な特徴を構成する手段と、各対象のための1つ以上の更新されたパターンを得るために、上記信号から上記一般的な特徴を抽出し、取り除く手段と、更新されたパターンに基づいて各対象のための識別的な特徴のセットを得る手段と、識別的な特徴のみを使用して更新されたパターンを認識する手段とを含む。
【0008】
本開示のある特定の実施形態は、信号処理のための装置を提供する。この装置は一般的に、複数の対象のうちのある対象に関連する画像を得る手段と、すべての対象またはカテゴリの一般的な情報を備える一般的なディクショナリに基づいて、上記画像の1つ以上の一般的な特徴を再構成する手段と、識別的な特徴の1つ以上のセットであって、各セットが上記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える識別的なディクショナリを使用して対象を認識するために、一般的な特徴が再構成され取り除かれた画像を再構成する手段とを含む。
【0009】
本開示のある特定の実施形態は、信号処理のための装置を提供する。この装置は一般的に、1つ以上の対象またはカテゴリに関連する1つ以上の信号を得て、これらの信号に基づいて上記対象の1つ以上の一般的な特徴を構成し、各対象のための1つ以上の更新されたパターンを得るために、上記信号から上記一般的な特徴を抽出し、取り除き、更新されたパターンに基づいて各対象のための識別的な特徴のセットを得て、識別的な特徴のみを使用して更新されたパターンを認識するように構成された少なくとも1つのプロセッサを含む。
【0010】
本開示のある特定の実施形態は、信号処理のための装置を提供する。この装置は一般的に、複数の対象のうちのある対象に関連する画像を得て、すべての対象またはカテゴリの一般的な情報を備える一般的なディクショナリに基づいて、上記画像の1つ以上の一般的な特徴を再構成し、識別的な特徴の1つ以上のセットであって、各セットが上記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える識別的なディクショナリを使用して対象を認識するために、一般的な特徴が再構成され取り除かれた画像を再構成するように構成された少なくとも1つのプロセッサを含む。
【0011】
本開示のある特定の実施形態は、命令を記憶したコンピュータ読取可能な記憶媒体を備えるコンピュータ・プログラム製品を提供する。この命令は一般的に、1つ以上の対象またはカテゴリに関連する1つ以上の信号を得て、これらの信号に基づいて上記対象の1つ以上の一般的な特徴を構成し、各対象のための1つ以上の更新されたパターンを得るために、上記信号から上記一般的な特徴を抽出し、取り除き、更新されたパターンに基づいて各対象のための識別的な特徴のセットを得て、識別的な特徴のみを使用して更新されたパターンを認識するために、プロセッサによって実行可能である。
【0012】
本開示のある特定の実施形態は、命令を記憶したコンピュータ読取可能な記憶媒体を備えるコンピュータ・プログラム製品を提供する。この命令は一般的に、複数の対象のうちのある対象に関連する画像を得て、すべての対象またはカテゴリの一般的な情報を備える一般的なディクショナリに基づいて、上記画像の1つ以上の一般的な特徴を再構成し、識別的な特徴の1つ以上のセットであって、各セットが上記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える識別的なディクショナリを使用して対象を認識するために、一般的な特徴が再構成され取り除かれた画像を再構成するために、プロセッサによって実行可能である。
【図面の簡単な説明】
【0013】
上述した本開示の特徴を詳細に理解できるように、上記では簡潔に概要を述べた、より具体的な説明が、そのいくつかが付属の図面に示されている実施形態を参照することにより、行われる。しかしながら付属の図面は、この開示のある特定の典型的な実施形態のみを示すものであり、その範囲を限定するものと考えられるべきではないということに注意すべきである。というのも、この説明は、同様に効果的な他の実施形態にも認められ得るものだからである。
【図1】図1は、本開示のある特定の実施形態を実現することができる、パターン認識のためのシステムを示す図である。
【図2】図2は、本開示のある特定の実施形態に係る、パターンの基底とインタフェースされたパターン認識エンジンの例を示す図である。
【図3】図3は、本開示のある特定の実施形態に係る、画像認識のために利用される基底の集合としてのディクショナリのトレーニングのための例示的な動作を示す図である。
【図3A】図3Aは、図3に示した動作を実行することができる例示的なコンポーネントを示す図である。
【図4】図4は、本開示のある特定の実施形態に係る、トレーニングされたカスケード式のディクショナリに基づいた画像の再構成および認識のための例示的な動作を示す図である。
【図4A】図4Aは、図4に示した動作を実行することができる例示的なコンポーネントを示す図である。
【発明を実施するための形態】
【0014】
本開示のさまざまな実施形態が下記に説明される。ここでの教示が広くさまざまな形態で具現化され得ること、ここに開示されている任意の特定の構造、機能、またはその両方は単に代表的なものにすぎないことが理解されるべきである。ここでの教示に基づき、当業者は、ここに開示された実施形態が、任意の他の実施形態とは独立して実現され得ること、これらの実施形態のうちの2つ以上が、さまざまな手法で組み合わされ得ることを理解すべきである。たとえば、ここに説明される任意の数の実施形態を使用して、装置が実現されることができ、方法が実現されることができる。さらに、他の構造および機能、または、ここに説明される実施形態のうちの1つ以上以外の、または、それらに追加された構造および機能を使用して、そのような装置が実現されることができ、そのような方法が実現されることができる。さらに、実施形態は、請求項に記載された少なくとも1つ要素を備えることができる。
【0015】
「例示的」という用語は、本明細書では、「例、事例、または実例としての役割を果たす」という意味で用いられる。「例示的」なものとしてここに説明される任意の実施形態は、必ずしも、他の実施形態よりも好ましい、または利点を有するものと解釈されるべきではない。
【0016】
特定の実施形態がここに説明されるが、これらの実施形態の多くの変形および置換が、本開示の範囲内に含まれる。好ましい実施形態のいくつかの恩恵および利点が説明されるが、本開示の範囲は、特定の恩恵、使用、または目的に限定されることを意図しない。そうではなく、本開示の実施形態は、異なる無線技術、システム構成、ネットワーク、および送信プロトコルに広く適用可能であることが意図され、そのうちのいくつかは、図面および好ましい実施形態の下記の説明において、例として説明される。詳細な説明および図面は、限定ではなく、単に開示を説明するものにすぎず、本開示の範囲は、付属の請求項およびその同等物によって定義される。
【0017】
(例示的なパターン認識システム)
ここに説明される技法は、信号処理に関し、より詳細には、認識する必要がある対象に関連するパターンの処理に関する。
【0018】
図1は、本開示の実施形態を実現することができる、パターン認識のための例示的なシステム100を示す。パターン認識システム100は、異なるパターンまたは信号、たとえば、対象認識のための画像または音声認識のためのオーディオ信号、を認識するために使用されることができる。
【0019】
システム100は、(たとえば、空港およびオフィスビルにおける)セキュリティ用途を含む幅広い用途に利用されることができ、デスクトップ、ラップトップ・コンピュータ、またはハンドヘルド・デバイス(たとえば、モバイル・フォン)といった、幅広い異なるタイプのプラットフォームで実現されることができる。
【0020】
本開示のある特定の実施形態によると、入力プラットフォーム120は、スクリーン機構126を含むことができ、それを通して、カメラ122は、ある対象の画像に対応する信号を提供することができ、および/または、マイクロフォン124は、人間の音声に対応する信号を提供することができる。たとえば、スクリーン機構126は、空港またはビルの入口で見られるようなセキュリティ・チェックポイントに配置されることができる。プラットフォーム120はカメラ122およびマイクロフォン124の両方とともに示されているが、ある特定の実施形態によると、そのようなデバイスのうちの1つのみが含まれ得る。さらに、指紋リーダ、虹彩リーダ、等といった、さらなるデバイスまたは代替のデバイスも使用され得る。どのようなデバイスが使用されようと、または、どのようなデバイスの組み合わせが使用されようと、パターン認識システム100は、受信された信号に基づいてパターンを識別するように構成されることができる。
【0021】
パターン認識システム100は、入力信号を受信および処理するためのインタフェース104を含むことができる。インタフェース104は、1つ以上のプロセッサ102に適切なパターン信号を提供するため、増幅器、フィルタ、アナログ・デジタル(A/D)コンバータ、等といった任意の適切な回路を含むことができる。プロセッサ(単数または複数)102は、入力されたパターン信号を、メモリ108内の認識エンジン110による実行のために起動される、ある認識アルゴリズムにしたがって処理することができる。パターン認識は、たとえば、入力されたパターン信号(たとえば、画像または音声)と、複数の対象に関連づけられた利用可能なパターンの基底106とをマッチングすることによって、達成されることができる。
【0022】
図2に示されているように、認識エンジン110は、パターンの基底106とインタフェースし得る。たとえば、認識エンジン110は、トレーニング動作中に、パターンの基底106を生成し、更新することができる。パターンの基底は、認識動作を実行するためにアクセスされ得る。すなわち、入力パターン(たとえば、画像または音声)は、パターンの基底106のプールから検索された1つ以上のパターンの基底を使用することにより、認識エンジン110によって実行される認識アルゴリズムにしたがって、対象の認識のために処理されることができる。さらに、既存の対象に関連するパターンの基底は、トレーニング処理中に定期的に更新されることができ、1つ以上の新たな対象に関連づけられた1つ以上のパターンの基底が、パターンの基底106のプールに追加されることもできる。
【0023】
(スパースな表示および分類のためのカスケード式のディクショナリ)
パターンの基底の集合としてのオーバ・コンプリート・ディクショナリが、画像を表示および再構成するために、パターン認識システム100において利用されることができる。本開示のある特定の実施形態において、ディクショナリは、異なる画像再構成レベルで適用されることができる。特定のレベルでの各ディクショナリは、一般的な特徴または識別的な特徴のいずれかを獲得する目的で、学習させられ最適化されることができる。異なる再構成レベルのためのカスケード式のディクショナリを通してスパースな表示を見つけることにより、画像は、再構成され認識されることができる。
【0024】
より低い再構成レベルでのディクショナリが、より一般的な特徴を再構成するために用いられ得る一方で、より高いレベルでのディクショナリは、より識別的な特徴に専用であり得ることに注意すべきである。また、最上位の認識レベルでの識別的なディクショナリを使用した表示のスパース性は、分類パフォーマンスを改善するために、より低い再構成レベルでの1つ以上のカスケード式のディクショナリを追加することにより、高められることができる。
【0025】
カスケード式のディクショナリを用いた画像認識システムにおいて、一般的な(すなわち、分類に関連のない)情報を再構成することと、識別的な(すなわち、分類に関連した)情報を再構成することは、分離され得る。異なる再構成レベルでの各ディクショナリは、一般的な特徴または識別的な特徴のいずれかを獲得する目的で、別々に学習させられ最適化されることができる。最も低い再構成レベルでは、ディクショナリは、サポートされたすべての分類からの画像の統計を獲得し得る。それゆえに、ディクショナリの更新を通して発達し得る基底は、すべての分類にわたって共通する特徴を表すことができる。特定のより低い再構成レベルでの、そのような一般的な特徴を有するディクショナリは、同一の程度までの任意の分類から画像を再構成可能であり得る。このディクショナリから再構成された信号を減じた入力画像としての残りの信号は、後のより高い再構成段階でのディクショナリによって再構成されなくてはならない。
【0026】
最も高い画像再構成レベルでは、すべての一般的な特徴は、入力画像から抽出され、減じられることができる。残りの信号は、分類特有の識別的な特徴を有するディクショナリを構成するために使用されることができる。このレベルでのディクショナリは、異なる分類に対応するサブスペースを備え得る。サブスペースは、ある単一の分類からの画像の統計を獲得することができ、このサブスペースにおける基底は、画像分類の残りからそれらを識別する特徴を表すことができる。このように、あるサブスペースは、構成された画像がそのサブスペースが表す分類からのものである場合、他のサブスペースよりも、適切であることができる。したがって、このディクショナリを使用する場合の解は、スパースとなることができる。
【0027】
異なるサブスペースからの異なる再構成レベルは、再構成されている特定の画像がどの分類に属するかを示すことができる。画像の複雑性と分類の困難性に依存して、1つ以上のディクショナリが中間の再構成レベルに追加されることができ、それらは、最上位の認識レベルでの表示のスパース性を高めるために、より一般的でないが、より識別的な特徴を表し得る。
【0028】
図3は、本開示のある特定の実施形態に係る、画像の再構成および対象の認識のために使用される基底の集合としてのカスケード式のディクショナリをトレーニングするための例示的な動作300を示す。302において、N個の対象がディクショナリのトレーニングのために提供されることができ、各対象は、1つ以上のトレーニング画像を備えることができる。304において、ディクショナリは、N個すべての対象からのトレーニング画像を使用してトレーニングされることができる。トレーニングされたディクショナリは、すべての対象に関連する、最も一般的な特徴のセットを含むことができ、それは、初期の画像再構成レベルに関連づけられた一般的なディクショナリとして使用されることができる。その後、306において、一般的な特徴のセットを使用して得られた再構成された画像が、これらの一般的な特徴を含まない更新されたトレーニング・パターンを得るために、すべての入力画像から減じられることができる。
【0029】
一般的な特徴が再構成され取り除かれた残りの画像は、オプションで、308において、一般的な再構成の品質を評価するために使用されることができる。その品質が満足の行かないものであった場合、1つ以上のカスケード式の一般的なディクショナリがさらに構成されることができる。したがって、その品質が満足の行かないものであった場合、動作304〜306は、カスケード式の一般的なディクショナリであって、1つの一般的なディクショナリが異なる画像再構成レベルに対応する、カスケード式の一般的なディクショナリを得るために、オプションで複数回にわたり繰り返されることができる。以前に見つかった一般的な特徴を含まないパターンに基づいて304において構成されるであろう特徴は、次のより高い再構成レベルのどれに対しても、より一般的でないことができる。したがって、対応するトレーニングされたディクショナリは、次のより高い再構成レベルのどれに対しても、より一般的でなく、より識別的な特徴を含むことができる。306において入力画像から残りのすべての一般的な特徴を抽出した後、対象の識別的な特徴に関連する1つ以上の識別的なディクショナリのトレーニングが、続いて行われ得る。
【0030】
この時点で、各対象の入力パターンは、対応する元の入力画像の識別的な特徴のみを含むことができる。310において、識別的な特徴のセットが、一般的な特徴を含まない入力パターンに基づいて、N個の対象の各々のために得られることができ、それは、N個のサブ・ディクショナリであって、各サブ・ディクショナリが異なる対象に関連づけられ得る、N個のサブ・ディクショナリを有する識別的なディクショナリという結果になり得る。
【0031】
テスト段階において、画像はまず、より低いレベルのディクショナリによって処理され再構成されることができる。残りの信号は、最上位レベルの、識別的で分類特有のディクショナリによって再構成されることができる。対象は、入力信号を再構成するためにどのサブ・ディクショナリが最良かを見出すことによって、認識されることができる。
【0032】
この識別的なディクショナリは、最も高い再構成レベルに対応することができ、それは、N個の対象に関連する、最も識別的な特徴を含むことができる。画像の複雑性とそれらの分類の困難性に依存して、より差別的ではない特徴を有する1つ以上のディクショナリが、最も識別的な特徴を有するディクショナリを適用する前に、トレーニングされることができ、画像の再構成に含まれることができる。
【0033】
図4は、本開示のある特定の実施形態に係る、以前にトレーニングされたカスケード式のディクショナリ(すなわち、異なる再構成レベルでの基底の集合)に基づいた、ある対象に関連する画像の再構成のための例示的な動作400を示す。402において、まず、テスト画像の再構成が、一般的なディクショナリにおける、以前に抽出された一般的な特徴を使用して実行されることができる。
【0034】
404において、画像の再構成および対象の認識が、一般的な特徴が取り除かれた画像に適用される、以前にトレーニングされたN個の識別的なサブ・ディクショナリ(すなわち、識別的な特徴のセット)に基づいて実行されることができ、各サブ・ディクショナリは、認識される可能性のある1つの対象に対応し得る。すべてのサブ・ディクショナリは、最も高い画像再構成レベルに関連づけられ得る、トレーニングされた識別的なディクショナリの一部であることができる。上述したように、画像の複雑性およびその分類の困難性に依存して、より識別的でない特徴を有する1つ以上のディクショナリが、最上位の再構成レベルでの表示のスパース性を高めるために、最も識別的な特徴を有するディクショナリを適用する前に用いられることができる。
【0035】
提案された、再構成技術に基づく画像分類器と、当該技術からの既存の識別分類器は、それらの両技術が同一のパターン認識に適用される場合、比較されることができる。一方では、現在の学習理論は、識別分類器、すなわち、サポート・ベクター・マシン(SVM)のようなラージ・マージン分類器の使用をサポートする。また、これらの分類器の汎化誤差のより厳格な理解が存在する。他方で、提案された、パターン認識のための再構成モデルを使用することには、スケーラビリティや誤差の許容といった、ある特定の利点がある。少数の基底を使用して画像全体を表示することにより、提案された技術は、分類数および分類あたりのトレーニング・サンプル数における、好ましいスケーラビリティを達成することができる。さらに、パターン認識において観察される多くの誤差は、付加的な誤差としてモデル化されることができる。これらの誤差は、提案された再構成モデルでは、容易に解消され、または訂正されることができる。
【0036】
上述された方法のさまざまな動作は、図面に示されたミーンズ・プラス・ファンクション・ブロックに対応する、さまざまなハードウェアおよび/またはソフトウェアの、(1つ以上の)コンポーネントおよび/または(1つ以上の)モジュールによって実行されることができる。たとえば、図3に示したブロック302〜310は、図3Aに示したミーンズ・プラス・ファンクション・ブロック302A〜310Aに対応する。同様に、図4に示したブロック402〜404は、図4Aに示したミーンズ・プラス・ファンクション・ブロック402A〜404Aに対応する。より一般的には、方法が、対応するミーンズ・プラス・ファンクション図を有する図面に示されている場合、動作ブロックは、同様の番号を付したミーンズ・プラス・ファンクション・ブロックに対応する。
【0037】
ここで使用される場合、「決定すること」という用語は、幅広い動作を含む。たとえば、「決定すること」は、計算すること、コンピュータ処理すること、処理すること、得ること、調査すること、ルックアップすること(たとえば、テーブル、データベース、または別のデータ構造をルックアップすること)、アサートにすること、等を含むことができる。また、「決定すること」は、受信すること(たとえば、情報を受信すること)、アクセスすること(たとえば、メモリ内のデータにアクセスすること)、等を含むことができる。また、「決定すること」は、解決すること、選択すること、選ぶこと、確立すること、等を含むことができる。
【0038】
ここで使用される場合、項目のリストのうちの「少なくとも1つ」に言及するフレーズは、単一の要素を含む、それらの項目の任意の組み合わせに言及するものである。例として、「a、b、またはcのうちの少なくとも1つ」は、a、b、c、a−b、a−c、b−c、およびa−b−cを含むものとする。
【0039】
上述された方法のさまざまな動作は、それらの動作を実行することができる任意の適切な手段、たとえば、さまざまなハードウェアおよび/またはソフトウェアの、(1つ以上の)コンポーネント、回路、および/または(1つ以上の)モジュールによって実行されることができる。一般的に、図面に示した任意の動作は、それらの動作を実行することができる対応する機能的手段によって実行されることができる。
【0040】
本開示に関連して説明された、さまざまな例示的な論理ブロック、モジュール、および回路は、ここで説明された機能を実行するように設計された、汎用プロセッサ、デジタル・シグナル・プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ・シグナル(FPGA)、または他のプログラマブル論理デバイス(PLD)、離散ゲートまたはトランジスタ論理、離散ハードウェア・コンポーネント、またはそれらの任意の組み合わせを用いて、実現または実行されることができる。汎用プロセッサは、マイクロプロセッサであることができるが、その代わりに、プロセッサは、商業的に利用可能な任意のプロセッサ、コントローラ、マイクロコントローラ、またはステート・マシンであることができる。プロセッサは、また、コンピューティング・デバイスの組み合わせ、たとえば、DSPと、1つのマイクロプロセッサ、複数のマイクロプロセッサ、DSPコアと結合された1つ以上のマイクロプロセッサとの組み合わせ、または任意の他のそのような構成として、実現されることもできる。
【0041】
本開示に関連して説明された方法またはアルゴリズムのステップは、ハードウェアで直接的に、プロセッサによって実行されるソフトウェア・モジュールで、または両者の組み合わせで、具現化されることができる。ソフトウェア・モジュールは、当該技術で知られている任意の形態の記憶媒体中に存在することができる。使用され得る記憶媒体のいくつかの例は、ランダム・アクセス・メモリ(RAM)、読取専用メモリ(ROM)、フラッシュメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブル・ディスク、CD−ROM、等を含む。ソフトウェア・モジュールは、単一の命令または多数の命令を備えることができ、いくつかの異なるコード・セグメントにわたって、異なるプログラム間で、および複数の記憶媒体にわたって、分散されることができる。記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合されることができる。その代わりに、記憶媒体は、プロセッサに組み込まれることができる。
【0042】
ここに開示された方法は、説明された方法を達成するための1つ以上のステップまたは動作を備える。方法のステップおよび/または動作は、本願の特許請求の範囲から逸脱せずに、互いに置き換えられ得る。すなわち、ステップまたは動作の特定の順序が指定されない限り、特定のステップおよび/または動作の順序および/または使用は、本願の特許請求の範囲から逸脱せずに変更されることができる。
【0043】
説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせにおいて実現されることができる。ソフトウェアで実現される場合、機能は、1つ以上の命令として、コンピュータ読取可能な媒体で記憶されることができる。記憶媒体は、コンピュータによってアクセスされることができる任意の入手可能な媒体であることができる。限定ではなく例として、そのようなコンピュータ読取可能な媒体は、命令またはデータ構造の形態で所望のプログラム・コードを搬送または記憶するために使用されることができ、かつ、コンピュータによってアクセスされることができる、RAM、ROM、EEPROM、CD−ROM、または他の光ディスク記憶装置、磁気ディスク記憶装置、または他の磁気記憶デバイス、または任意の他の媒体を含むことができる。ディスク(disk)およびディスク(disc)は、ここで使用される場合、コンパクト・ディスク(disc)(CD)、レーザディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、およびブルーレイ(登録商標)ディスク(disc)を含み、ディスク(disk)は通常、磁気的にデータを再生するが、ディスク(disc)は、レーザを用いて光学的にデータを再生する。
【0044】
したがって、ある特定の実施形態は、ここに提示された動作を実行するためのコンピュータ・プログラム製品を備え得る。たとえば、そのようなコンピュータ・プログラム製品は、命令が記憶(および/またはコード化)されたコンピュータ読取可能な媒体を備えることができ、それらの命令は、ここに説明された動作を実行するために1つ以上のプロセッサによって実行可能である。ある特定の実施形態では、コンピュータ・プログラム製品は、パーケージ材料を含むことができる。
【0045】
ソフトウェアまたは命令は、伝送媒体によって伝送されることもできる。たとえば、ソフトウェアが、ウェブサイト、サーバ、または他のリモート・ソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波のような無線技術を使用して伝送される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波のような無線技術は、伝送媒体の定義に含まれる。
【0046】
さらに、ここに説明された方法および技法を実行するためのモジュールおよび/または他の適切な手段が、ダウンロードされ得ること、および/または、そうでなければ、ユーザ端末および/または基地局によって、適用可能であるように得られ得ることが理解されるべきである。たとえば、そのようなデバイスは、ここに説明された方法を実行するための手段の伝送を容易にするために、サーバに結合されることができる。あるいは、ここに説明されたさまざまな方法は、記憶手段(たとえば、RAM、ROM、コンパクト・ディスク(CD)またはフロッピーディスクのような物理記憶媒体、等)を介して提供されることができるので、ユーザ端末および/または基地局は、記憶手段をデバイスに結合または提供して、さまざまな方法を得ることができる。さらに、ここに説明された方法および技法をデバイスに提供するための任意の他の適切な技法が利用されることができる。
【0047】
本願請求項は、上述された、まさにその構成およびコンポーネントに限定されないことが理解されるべきである。さまざまな変更、交換、および変形が、本願の特許請求の範囲から逸脱せずに、上述された方法および装置の構成、動作、および詳細に対してなされることができる。
【0048】
上記は、本開示の実施形態に関するものであるが、本開示の他の実施形態およびさらなる実施形態が、その基本的な範囲から逸脱せずに考案されることができ、その範囲は、下記の請求項によって決定される。

【特許請求の範囲】
【請求項1】
信号処理のための方法であって、
1つ以上の対象に関連する1つ以上の信号を得ることと、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出することと、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除くことと、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得ることと
を備える方法。
【請求項2】
前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識すること
をさらに備える、請求項1に記載の方法。
【請求項3】
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングすること、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
をさらに備える、請求項1に記載の方法。
【請求項4】
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングすること、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
をさらに備える、請求項1に記載の方法。
【請求項5】
複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングすること、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
をさらに備える、請求項1に記載の方法。
【請求項6】
信号処理のための方法であって、
複数の対象のうちのある対象に関連する画像を得ることと、
前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成することと、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成することと、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
を備える方法。
【請求項7】
前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて、再構成することと、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用することと
をさらに備える、請求項6に記載の方法。
【請求項8】
前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出すること
をさらに備える、請求項6に記載の方法。
【請求項9】
前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、請求項6に記載の方法。
【請求項10】
信号処理のための装置であって、
1つ以上の対象に関連する1つ以上の信号を得る手段と、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出する手段と、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除く手段と、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得る手段と
を備える装置。
【請求項11】
前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識する手段
をさらに備える、請求項10に記載の装置。
【請求項12】
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする手段、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
をさらに備える、請求項10に記載の装置。
【請求項13】
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする手段、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
をさらに備える、請求項10に記載の装置。
【請求項14】
複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングする手段、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
をさらに備える、請求項10に記載の装置。
【請求項15】
信号処理のための装置であって、
複数の対象のうちのある対象に関連する画像を得る手段と、
前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成する手段と、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成する手段と、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
を備える装置。
【請求項16】
前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて、再構成する手段と、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用する手段と
をさらに備える、請求項15に記載の装置。
【請求項17】
前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出する手段
をさらに備える、請求項15に記載の装置。
【請求項18】
前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、請求項15に記載の装置。
【請求項19】
信号処理のための装置であって、
信号に基づいて対象の1つ以上の一般的な特徴を抽出し、各対象のための1つ以上の更新されたパターンを得るために前記信号から前記一般的な特徴を取り除き、前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得るように構成された、少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに結合されたメモリと
を備える装置。
【請求項20】
前記少なくとも1つのプロセッサはさらに、
前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識する
ように構成される、請求項19に記載の装置。
【請求項21】
前記少なくとも1つのプロセッサはさらに、
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
ように構成される、請求項19に記載の装置。
【請求項22】
前記少なくとも1つのプロセッサはさらに、
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
ように構成される、請求項19に記載の装置。
【請求項23】
前記少なくとも1つのプロセッサはさらに、
複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングする、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
ように構成される、請求項19に記載の装置。
【請求項24】
信号処理のための装置であって、
複数の対象のうちのある対象に関連する画像を得て、前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて前記画像の1つ以上の一般的な特徴を再構成し、前記再構成された一般的な特徴を使用して識別的なディクショナリに基づいて前記対象を認識するために前記画像を再構成する、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、ように構成された少なくとも1つのプロセッサと
前記少なくとも1つのプロセッサに結合されたメモリと
を備える装置。
【請求項25】
前記少なくとも1つのプロセッサはさらに、
前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて再構成し、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用する
ように構成される、請求項24に記載の装置。
【請求項26】
前記少なくとも1つのプロセッサはさらに、
前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出する
ように構成される、請求項24に記載の装置。
【請求項27】
前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、請求項24に記載の装置。
【請求項28】
命令が記憶されたコンピュータ読取可能な記憶媒体を備える、信号処理のためのコンピュータ・プログラム製品であって、前記命令は、
1つ以上の対象に関連する1つ以上の信号を得て、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出し、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除き、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得る
ためにプロセッサによって実行可能である、コンピュータ・プログラム製品。
【請求項29】
命令が記憶されたコンピュータ読取可能な記憶媒体を備える、信号処理のためのコンピュータ・プログラム製品であって、前記命令は、
複数の対象のうちのある対象に関連する画像を得て、
前記対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成し、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成する、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
ためにプロセッサによって実行可能である、コンピュータ・プログラム製品。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図3A】
image rotate

【図4】
image rotate

【図4A】
image rotate


【公表番号】特表2013−519163(P2013−519163A)
【公表日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願番号】特願2012−552030(P2012−552030)
【出願日】平成23年2月1日(2011.2.1)
【国際出願番号】PCT/US2011/023326
【国際公開番号】WO2011/094737
【国際公開日】平成23年8月4日(2011.8.4)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】