説明

画像パターン認識システム及び方法

画像パターン認識用のシステム及び方法は、画像のベクトル量子化(VQ)を使用してデジタル画像の取り込み及び符号化を備える。ベクトルのボキャブラリーは、画像をカーネルに区分し各カーネルに対応するベクトルを生成することにより形成される。画像は、ボキャブラリーに格納されるベクトルを指示するインデックスを有するベクトルインデックスファイルを生成することにより符号化される。ベクトルインデックスファイルは、ボキャブラリーに格納されるベクトルを調べることにより画像を再構成するように使用可能である。画像の候補領域のパターン認識は、特別の画像特徴部と相関するベクトルを備えたベクトルセットのトレーニング前のボキャブラリーに画像ベクトルを相関することにより完成可能である。仮想顕微鏡において、上記システム及び方法は、微小癌組織の転移クラスタの検出、組織の同定、免疫組織化学上の検査に関する分析の領域の配置のような、希な事象の発見、及び、組織マイクロアレイ(TMAs)として分類される組織学部分のような組織サンプルの迅速な選別に適している。

【発明の詳細な説明】
【発明の詳細な説明】
【0001】
本出願は、2003年2月28日に出願された、米国特許出願No.60/451083号を基礎とする優先権主張出願であり、その開示内容の全ては、参考として本明細書中に編入されるものである。
【0002】
本発明は、概略、デジタル顕微鏡のスライドガラス(slides)における自動検査に関し、より詳しくは、仮想スライドガラス(virtual slides)の自動検査で使用されるパターン認識技術に関する。
【0003】
顕微鏡検査の自動化に対する障害は、顕微鏡標本の全体を診断上の解像度にて効率的にデジタル化することができない点である。仮想スライドガラスを作製するための従来のアプローチは、タイルを貼るように画像を貼り付けること(image tiling)に頼っている。画像のタイリング(tiling)は、通常の電荷結合素子(CCD)カメラを使用する、顕微鏡スライドガラスの多数の小領域の取り込みを含む。それらのタイル(tiles)は、一般的に、全スライドガラスの大きな連続したデジタル画像(モザイク)を生成するように、互いに「縫い合わされる」(並べられる)。一般的に、50000画素/インチ(0.5μm/画素)にて、15mm×15mmの面積のスライドガラスをデジタル化するには、最低、2250の個々のカメラのタイルが必要である。
【0004】
画像のタイリングは、種々の不具合をもたらす。第1に、画像のタイルがカメラの固定面対物レンズからの単一の焦点面に限定されるため、画像は、しばしば歪んでしまう。第2に、画像タイリングシステムは、画像タイルの中心のまわりに円形につり合った光収差を生じる。第3に、カラーCCDでは、非隣接画素からのカラー値の補間において空間解像度が悪くなることから、全画素の分析は、通常、利用できない。
【0005】
パターン認識への従来のアプローチもまた、厄介である。光学顕微鏡において長年に改良がなされたが、多くの場合、専用装置の接眼レンズを通して標本を人力で評価することが未だに操作者に要求されている。世界的に、何千もの臨床上の研究所において、他の、試験管外の診断試験処置よりもマニュアル顕微鏡の操作により多くの時間が費やされている。20000と見積もられる調査研究所において、マニュアル顕微鏡検査は、薬物ターゲット(drug targets)を選別するため、及び毒物学の勉強を行うために必須の道具である。自動化に関する莫大な機会を提供しながら、顕微鏡検査は、他の点では自動化された解決案に転向されている環境において、人力の砦のままである。
【0006】
コンピュータによるパターン認識において幾つかの試みがなされている。顕微鏡画像のパターン認識へのそれらのアプローチは、形態学の特徴に基づく。多数の特徴点距離(例えば、細胞のサイズ、細胞核と細胞質との比、丸み、密度、色、きめ、等)が、画像内に現れる「対象物」(例えば、細胞)を同一と見なすために計算される。パターン認識は、未知の対象物における特徴点距離を既知の対象物の特徴点距離と相関させることで達成される。特徴点に基づくアプローチは、対象物を同定するために多様な細胞が必要となる細胞学では、いくつか成功している。しかしながら、それら従来のアプローチは、非常に複雑であり、又、信頼できる対象物の分割が困難である組織学上の画像データに関して完全なものではない。
【0007】
画像パターン認識システム及び方法は、画像のベクトル量子化(「VQ」)を使用する、デジタル画像の取り込み及び符号化を備える。ベクトルのボキャブラリーは、画像をカーネル(kernel)に分割し、各カーネルに対応してベクトルを生成することで構築される。画像は、上記ボキャブラリーに格納されるベクトルに、複数のインデックス(「ポインター」)付きのベクトルインデックスファイルを作成することにより符号化される。ベクトルインデックスファイルは、上記ボキャブラリーに格納されているベクトルを調べることで画像を復元するのに使用可能である。画像の候補領域のパターン認識は、特別な画像特徴部分と相関するベクトルを備えたベクトルセット(vector sets)のトレーニング前のボキャブラリー(pre-trained vocabulary)に画像ベクトルを相関させることで達成可能である。仮想顕微鏡において、上記システム及び方法は、微小癌組織の転移クラスタの検出、組織の同定、免疫組織化学上の検査に関する分析の配置領域のような、まれな事象の研究、及び、組織マイクロアレイ(tissue microarrays: TMAs)として分類される組織学部分のような、組織サンプルの迅速な選別に適している。
【0008】
[発明を実施するための最良の形態]
ここに記載する実施形態は、パターン認識システム及び方法を提供する。例えば、ここに記載する一つの方法は、複数の画像カーネル(image kernels)に分割されるデジタル化された画像を考慮に入れている。画像カーネルは、カーネルにおける各画素の光の強度(intensity)を判断するように分析される。画像カーネルに関する画素の強度は、ベクトルに結合され、該ベクトルは、画像における他のベクトルとともにデータ構造内に格納される。各ベクトルは、インデックス及びベクトルを使用して後に復元可能なデジタル画像用のコンポジットインデックスを生成するために、索引が付けられる
【0009】
ここの説明を読むことで、当業者は、種々の、別の実施形態及び応用例において本発明をどのように実行すればよいか明らかになるであろう。しかしながら、本発明の種々の実施形態がここに記載されるが、それらの実施形態は、例としてのみ記載するもので、それらに限定するものではない。種々の実施形態の詳しい説明は、それ自体、添付の請求範囲に記載する本発明の権利範囲若しくは幅を限定するように構成されるべきではない。
【0010】
自動顕微鏡検査における第1ステップは、仮想スライドガラス、即ち、全スライドガラスの高解像度デジタル画像を生成することである。本発明のシステム及び方法は、ベクトル量子化(「VQ」)として知られた技術を使用することで、存在する画像パターン認識技術における多くの不具合を克服する。VQは、ボキャブラリーを使用してビットストリームを符号化する、コンピュータ操作上の技術である。VQは、有効な冗長度(redundancy)を有する画像を符号化するのに特に適している。
【0011】
VQは、特質上繰り返される画像データにおけるパターン認識に便利なアプローチである。基本的に、VQを使用するパターン認識は、以前に符号化されたパターン(即ち、特別の特徴部分)と、新たな画像データとを比較することに基づいている。甚大な量の画像データを取りまとめ検索するためのコンピュータ操作上のチャレンジは、莫大にあり、本発明より前では、大きな画像におけるパターン認識にVQを応用することはできなかった。ここに記載するシステム及び方法によるVQの実行は、それらのコンピュータ操作上のチャレンジを克服し、仮想顕微鏡画像におけるパターン認識を可能にする。
【0012】
本発明の、VQに基づく画像パターン認識用のシステム及び方法は、幾つかの理由に関して、従来技術を超える重要な改良点を有する。即ち、第1に、画像情報の符号化が一度実行された後、VQベクトル情報を相関させることによりパターンマッチングが単独で実行可能であるので、VQに基づくパターン認識は、画像情報を比較することよりも効率がよい。第2に、VQは、重要な特徴部分を特定する所定の発見的方法を必要とせずに、全ての画像の特徴部分を符号化する。パターンマッチングは、形態測量的、比色定量的、状況依存的、等の、関係するベクトルの生成に使用されるトレーニングに依存するものでもよい。最後に、VQパターン認識は、それが使用されるとき自動的に学習する。統計的な方法は、特別パターンに関する特徴であるベクトルの重要性を決定する。
【0013】
図1は、VQを使用した画像符号化の処理100を示している。処理100は、デジタル画像105が分析され、画像カーネル108と呼ばれる小さな方形状の領域に分割された後、始められる。画像105は、例えば、一又は複数の画像特徴部分を備えた肝臓であってもよい。画像特徴部分は、組織マイクロアレイ(「TMA」)内の分析用の腫瘍細胞又は領域(「ROA」)のクラスタのような画像の領域にて示すことができる、ユーザにて規定された属性である。カーネルは、一辺当たり1〜64画素に、又はカーネル当たり1〜4096全画素に、サイズ変更できる。当業者によれば、より大きなサイズのカーネルが使用可能であることを理解できよう。
【0014】
次に、それぞれのカーネル108に対応してベクトル112が生成され、ボキャブラリー110に格納される。ボキャブラリー110は、それぞれのカーネル108に対応したそれぞれのベクトル112を有するデータ構造である。該データ構造は、データベース、ファイル、関連付けられたリスト、あるいは他のベクトル112の収集物とすることができる。ベクトル112は、スカラーの一次元のアレイである。ベクトル量子化において、各ベクトルは、3つのカラーチャンネル毎に、一つのカーネルにおける全画素の画素強度(intensities)を表す。例えば、15画素×15画素を有する一つのカーネルは、225×3=675の強度値を有する一つのベクトルに相当する。
【0015】
ベクトルインデックスファイル120は、画像105を有するベクトル112に対応する(即ち「指す」)インデックス116の収集物である。ボキャブラリー110における各ベクトル112は、固有のインデックス116が割り当てられている。一実施形態において、一つのインデックス116は、固有の4バイトの整数である。画像が複数のカーネル108に完全に分割されると、対応するベクトル112が各カーネル108毎に生成され、ベクトル112にインデックスが付される。この時点で、画像は、ベクトル量子化、即ちVQ符号化されたと言われる。画像105がVQ符号化された後、画像は、ベクトルインデックスファイル120において(ボキャブラリー110の内容とともに)一連のインデックス116により完全に表される。
【0016】
画像105は、ボキャブラリー110内の各ベクトル112を探すためにインデックス116を使用して復元可能である(即ち、VQ復号化される)。復号化は、画像105を描画するのに必要な対応するカーネル108を再形成するためにベクトル112を使用する。
【0017】
冗長なカーネルを利用することは、VQ符号化の重要な構成である。VQ符号化処理において、新たに特定されるそれぞれのカーネル108は、ボキャブラリーに既に格納されたベクトル112と比較される。もし十分に近い一致が、既にボキャブラリー110内にあるベクトル112について見つかったならば、新たに特定されるカーネル108が再度使用される。しかしながら、十分に近い一致が、既にボキャブラリー110内にあるベクトル112について見つからなければ、新たに特定されるカーネル108は、ボキャブラリー110に追加される。その結果、時間経過により、ボキャブラリー110は、特別な画像タイプ、例えば肝臓組織の標本の画像に関する画像データにて見つかったほぼ全てのカーネル108にて占められる。従って、提供された組織タイプのスライドガラスが符号化されるとき、そのようなスライドガラスに現れるカーネル108がますますボキャブラリー110に格納され、よって新しいベクトル112は殆ど加える必要がない。一実施形態において、熟成したボキャブラリー110は、ボキャブラリー110に新たなベクトル112を加えることなく画像105をVQ符号化することができる。
【0018】
再利用するため、ベクトルが存在する前のボキャブラリー110を検索することは、コンピュータの計算上、不経済である。本発明のシステム及び方法は、処理時間及び使用メモリにおいて数桁、低減することを達成した。この改善された処理効率を達成するための一つの技術には、次の形態にて述べるように、ベクトルとそれに対応する画像特徴部分との間の相関関係を計算することが含まれる。
【0019】
図2は、本発明の実施形態による画像パターン認識方法を示すフロー図である。該画像パターン認識処理は、トレーニング段階201と、パターン認識段階202とに分けることができる。トレーニング段階201の第1ステップ205では、人間である専門家が属性の特徴として画像の領域を特定する。例えば、生物学の専門家は、組織標本を検査し、TMA内で腫瘍細胞若しくはROAsのグループを可視的に特定するであろう。一般的に、上記属性は、特に目に見える特徴部に関係なく、上記専門家によって認識される。ここで、上記特徴部とは、例えば形態測量的、比色定量的、及び/又は、状況依存的な、画像の特徴部の属性を備えた部分である。
【0020】
ステップ210では、画像特徴部に見つけられるベクトルに対応する、それぞれのベクトルインデックスを格納するため、ベクトルセットが生成される。複数のベクトルセットが異なる特徴部毎に生成可能である。例えば、ステップ205では専門家により特定された異なる腫瘍タイプ毎に異なるベクトルセットが生成可能である。例えば、一つのベクトルセットが黒色腫に対して生成可能であり、別のベクトルセットが白血病に対して生成可能である。
【0021】
ステップ215では、画像特徴部に対する各ベクトルの相関関係が計算される。一実施形態では、上記相関関係は、以下の比を使用して計算される。
特徴部を示す領域におけるベクトルの観察(observe)回数/全ベクトル観察回数
【0022】
ステップ220では、画像特徴部に対する各ベクトルの相関関係が対応のベクトルインデックスとともにベクトルセットに格納される。ベクトルセットは、以前に特定された画像特徴部にベクトルインデックスが関連する相関関係とともに、ベクトルインデックスを含む。ステップ225では、次に特定される画像のために、上記トレーニング段階が繰り返される。トレーニング段階201を通過した一連の画像の結果により、個々のベクトルと特別のベクトルセットとの間の相関関係が計算されるであろう。該システムを鍛えるためにより多くの画像が使用されるほど、個々のベクトルと特別のベクトルセットに関する相関関係が統計的により完全なものになるであろう。十分に多くの数の画像が処理され、ベクトルセットにより表される特別な特徴部と個々のベクトルが相関したとき、上記トレーニング段階が完了しパターン認識が開始可能である。
【0023】
特徴部を示す画像領域において、特別なベクトルがいままでに見つけられたならば、ベクトルと特徴部との間の相関関係は、1のような最大値、それは100%の相関関係である、を有するであろう。この場合、ベクトルは、特徴部に関して高い予測値を有するであろう。一方、特徴部を示す画像領域において特別なベクトルが見つけられていないならば、上記相関関係は、ゼロのような最小値、それは100%の非相関関係である、を有するであろう。この場合、ベクトルは、特徴部が存在しないことに関して高い予測値を有するであろう。最後に、特徴部を示す画像領域において特別なベクトルが時々見つけら、時々見つけられないならば、相関関係値(又、「比」として記す)は、0と1との間の任意値となるであろう。その比がほぼ1/2であれば、ベクトルは、特徴部が非存在であることに関する低い予測値を有するであろう。
【0024】
上記パターン認識段階の最初のステップであるステップ230では、新しい画像の候補領域が特定される。候補領域は、一若しくは複数の属性であるいずれかの画像特徴部を有するいずれかの領域を有するように、うまく特定されたことがない画像領域である。多くの場合、画像の候補領域は、標本組織を含む画像の全画像あるいは部分である。よって、候補領域に対応するベクトルは、トレーニング段階の間、偶然に発生可能であったり、発生しなかったりする。ステップ235では、候補領域におけるベクトルに対応する特別のベクトルセットへの相関関係の平均が計算される。ステップ240では、候補領域が一若しくは複数のベクトルセットにより表される特徴部を示す可能性を判断するために、上記平均が評価される。高平均の相関関係は、候補領域が高い確率で特徴部を示すことを示し、一方、低平均の相関関係は、低確率であることを示す。候補領域は、上記領域が種々の異なる特徴部を示す確率を決定するために、多数のベクトルセットと比較可能である。例えば、組織学上の組織の画像は、組織が腫瘍を含む可能性を決定し、もしそうであるならば腫瘍のタイプを決定するため、異なるタイプの腫瘍の目に見える特徴部を表す種々のベクトルセットと比較可能である。パターン認識に関する上述の技術における重要な利点は、候補領域が、それらが示すであろう特徴部により区分されるだけでなく、それらがそのようになる実際の確率が計算されるということである。
【0025】
一実施形態において、画像パターン認識に関するシステム及び方法は、クライエント/サーバーに分類された構造を使用して実行される。図3は、本発明のクライエント/サーバーの実施形態を示している。サーバー302は、VQ符号化サーバーソフトウエア308及びボキャブラリー310を備え、サーバー302は、例えばLAN/WAN通信チャンネルのようなネットワーク303を介して一若しくは複数のクライエント301と通信する。クライエント301は、VQ符号化クライエントソフトウエア307を備え、該ソフトウエア307は、ベクトルインデックスファイル320を発生するように画像ファイル305を処理する。この実施形態では、ボキャブラリー310は、サーバー302において中心的に配置され、クライエント301に共用アクセスを提供する。ボキャブラリーの集中化は、データベースのメンテナンスを容易にし、追加のベクトルが付加されるとき、分配されたボキャブラリーを同期させる必要を排除する。さらに、クライエント/サーバーの実現は、中心位置で実行されるべき、検索やインデックス付与等の計算上で多くのタスクが集中するのを許容し、クライエント301の負担を救う。
【0026】
大きなボキャブラリーのため、ボキャブラリー310を索引付けするのに要する時間は、一般的な画像305をVQ符号化するのに必要な時間の約2倍かかる。例えば、画像を処理する総60分から外れて、索引付けの時間は60分になり、VQ符号化時間は20分になるであろう。符号化に要する20分の内、画像305のカーネルへの分割に約5分を要し、ボキャブラリー310の検索に約15分を要する。上記クライエント/サーバーの実施形態を使用し実現すると、サーバー処理308は、索引付けされる前のボキャブラリー(pre-indexed vocabulary)を連続して使用可能とする。提供されたいずれの画像に関する符号化処理は、ボキャブラリーの再度の索引付けを必要をしないであろう。よって、処置時間のその部分が排除される。クライエント/サーバー通信オーバーヘッドは、(クライエント側で)画像105をカーネルに細分し、及び(サーバー側で)それらのカーネルに関するボキャブラリー310を検索するオーバーヘッドに比較して、比較的小さい。したがって、2つに分配されたコンピュータ間で処理を分割することは、実行時間をかなり増すことにはならない。一方、処理を分配することにより、クライエント側でのカーネルの細分は、サーバー側でのボキャブラリー検索に対抗して重複する可能性があり、それによって、クリティカルパスからクライエント処理時間を排除することで全体の処理時間の正味の減少となる。この方法により、一つのスライドガラスにおける全部で60分の符号化時間は、一つのスライドガラス当たり15分に低減可能である。
【0027】
本実施形態におけるクライエント及びサーバー間での処理労力の分割は、他の効率化を有する。ボキャブラリー310の索引付け及び検索は、コンピュータを多用するタスクであり、大容量のメモリを有する高速プロセッサにて実行するのが一番よい。画像305のカーネルへの分割、及びネットワーク303上での通信は、比較的少ない処理能力でよい。本実施形態では、多数の非力なクライエントマシン301に代わって、少数の強力なサーバーマシン302に処理の実行を行わせ、システム全体での効率の向上を図る。さらに、ボキャブラリーファイル310は、一般的に非常に大きく、しばしば大きなディスクアレイ(例えばRAID)に格納される。一方、ベクトルインデックスファイル320は、それより数桁小さく、通常のコンピュータディスクに格納可能である。
【0028】
クライエント/サーバー実施形態に追加して、画像パターン認識に関するシステム及び方法の種々の他の態様が、効率及び精度の両方を改善するのに使用可能である。一実施形態において、例えば、エンコーダ307は、符号化の前に、RGB(「赤−緑−青」)カラー空間からYCRCB(強度−赤−青)カラー空間へ全画像を変換するようにプログラム可能である。複数のカーネルがボキャブラリー310内の複数のベクトルと照合されるとき、画像の解像度に関する人間の知覚は、基本的に、色の相違よりもむしろ強度の相違に依存することから、Yチャンネル値は、Cチャンネル値よりも、より注意深く照合される。この優先順位付けは、カーネルの情報量を損なうことなく、ある比較における誤差をより小さくすることができる。その低誤差を見込むことで、より多くの相関関係が見つかる。したがって、ボキャブラリー310は、より小さくなり、その結果、ベクトルインデックス320のサイズが小さくなり、インデックス検索時間が低減される。
【0029】
本発明の他の態様において、カラーチャンネルの最適化が、ボキャブラリーファイル310のサイズをさらに低減するのに実行可能である。画像の強度値の相違における人間の知覚は非直線的であり、範囲の中間(強度の中位)で最も敏感であり、極端部分(明部又は暗部)で最小感度である。エンコーダ307は、カーネルがボキャブラリー310にてベクトルと照合されるとき、強度範囲の中間におけるYチャンネル値が、上記範囲の両端でのYチャンネル値の場合よりもより厳しい誤差にて照合されるように、これを利用して構成可能である。この優先順位は、同様に、カーネル108の情報量を損なうことなく、一定の比較においてより小さい誤差を可能にする。上述したように、クリティカルさがより少ない一定の比較に関して低誤差は、結果的に、非常に小さいサイズのボキャブラリー310となり、それによってインデックスの検索時間を非常に低減する。
【0030】
さらに別の態様において、YCRCBカラー空間内でCチャンネル値のビットサイズを低減するために、差動符号化が使用可能である。差動符号化では、ベクトル内の各強度値は、その左上に近接する3つの隣接部の平均値と強度値との差によって交換される。例えば、値が座標位置[x, y]での画素を表すならば、上記平均は、[x−1,y]、[x−1,y−1]、[x、y−1]の画素に関して計算される(尚、デジタル画像に関する標準的な慣習では、[0,0]は、画像の左上隅であり、xは右へ増加し、yは下方へ増加する点に注意。)。さらに、Cチャンネルの強度値に関して、強度は、一般的に8ビットの値として格納されるが、隣接する強度間の差異は、正確さを損なうことなく4ビットの値で表すことができる。このことは、各値の範囲を256(強度用)から16(差分用)に減少する。したがって、各値に関するインデックスツリーサイズにおける実質的な減少が得られ、ボキャブラリー310をより高速に検索することができる。
【0031】
ボキャブラリーインデックスをエンコーダ308により検索するのに使用されるデータ構造は、システム資源の使用量及び符号化性能の重要な決定要因である。一実施形態において、ベクトルツリーと呼ばれる新しいデータ構造がベクトルインデックスを格納及び検索するのに使用可能である。ベクトルツリーは、各リーフノードが別のツリーのルーツである、バランスのとれたツリーを備える。トップレベルのツリーは、各カーネルの第1寸法(dimension)を表す。このツリーのリーフノードは、第1寸法の値でそれぞれ定義された、各カーネルの第2寸法を表すツリーを含む。各第2レベルのリーフノードは、第3寸法を表すツリーを含む。以下、同様となる。次のレベルのツリーに関するルーツを含むことに加えて、各リーフノードは、定義されたベクトルの最後の寸法も表すことができる。この場合、ベクトルのインデックスは、また、リーフノードに格納される。この機構では、異なるサイズの多数の寸法ベクトルを一つの構造内にともに格納させることが可能であり、異なる寸法を有する多数のカーネルを同時に検索することを容易にする。
【0032】
一実施形態において、ネストされたカーネルのロジックがベクトル強度値をより効率的に格納するのに使用され、それによりインデックスの検索時間を減少させることができる。k×k画素のサイズのカーネルは、3kの強度値を有する。それらのベクトルのサイズは、ボキャブラリーインデックスのサイズ、及びベクトルインデックスの検索に要する時間とともに、ボキャブラリーファイル310のサイズのキードライバーである。
【0033】
一実施形態において、カーネルは、各カーネルに要する強度値の数を6kに減じるネストされた形態で表される。図4は、ベクトルを格納するために使用可能なネストされたカーネルの論理を示す図である。このネストされたカーネルの論理を使用することで、寸法kの各カーネル408(「外側カーネル」)は、それらの左上隅に配置した状態で、内側に予め配置された寸法k−1のカーネル405を有するように見なされる。可変寸法のカーネル論理を参照して以下に説明するように、ロジックを符号化することは、「見つからない」ことが生じるまで、画素位置にて連続的に、より大きいカーネルについてボキャブラリーの検索を試みるので、実際の慣習では、このことは常に生じる。
【0034】
このことは、外側カーネル408が6k(即ち、3(2k))の値で表されることを可能にする。3という係数は、3つのカラーチャンネルからである。2kの内、最初の値は、内側カーネル405のインデックスによって表され、次のk値は、外側カーネル408の右端に沿った画素410である。残りのk−1の値は、外側カーネル408の底端に沿った画素415である。
【0035】
3kの強度値の代わりに6kの強度値でカーネルを表すことは、ベクトルを表すのに必要な値の数をかなり減少させる。例えば、k=15画素のサイズのカーネルでは、当該カーネルを格納するのに90の値(675の代わりに)となるであろう。このことは、ボキャブラリーファイルのサイズ、及びインデックス検索用のVQエンコーダにて使用される対応のベクトルツリーのサイズを劇的に減じる。符号化検索時間も同様に減じる。
【0036】
図1に戻り、検索時間を減じるための他の技術は、可変サイズのカーネルの論理を使用した画像105のVQ符号化を含む。図1において、VQ符号化された画像105を含む例示的なカーネル108は、サイズが可変である。この技術は、符号化された画像において、サイズが可変で、対象物、構造、及び特徴部の広い範囲を吸収するカーネルによる画像データのマッピングを可能にする。それは、また、ある画像に関して最適なカーネルサイズを特定し又は導き出す必要を排除する。
【0037】
図5は、本発明の実施形態による可変サイズのカーネルを生成するためのプロセスの一例を示すフロー図である。ステップ505では、VQエンコーダは、左上から右下へ各画素位置を通り繰り返す。ステップ510(各画素位置で実行される)において、ボキャブラリーでは、サイズn(最小のカーネルサイズのパラメータ値、一般的には3又は4)に一致するカーネルが検索される。ステップ515では、上記カーネルが見つかったならば、ステップ520にてnがインクリメントされ、サイズn+1のカーネルの検索が、特定の正方形領域に匹敵するn×nサイズのカーネルの存在を見つける試みを行うように引き起こされる。エンコーダは、ステップ515にて「見つからない」の状態が生じるまで、ボキャブラリーを通して連続的により大きいカーネルにトライして、ループ(loops)する。
【0038】
ステップ525では、特定の画像位置と、現在のn×nカーネルとの間で一致が見つからないならば、上記ループの以前の繰り返しにて見つけられたn−1×n−1サイズの存在するカーネルに、特定の正方形領域がマップされる。n−1×n−1のカーネルに関する使用数は、画像領域をマップするために別の例のカーネルが使用されていることを示すように、インクリメントされるであろう。検索されたが見つからなかったn×n領域について、ステップ530では、その領域がボキャブラリーに追加され(そして適切に索引付けされる)、新しいカーネルの使用数は、1に初期化されるであろう。カーネルが一致する毎に、使用数が増加し、使用数がパラメータ値のしきい値(一般的には20)を超えたとき、カーネルは、画像符号化に使用可能である。この方法にて、ボキャブラリーは、さらに大きな画像情報を含むさらに大きなカーネルとともに連続して徐々に大きくなる。
【0039】
上述の実施形態は、可変サイズの正方形のカーネルを使用している。別の実施形態では、n+1×n+1よりもむしろn+1×nまで検索されるようにカーネルのサイズを増加することで、方形のカーネルを使用することもできる。例えば、ステップ515において、もしカーネルが見つかったならば、カーネルの一辺のサイズがステップ520にて増加され、n+1×nのサイズのカーネルの検索が、特定の方形領域と一致するn+1×nサイズのカーネルの存在を見つけることを試みるように引き起こされる。エンコーダは、ボキャブラリーを通して、ステップ515にて「見つからない」の状態が生じるまで、大きい方形若しくは正方形のカーネルを連続的に試してループする。
【0040】
例示的な実施形態において、ここで述べるシステム及び方法の実行及び格納要求を決定するために肝臓組織学切片を使用して実行可能性調査が行われた。この調査の一つの目的は、仮想顕微鏡スライドガラスの画像のVQ符号化が、実際の応用例と矛盾のない実行時間にて、簡単に利用できるコンピュータを使用したハードウエアで実行できることを検証することである。他の目的は、ボキャブラリーのサイズ及び対応するインデックスのサイズをいかに速く収束させるかを決定することである。ある組織タイプのスライドガラスが符号化されるとき、収束が発生する。時間経過とともに、そのようなスライドガラスにおいて現れるカーネルがより多くボキャブラリー内に格納されるとき、それに応じて、新しいベクトルを追加する必要は殆ど無くなる。
【0041】
上記調査は、49の肝臓組織スライドガラスを使用して実行された。それらのスライドガラスは、標準的なH&E染色された組織学標本であった。上記スライドガラスは、ScanScope(登録商標)T108スキャナーでスキャンされた。仮想スライドガラスTIFFファイルが、Nikonの20x/0.75Plan Apochromat 対物レンズを使用して、各スライドガラス毎に、54000画素/インチ(0.5μm/インチ)にて生成され、Aperio Technologies, Inc. のJPEG2000圧縮ソフトウエアで7/9ウェーブレット法を使用して、20:1の圧縮比で圧縮された。圧縮された形態において、各仮想スライドガラスTIFFファイルは、ほぼ250MBを有する。図6は、この調査を使用したスライドガラスの標本例を要約した表である。
【0042】
上記調査にて使用された方法は、画像から近いカーネルがボキャブラリー内でどのようにベクトルと一致しなければならないかを決定するために、許容パラメータを使用した。上記調査は、3つの異なる許容パラメータ、4%(高)、5%(中)、6%(低)を用いて3回実行された。各場合、ボキャブラリーは、最初空であった。換言すると、3回の調査は、ボキャブラリー内にカーネルが存在する前ではない状態(with no pre-existing kernels)で始められた。各スライドガラスの画像は、ベクトルインデックスファイルを生成するボキャブラリーに対抗して符号化された。その符号化プロセスは、ボキャブラリーにカーネルを累進的に追加した。各スライドガラスは、符号化後、復号化され、符号化/復号化プロセスが良好であることを検証するため、Aperio TechnologiesのImageScope(商標)ビューアを使用して可視的に検査された。
【0043】
上記スライドガラスは、1GBのRAM及び80GBのハードディスクを有するDell Dimension 700MHzPentium(登録商標) IIIデスクトップコンピュータを使用して符号化された。このコンピュータは、不要な全てのオペレーティングシステムをディスエーブルしたWindows(登録商標) 2000 Professionalにて動作した。タイミング、ディスク、及びメモリの測定は、VQ符号化ソフトウエア自身にて実行された。
【0044】
第1の調査からの結果の一例が図7に表で示される。この表は、(全49スライドガラスの内)最初の5つのスライドガラスの処理、及び最後の5つのスライドガラスの処理に関する処理統計を示す。最後3つの欄は、処理時間を示す。平均のインデックスのロード時間は、30分であり、それは調査中、最大39分まで連続的に増加した。平均の符号化時間は、17分であり、最大24分であった。全体の処理時間は平均48分で、最大は63分であった。
【0045】
この調査からの重要な観察は、ボキャブラリーのサイズが収束するかどうか、即ち、連続的に新たなスライドガラスが殆どカーネルをデータベースに追加することのない点に到達するかどうかである。図7におけるベクトルの累積合計欄(#vectors)は、最後のほんの少数のスライドガラスよりも、最初のほんの少しのスライドガラスがより多くのベクトルをボキャブラリーに大いに追加したことを示している。49スライドガラスの後、収束の実質的な量が求められる。図8は、スライドガラスが処理されたとき、ボキャブラリーのサイズの変化を示している。ボキャブラリーは、漸近線に到達しないが、49スライドガラスの後の成長率は実質的に遅くなる。
【0046】
上記調査からの他の重要な観察は、インデックスサイズが「収束する」かどうかであり、メモリの常駐インデックスがどの程度の大きさになるかである。図7におけるベクトルインデックスのサイズ欄(idx MB)は、唯一のスライドガラス後、初期のインデックスサイズは520MBであるが、その後、成長はかなり遅くなり、全体ではほぼ停止することを示している。図9は、スライドガラスが処理されたときのインデックスサイズの変化を示すグラフである。インデックスサイズは、マシンで利用可能な物理的メモリ(1GB)を超えず、よって、ページングは必要ない。インデックスがメモリ常駐できないならば、符号化実行は劇的に減少するであろう。図9は、また、スライドガラスが処理されたとき、インデックス処理時間が増加することを示している。上記調査において、全インデックスが大きくなると、それぞれの新しいインデックスは挿入により多くの時間を要するので、インデックスロード時間は、インデックスサイズの成長速度と同じくらい速く成長するのをやめない。
【0047】
微小癌組織の転移は、本発明のシステム及び方法から大きな恩恵を得ることができる実際に有益な希な事象の知見応用例である。腫瘍を有する患者に関して、重要な問題は、癌細胞が転移しているかどうか、即ち、腫瘍から逃げて血流を介して体の他の部分へ移動しているかである。微小癌組織の転移は、血中にて1〜10の癌細胞の小さなクラスタの存在である。そのような転移が起こっているか否かを判断するため、患者の血液で50までの細胞学のスライドガラスが準備される。そしてそれらのスライドガラスは、上記転移のクラスタが存在するか否かを判断するために病理医によって顕微鏡で検査される。
【0048】
ブロック標本において、腫瘍細胞の出現の可能性を増すように豊富化処置が一般的に使用される。腫瘍細胞は、以下の形態学的特徴に基づいて通常細胞から区別される。
a)サイズ:一般的に直径で少なくとも20μm(通常の白血球は10〜15μm)。
b)核サイズ:大きく通常丸い(通常の核はより小さく、及び/又は形状が不規則)。
c)核形態学:通常一若しくは複数の核小体が存在する(細胞核内の小さいダークブルー色の領域)。
d)核着色:通常の白血球と比して通常明るく(ヘマトキシリンより明るくない)着色されている。
e)細胞質着色:通常の白血球と比して、あるいは青く(好塩基性よりも青く)着色されている。
f)核と細胞質との比:おおきな細胞核を示す通常の白血球に比べて通常高い。
【0049】
それらの属性に基づく区別は、微妙であり、検査の経験を積んだ病理医を必要とする。この種のまれな事象検出応用例において、偽陰性としないこと、即ち微小癌組織の転移のクラスタの出現が乏しく検出が困難であるにもかかわらず、上記クラスタを見逃さないことが重要である。
【0050】
偽陰性の確率を減少するため、スライドガラスは、上皮細胞(腫瘍がしばしば引き出す細胞のタイプ)に特有である免疫細胞化学の抗体で処理される。抗体は、上皮の細胞の起点を赤に着色し、通常の白血球は着色されない染料として用意される。これは、微小癌組織の転移クラスタのコントラストを著しく増し、視覚による検出を容易にし、偽陰性の確率を減少させる。この染料の使用により、微小癌組織の転移のスライドガラス標本は、低い解像度でスキャン可能であり、スキャンをより迅速に実行可能とする。
【0051】
偽陰性の確率をさらに減少するため、50までのスライドガラスが視覚的にスキャンされ、一つのスライドガラス当たり1〜10のクラスタが出現する一般的な場合で、非常に乏しい分類において、信頼できる診断を確保するように各クラスタが見つけられることが重要である。又、例えば、免疫細胞化学の染料を吸収し赤い塊として現れるゴミ粒子、及び血液試料内の他のくずにより、幾つかの擬陽性が発生する可能性がある。見つけられ可能性のある全てのクラスタは、本物の微小癌組織の転移クラスタから擬陽性を識別するように高い倍率で視覚的に検査されねばならない。
【0052】
領域が見つける目標をいつ構成するかを決定するようにしきい値が必要である。上記方法は、最良の結果を生じる値を決定するため異なるしきい値で繰り返し実行可能である。実際の応用例では、しきい値は、擬陽性となるように(偽陰性の確率を減少する)パターン認識にバイアスをかけるように最適な低側に維持されるであろう。
【0053】
図10は、ここに記載する種々の実施形態と関連して使用可能な例示的なコンピュータシステム550を示すブロック図である。例えば、コンピュータシステム550は、図3を参照して既に説明したサーバーコンピュータ若しくはクライエントコンピュータと接続して使用可能である。しかしながら、当業者にて明らかとなるであろう他のコンピュータシステム及び/又はアーキテクチャが使用可能である。
【0054】
コンピュータシステム550は、プロセッサ552のような、一若しくは複数のプロセッサを備えるのが好ましい。入力/出力を管理する補助のプロセッサや、浮動小数点演算用操作を実行する補助のプロセッサや、信号処理アルゴリズムの高速実行に適したアーキテクチャを有する特殊用途向けのマイクロプロセッサ(例えばデジタル信号プロセッサ)や、主処理システムに従属するスレーブプロセッサ(例えば後置型プロセッサ)や、二重のあるいは多数のプロセッサシステム用の付加的なマイクロプロセッサ若しくはコントローラや、又は、コプロセッサのような、付加的なプロセッサを設けることができる。そのような補助プロセッサは、ディスクリートプロセッサであったり、若しくはプロセッサ552とともに集積化されたものであってもよい。
【0055】
プロセッサ552は、通信バス554に接続されるのが好ましい。通信バス554は、コンピュータシステム550の格納部と他の周辺構成部分との間の情報伝達を容易にするためにデータチャンネルを含むことができる。さらに通信バス554は、データバス、アドレスバス、及びコントロールバス(不図示)を含むプロセッサ552との通信に使用される一対の信号を提供可能である。通信バス554は、例えば、業界標準アーキテクチャ(「ISA」)、拡張業界標準アーキテクチャ(「EISA」)、マイクロチャネルアーキテクチャ(「MCA」)、周辺機器相互接続(「PCI」)ローカルバス、又は、IEEE488一般的目的インタフェースバス(「GPIB」)、IEEE696/S−100等を含む電気電子技術者協会(「IEEE」)により普及された標準、に準拠したバスアーキテクチャのような、標準あるいは非標準のいずれのバスアーキテクチャを備えることができる。
【0056】
コンピュータシステム550は、主メモリ556を備えるのが好ましく、また、副メモリ558を備えることもできる。主メモリ556は、プロセッサ552で実行されるプログラム用の命令及びデータを格納する。主メモリ556は、一般的にダイナミックランダムアクセスメモリ(「DRAM」)及び/又はスタティックランダムアクセスメモリ(「SRAM」)のような半導体メモリである。例えば、リードオンリーメモリ(「ROM」)を含み、同期ダイナミックランダムアクセスメモリ(「SDRAM」)、ラムバスダイナミックランダムアクセスメモリ(「RDRAM」)、強誘電性ランダムアクセスメモリ(「FRAM」)、等の他の半導体メモリタイプも含くまれる。
【0057】
副メモリ558は、ハードディスクドライブ560、及び/又は、例えばフロッピー(登録商標)ディスクドライブ、磁気テープドライブ、コンパクトディスク(「CD」)ドライブ、デジタル多目的ディスク(「DVD」)ドライブ、等のリムーバブル記憶ドライブ562を随意備えることができる。リムーバブル記憶ドライブ562は、公知の方法にて、リムーバブル記憶媒体564から読み出し、及び/又はリムーバブル記憶媒体564への書き込みを行う。リムーバブル記憶媒体564は、例えばフロッピー(登録商標)ディスク、磁気テープ、CD、DVD、等であってもよい。
【0058】
リムーバブル記憶媒体564は、コンピュータが実行可能なコード(即ち、ソフトウエア)及び/又はデータを格納した、コンピュータ読み取り可能な媒体であるのが好ましい。リムーバブル記憶媒体564に格納されたコンピュータソフトウエア又はデータは、電気的通信信号578としてコンピュータシステム550に読み込まれる。
【0059】
別の実施形態において、副メモリ558は、コンピュータプログラム又は他のデータや命令をコンピュータシステム550にロードさせる他の類似の手段を含むことができる。そのような手段は、例えば、外部格納媒体572及びインタフェース570を含むことができる。外部格納媒体572の例は、外部ハードディスクドライブや外部光学式ドライブ、又は/及び外部光磁気ドライブを含むことができる。
【0060】
副メモリ558の他の例は、プログラム可能なリードオンリーメモリ(「PROM」)、消去プログラム可能なリードオンリーメモリ(「EPROM」)、又はフラッシュメモリ(EEPROMに類似するブロック指向のメモリ)のような、半導体メモリを含むことができる。又、ソフトウエア及びデータをリムーバブル記憶ユニット572からコンピュータシステム550へ伝送させる、他のリムーバブル記憶ユニット572及びインタフェース570が含まれる。
【0061】
コンピュータシステム550は、また、通信インタフェイス574を含むことができる。通信インタフェイス574は、ソフトウエア及びデータを、コンピュータシステム550と外部機器(例えばプリンタ)、ネットワーク、又は情報源との間で伝送可能とする。例えば、コンピュータソフトウエア又は実行可能なコードが、ネットワークサーバから通信インタフェース574を介してコンピュータシステム550へ伝送可能である。通信インタフェース574の例は、ほんの2,3例を挙げると、モデム、ネットワークインタフェースカード(「NIC」)、通信ポート、PCMCIAスロット及びカード、赤外線インタフェース、及びIEEE1394ファイヤワイヤを含む。
【0062】
通信インタフェース574は、イーサーネットIEEE802標準、ファイバーチャネル、デジタル加入者線(「DSL」)、非対称デジタル加入者線(「ADSL」)、フレームリレー、非同期転送モード(「ATM」)、総合デジタル通信網(「ISDN」)、個人通信サービス(「PCS」)、伝送制御プロトコル/インターネットプロトコル(「TCP/IP」)、シリアルラインインターネットプロトコル/ポイントツーポイントプロトコル(SLIP/PPP)、等の業界準拠プロトコル標準を実現するのが好ましい。一方、又、カスタマイズした、若しくは非標準のインタフェースプロトコルも実現可能である。
【0063】
通信インタフェース574を通じて伝達されるソフトウエア及びデータは、一般的に電気的通信信号578の形態である。それらの信号578は、通信チャネル576を介して通信インタフェース574へ供給されるのが好ましい。通信チャネル576は、信号578を搬送し、ほんの2,3例を挙げると、ワイヤー又はケーブル、光ファイバー、従来の電話線、携帯電話中継局、無線周波中継局、又は赤外線中継局を含むいろいろな通信手段を使用して実現可能である。
【0064】
コンピュータが実行可能なコード(即ち、コンピュータプログラム又はソフトウエア)は、主メモリ556及び/又は副メモリ558に格納される。また、コンピュータプログラムは、通信インタフェース574を介して受け取ることができ、主メモリ556及び/又は副メモリ558に格納可能である。そのようなコンピュータプログラムは、実行されるとき、コンピュータシステム550に、上述したような本発明の種々の機能を実行させる。
【0065】
この明細書において、「コンピュータ読み取り可能な媒体」の用語は、コンピュータが実行可能なコード(例えばソフトウエア及びコンピュータプログラム)をコンピュータシステム550へ供給するのに使用されるいずれの媒体をも示すように使用される。それらの媒体の例は、主メモリ556、副メモリ558(ハードディスクドライブ560、リムーバブル記憶媒体564、及び外部記憶媒体572を含む)、及び通信インタフェース574(ネットワーク情報サーバーあるいは他のネットワーク機器を含む)と通信可能に接続される周辺機器を含む。それらのコンピュータ読み取り可能な媒体は、実行可能なコード、プログラムする命令、及びソフトウエアをコンピュータシステム550へ供給する手段である。
【0066】
ソフトウエアを使用して実現される実施形態において、ソフトウエアは、コンピュータが読み取り可能な媒体に格納可能であり、リムーバブル記憶ドライブ562、インタフェース570、又は通信インタフェース574を通り、コンピュータシステム550へロード可能である。そのような実施形態において、ソフトウエアは、コンピュータシステム550へ電気的通信信号578の形態にてロードされる。ソフトウエアは、プロセッサ552により実行されるとき、上述した、発明の特徴及び機能をプロセッサ552に実行させるのが好ましい。
【0067】
種々の実施形態が、例えば特定用途向け集積回路(「ASICs」)、又はフィールドプログラマブルゲートアレイ(「FPGAs」)を使用して、主にハードウエアにおいて実現可能である。ここで述べた機能を実行可能なハードウエアステートマシンの実現は、当業者には明らかであろう。又、種々の実施形態もハードウエア及びソフトウエアの両方の組み合わせを使用して実現可能である。
【0068】
ここで詳細に示しかつ述べた特別なシステム及び方法は、本発明の上述の目的を十分達成可能であるが、ここに示した記述及び図面は、本発明の現在好ましい実施形態を表しており、本発明により広く思索される主題内容の代表例であると理解されるべきである。さらに、本発明の権利範囲は、当業者に明らかとなるであろう他の実施形態を十分に含んでおり、よって本発明は添付の請求範囲以外のものによって限定されるものではないことが理解される。
【図面の簡単な説明】
【0069】
本発明の構成及び動作の詳細は、添付の図面を参照することで明らかになる。これらの図において、同様の構成部分には同じ符号を付している。
【図1】図1は、本発明の一実施形態によるベクトル量子化を使用した、画像の符号化処理及び復号化処理の一例を示すブロック図である。
【図2】図2は、本発明の一実施形態による画像パターン認識用の一方法例を示すフロー図である。
【図3】図3は、本発明の一実施形態によるクライアント/サーバーの実行の一例を示すブロック図である。
【図4】図4は、本発明の一実施形態によるネストされたカーネルロジックの一例を示すブロック図である。
【図5】図5は、本発明の一実施形態による可変サイズの核を生成するプロセスの一例を示すフロー図である。
【図6】図6は、本発明の一実施形態による研究に使用されるスライドガラスの代表例を要約したテーブル図である。
【図7】図7は、本発明の一実施形態による研究からの複数のスライドガラスによる結果を要約したテーブル図である。
【図8】図8は、本発明の一実施形態による調査にてスライドガラスが処理されるときのボキャブラリーサイズの変化例を示すグラフである。
【図9】図9は、本発明の一実施形態による調査にてスライドガラスが処理されるときのインデックスサイズの変化例を示すグラフである。
【図10】図10は、ここに記載される種々の実施形態に関連して使用可能なコンピュータシステムの一例を示すブロック図である。

【特許請求の範囲】
【請求項1】
画像を一又は複数の画像カーネルに分割し、ここで各カーネルは複数の画素を有し、
カーネルにおける各画素の強度を測定し、
上記カーネル内の各画素について測定強度を有するベクトルを生成し、
複数のベクトルを備えたボキャブラリーに上記ベクトルを格納し、
上記ベクトルについてインデックスを生成し、
上記ボキャブラリー内の上記複数のベクトルに対応する複数のインデックスを備えたベクトルインデックスファイルに上記インデックスを付加する、
ことを備えた、コンピュータにより実行されるデジタル画像の符号化方法。
【請求項2】
既に格納されているベクトルが新しく生成されたベクトルに一致するか否かを決定するため、上記新たに生成されたベクトルと上記ボキャブラリー内の上記複数のベクトルとを比較することをさらに備えた、請求項1記載の符号化方法。
【請求項3】
RGBカラー空間からYCカラー空間へ上記画像を伝送することをさらに備えた、請求項2記載の符号化方法。
【請求項4】
上記比較の工程は、上記強度の範囲の実質上中央に近いYチャンネル値の画素マッチングに関して厳しい公差を使用することを備える、請求項3記載の符号化方法。
【請求項5】
上記ベクトルを生成する工程は、上記画素の測定強度と、上記画素に近い3つの画素の平均Cチャンネル強度測定との間の差にて、Cチャンネルの前部の各画素における強度測定を置き換えることを備える、請求項3記載の符号化方法。
【請求項6】
上記比較により、上記新たに生成されたベクトルと上記ボキャブラリー内に以前に格納されていたベクトルとの間で一致が確認されたときには、以前に格納されたベクトルを使用することをさらに備える、請求項2記載の符号化方法。
【請求項7】
請求項2記載の符号化方法。
【請求項8】
上記比較により、上記新たに生成されたベクトルと上記ボキャブラリー内に以前に格納されていたベクトルとの間で一致が確認されないときには、上記新たに生成されたベクトルを上記ボキャブラリーに追加する。
【請求項9】
上記インデックスを付加する工程は、上記ボキャブラリー内の上記複数のベクトルをベクトルツリーデータ構造に加えることをさらに備える、請求項2記載の符号化方法。
【請求項10】
上記比較の工程は、上記新たに生成されたベクトルと上記ベクトルツリーデータ構造とを比較することをさらに備える、請求項8記載の符号化方法。
【請求項11】
上記ベクトルツリーデータ構造の各リーフノードは、上記ベクトルにおける次の寸法に関する別のベクトルツリーのルーツを備える、請求項8記載の符号化方法。
【請求項12】
ラインスキャンカメラにより画像を得ることをさらに備える、請求項1記載の符号化方法。
【請求項13】
上記画像は、顕微鏡スライドガラスの少なくとも一部を有する、請求項1記載の符号化方法。
【請求項14】
カーネルは、上記画像の方形状の領域を備える、請求項1記載の符号化方法。
【請求項15】
ベクトルは、スカラーの1次元のアレイであり、各スカラーは、上記カーネル内の画素の色チャンネル強度を表す、請求項1記載の符号化方法。
【請求項16】
上記インデックスを付加する工程は、一意の4バイトの整数をベクトルに付与することをさらに備える、請求項1記載の符号化方法。
【請求項17】
上記分割、上記測定、上記ベクトル生成、及び上記格納の工程は、通信ネットワークを介してサーバーマシンに伝達用に接続されるクライエントマシンにて実行される、請求項2記載の符号化方法。
【請求項18】
上記インデックス生成、上記付加、及び上記比較の工程は、上記サーバーマシンにて実行される、請求項16記載の符号化方法。
【請求項19】
複数の画像特徴部ベクトルを備えたベクトルセットを生成し、ここで、上記ベクトルセットは画像特徴部に対応し、
画像の候補領域を特定し、ここで上記候補領域は複数の候補領域ベクトルを備え、
上記ベクトルセットにおける各画像特徴部により上記複数の候補領域ベクトルにおける各ベクトルに関する相関関係を決定し、
上記候補領域が上記画像特徴部を示す確率を決定するため上記相関関係を平均化する、
ことを備えた、コンピュータにて実行されるデジタル画像におけるパターンの認識方法。
【請求項20】
上記決定する工程は、上記候補領域にてベクトルが観察される回数を全体にてベクトルが観察される回数で割ることをさらに備える、請求項18記載のパターン認識方法。
【請求項21】
画像を複数のカーネルに分割するように構成された、ここで各カーネルは複数の画素を有する、画像区分部と、
各画素の強度値を測定するように構成された強度測定部と、
上記複数のカーネルのそれぞれに関してベクトルを生成するように構成された、ここでベクトルはカーネルにおける各画素の強度値を有する、スカラーコンパイラーと、
上記複数のカーネルに対応した複数のベクトルを格納するように構成されたボキャブラリーと、
上記複数のベクトルにおける各ベクトルに関してインデックスを生成するように構成されたインデックス付加部と、
上記複数のインデックスを格納するように構成された、ここで上記複数のインデックスは複数のベクトルに対応する、ベクトルインデックスファイルと、
を備えた、デジタル画像の符号化システム。
【請求項22】
新たに生成されたベクトルと、上記ボキャブラリー内の上記複数のベクトルとを比較するように構成されたベクトル比較モジュールをさらに備えた、請求項20記載の符号化システム。
【請求項23】
上記ベクトルインデックスファイル内のインデックス及び上記ボキャブラリー内の対応のベクトルから上記画像を再構成するように構成された画像デコーダーをさらに備えた、請求項21記載の符号化システム。
【請求項24】
上記デジタル画像を取り込むための顕微鏡スライドガラススキャナーをさらに備えた、請求項21記載の符号化システム。
【請求項25】
上記顕微鏡スライドガラススキャナーは、上記デジタル画像を取り込むラインスキャンセンサを備える、請求項23記載の符号化システム。
【請求項26】
画像を複数のカーネルに分割する手段と、
上記複数のカーネルのそれぞれに関してベクトルを生成する手段と、
複数のベクトルをボキャブラリー内に格納する、ここで上記複数のベクトルは上記複数のカーネルに対応する、手段と、
上記複数のベクトルにおける各ベクトルに関してインデックスを生成する手段と、
複数のインデックスをベクトルインデックスファイルに格納する、ここで上記複数のインデックスは複数のベクトルに対応する、手段と、
を備えた、デジタル画像の符号化システム。
【特許請求の範囲】
【請求項1】
画像を一又は複数の画像カーネルに分割し、ここで各カーネルは複数の画素を有し、
カーネルにおける各画素の強度を測定し、
上記カーネル内の各画素について測定強度を有するベクトルを生成し、
複数のベクトルを備えたボキャブラリーに上記ベクトルを格納し、
上記ベクトルについてインデックスを生成し、
上記ボキャブラリー内の上記複数のベクトルに対応する複数のインデックスを備えたベクトルインデックスファイルに上記インデックスを付加する、
ことを備えた、コンピュータにより実行されるデジタル画像の符号化方法。
【請求項2】
既に格納されているベクトルが新しく生成されたベクトルに一致するか否かを決定するため、上記新たに生成されたベクトルと上記ボキャブラリー内の上記複数のベクトルとを比較することをさらに備えた、請求項1記載の符号化方法。
【請求項3】
RGBカラー空間からYCカラー空間へ上記画像を伝送することをさらに備えた、請求項2記載の符号化方法。
【請求項4】
上記比較の工程は、上記強度の範囲の実質上中央に近いYチャンネル値の画素マッチングに関して厳しい公差を使用することを備える、請求項3記載の符号化方法。
【請求項5】
上記ベクトルを生成する工程は、上記画素の測定強度と、上記画素に近い3つの画素の平均Cチャンネル強度測定との間の差にて、Cチャンネルの前部の各画素における強度測定を置き換えることを備える、請求項3記載の符号化方法。
【請求項6】
上記比較により、上記新たに生成されたベクトルと上記ボキャブラリー内に以前に格納されていたベクトルとの間で一致が確認されたときには、以前に格納されたベクトルを使用することをさらに備える、請求項2記載の符号化方法。
【請求項7】
上記比較により、上記新たに生成されたベクトルと上記ボキャブラリー内に以前に格納されていたベクトルとの間で一致が確認されないときには、上記新たに生成されたベクトルを上記ボキャブラリーに追加することを備えた、請求項2記載の符号化方法。
【請求項8】
上記インデックスを付加する工程は、上記ボキャブラリー内の上記複数のベクトルをベクトルツリーデータ構造に加えることをさらに備える、請求項2記載の符号化方法。
【請求項9】
上記比較の工程は、上記新たに生成されたベクトルと上記ベクトルツリーデータ構造とを比較することをさらに備える、請求項8記載の符号化方法。
【請求項10】
上記ベクトルツリーデータ構造の各リーフノードは、上記ベクトルにおける次の寸法に関する別のベクトルツリーのルーツを備える、請求項8記載の符号化方法。
【請求項11】
ラインスキャンカメラにより画像を得ることをさらに備える、請求項1記載の符号化方法。
【請求項12】
上記画像は、顕微鏡スライドガラスの少なくとも一部を有する、請求項1記載の符号化方法。
【請求項13】
カーネルは、上記画像の方形状の領域を備える、請求項1記載の符号化方法。
【請求項14】
ベクトルは、スカラーの1次元のアレイであり、各スカラーは、上記カーネル内の画素の色チャンネル強度を表す、請求項1記載の符号化方法。
【請求項15】
上記インデックスを付加する工程は、一意の4バイトの整数をベクトルに付与することをさらに備える、請求項1記載の符号化方法。
【請求項16】
上記分割、上記測定、上記ベクトル生成、及び上記格納の工程は、通信ネットワークを介してサーバーマシンに伝達用に接続されるクライエントマシンにて実行される、請求項2記載の符号化方法。
【請求項17】
上記インデックス生成、上記付加、及び上記比較の工程は、上記サーバーマシンにて実行される、請求項16記載の符号化方法。
【請求項18】
複数の画像特徴部ベクトルを備えたベクトルセットを生成し、ここで、上記ベクトルセットは画像特徴部に対応し、
画像の候補領域を特定し、ここで上記候補領域は複数の候補領域ベクトルを備え、
上記ベクトルセットにおける各画像特徴部により上記複数の候補領域ベクトルにおける各ベクトルに関する相関関係を決定し、
上記候補領域が上記画像特徴部を示す確率を決定するため上記相関関係を平均化する、
ことを備えた、コンピュータにて実行されるデジタル画像におけるパターンの認識方法。
【請求項19】
上記決定する工程は、上記候補領域にてベクトルが観察される回数を全体にてベクトルが観察される回数で割ることをさらに備える、請求項18記載のパターン認識方法。
【請求項20】
画像を複数のカーネルに分割するように構成された、ここで各カーネルは複数の画素を有する、画像区分部と、
各画素の強度値を測定するように構成された強度測定部と、
上記複数のカーネルのそれぞれに関してベクトルを生成するように構成された、ここでベクトルはカーネルにおける各画素の強度値を有する、スカラーコンパイラーと、
上記複数のカーネルに対応した複数のベクトルを格納するように構成されたボキャブラリーと、
上記複数のベクトルにおける各ベクトルに関してインデックスを生成するように構成されたインデックス付加部と、
上記複数のインデックスを格納するように構成された、ここで上記複数のインデックスは複数のベクトルに対応する、ベクトルインデックスファイルと、
を備えた、デジタル画像の符号化システム。
【請求項21】
新たに生成されたベクトルと、上記ボキャブラリー内の上記複数のベクトルとを比較するように構成されたベクトル比較モジュールをさらに備えた、請求項20記載の符号化システム。
【請求項22】
上記ベクトルインデックスファイル内のインデックス及び上記ボキャブラリー内の対応のベクトルから上記画像を再構成するように構成された画像デコーダーをさらに備えた、請求項21記載の符号化システム。
【請求項23】
上記デジタル画像を取り込むための顕微鏡スライドガラススキャナーをさらに備えた、請求項21記載の符号化システム。
【請求項24】
上記顕微鏡スライドガラススキャナーは、上記デジタル画像を取り込むラインスキャンセンサを備える、請求項23記載の符号化システム。
【請求項25】
画像を複数のカーネルに分割する手段と、
上記複数のカーネルのそれぞれに関してベクトルを生成する手段と、
複数のベクトルをボキャブラリー内に格納する、ここで上記複数のベクトルは上記複数のカーネルに対応する、手段と、
上記複数のベクトルにおける各ベクトルに関してインデックスを生成する手段と、
複数のインデックスをベクトルインデックスファイルに格納する、ここで上記複数のインデックスは複数のベクトルに対応する、手段と、
を備えた、デジタル画像の符号化システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公表番号】特表2006−520972(P2006−520972A)
【公表日】平成18年9月14日(2006.9.14)
【国際特許分類】
【出願番号】特願2006−508735(P2006−508735)
【出願日】平成16年2月13日(2004.2.13)
【国際出願番号】PCT/US2004/004314
【国際公開番号】WO2004/079636
【国際公開日】平成16年9月16日(2004.9.16)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
FRAM
【出願人】(505407519)ピクトン・リミテッド・ライアビリティ・カンパニー (1)
【氏名又は名称原語表記】Picton LLC
【Fターム(参考)】