説明

分類プロセスへの空間的知見の組込み

発明者は対象の空間的位置に基づく複数の異なる分類子を使用することを提案する。このアプローチの背景には、複数の分類子の方が特徴空間全体をカバーする“ユニバーサル”分類子よりも正確に局所コンセプトを学習できるのではないか、という直感的なアイデアがある。局所分類子を採用すれば、特定の類に属する複数の対象がこの特定類中において互いに高度の類似性を有することになる。局所分類子の採用は、特に分類子がカーネル方式である場合、メモリー、ストレージ及び性能全般の向上にもつながる。ここで使用する語“カーネル方式分類子”とは元の訓練データを、分類タスクを容易にする、より高い次元の空間にマップするためにマッピング機能(即ち、カーネル)が使用されている分類子を意味する。

【発明の詳細な説明】
【関連出願との相互参照】
【0001】
本願は、全部を本願の一部として引用する、2003年8月13日付米国仮出願第60/494,646号に基づく優先権を主張する。
【背景技術】
【0002】
【技術分野】
【0003】
本発明は機械分類の分野に係わり、特に、分類プロセスへの空間的知見の組込みに係わる。
【公知技術の説明】
【0004】
対象を2つ以上の類に分類(即ち、分離)するのに分類子が使用される。分類子の例を以下に述べる。ここではA+とA−と呼ぶことにする2つの対称群(即ち、類)から成る1組の対象Aがここにあると想定する。ここで使用する語“対象”は母集団中の1つまたは2つ以上のエレメントを指す。分類子Aは、A中のすべてのエレメントを取り出し、エレメントがどの群に属するかに応じて標識“+”または“−”をリターンする機能Fである。即ち、分類子は、FUNCTION F(A)→{−1、1}で表すことができる。但し、−1はA−を表す数値であり、+1はA+を表す数値である。分類子A+及びA−は2つの別々の母集団を表すことができる。例えば、A+は肺中の構造(例えば、脈管、気管支)を表し、A−は小結節を表すことができる。機能Fが訓練データ(即ち、既知分類を有するデータ)から訓練され、機能Fを利用することによって新しい及び未観測データを予見することができる。例えば、医師から得られた10,000個の既知対象で分類子を訓練することができる。この既知対象は一般に“グラウンド・トゥルース(ground truth)”と呼称される。グラウンド・トゥルースからの訓練に基づき、分類子を利用することによって、新しい且つ未観測の病状を自動診断することができる。
【0005】
従来の分類子は同じ類に属する対象は同じような特徴値を有する、即ち、特徴空間中の同じ分布に属するとの想定に基づいて対象を類に分類する。しかし、同じ類に属する対象がその空間的位置に応じて異なる特徴値を有する場合が多い。ここで使用する語“特徴”は特定の類に属する対象を表す1つまたは2つ以上の属性を指す。例えば、小結節はサイズ、直径、真球度などのような多数の属性を含むベクトルで表すことができる。ベクトルはここで“特徴値”と呼称する属性値を含むことがある。
【0006】
上記問題に対する既存の解決策は高い自由度を有する比較的複雑な分類子を使用するというものである。複雑な分類子を作成する1つの方法として、カーネル・マッピングを使用してデータをより高次元の特徴空間中にマッピングする方法である。即ち、機能K(即ち、カーネル)はオリジナル・データを取出してより高次元の特徴空間(即ち、より多くの特徴を有する特徴空間)にマッピングし、分類機能を見出すタスクの達成を容易にする。
【0007】
例えば、オリジナル・データが幾つかの特徴を分析する単一の症例であるとする。もしオリジナル・データが10個の特徴を有するとすれば、オリジナル・データに対応するベクトルは10次元の特徴空間である。また、他の1,000件の症例に対応する同様のデータがあれば、オリジナル・データと他の1,000件の症例のそれぞれとの相似度を示す値となる相似関数を算出することができる。即ち、10次元の特徴空間から1,000次元の特徴空間が得られる。
【0008】
ここで使用する語“自由度”とは統計値の最終計算における可変値の数を意味する。より複雑な分類子を形成する他の方法は、それぞれが異なる特徴群を利用して訓練され多数の単純な分類子を直列または並列に組み合わせる方法である。組み合わせた結果をまとめて分類子の集合体を形成する。
【0009】
以上に述べたアプローチ及びこれと同様のアプローチには、同じ汎化性能を得るのに必要な高い自由度を満たす代わりに訓練用の症例を増やさねばならないという欠点がある。ここで使用する語“汎化性能”とは新規及び未観察データに対する分類子の性能を意味する。多くの理由から、汎化性能が低下する可能性がある。例えば、回帰分析の場合と同様に、分類のための学習(即ち、訓練)プロセスにおいて、訓練データをオーバーフィットする恐れがあり、その結果、新規及び未観察症例に対する予測性能が低くなる。
【発明の概要】
【0010】
第1実施態様として、本発明は画像中のキャンディデイトを分類する方法を提供する。この方法は、第1キャンディデイトの空間的位置に特異な訓練データを利用して訓練される第1分類子を使用して画像の第1キャンディデイトを分類し;第2キャンディデイトの空間的位置に特異な訓練データを利用して訓練される第2分類子を使用して画像の第2キャンディデイトを分類するステップを含み、第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置とが互いに排他的である。
ことを特徴とする前記方法。
【0011】
第2実施態様として、本発明は画像上の小結節を自動検出する方法を提供する。この方法は画像を得;画像上の互いに排他的な第1空間的位置及び第2空間的位置を識別し;第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;第1空間的位置に特異な訓練データを使用して訓練される第1分類子を利用して第1キャンディデイトが小結節であるかどうかを分類し;第2空間的位置に特異な訓練データを使用して訓練される第2分類子を利用して第2キャンディデイトが小結節であるかどうかを分類するステップを含み;第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置とが互いに排他的である。
【0012】
第3実施態様として、本発明は画像中のキャンディデイトを分類する方法をプロセッサーに実行させるための命令を記憶させた機械可読媒体を提供する。この方法は第1キャンディデイトの空間的位置に特異な訓練データを使用して訓練される第1分類子を利用して画像の第1キャンディデイトを分類し;第2キャンディデイトの空間的位置に特異な訓練データを使用して訓練される第2分類子を利用して画像の第2キャンディデイトを分類するステップを含み;第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置が互いに排他的である。
【0013】
第4実施態様として、本発明は画像上小結節を自動検出する方法をプロセッサーに実行させるための命令を記憶させた機械可読媒体を提供する。この方法は画像を得;画像上の互いに排他的な第1空間的位置及び第2空間的位置を識別し;第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;第1空間的位置に特異な訓練データを使用して訓練される第1分類子を利用して第1キャンディデイトが小結節であるかどうかを分類し;第2空間的位置に特異な訓練データを使用して訓練される第2分類子を利用して第2キャンディデイトが小結節であるかどうかを分類するステップを含み;第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置とが互いに排他的である。
ことを特徴とする前記機械可読媒体。
【実施例】
【0014】
本発明の図示実施例を以下に説明する。煩雑になることを避けるため、本明細書では実施可能な態様のすべての細部までは説明することはしない。当然のことながら、具体的な実施態様の開発に際して、それぞれの開発者に固有の目的を達成するには、例えば、システムに関連する条件及び業務に関連する条件と整合させるなど、種々の判断を下さねばならず、これらの条件は実施態様毎に異なる。また、このような開発努力は複雑であり、多大の時間を要するが、本発明の開示内容を活用する当業者にとっては当然のことである。
【0015】
本発明には多様な変更や形態選択が考えられるが、ここでは特定の実施態様を図示し、その詳細を説明する。但し、本発明は以下に述べるこれら特定の実施例によって制限されるものではなく、添付の請求項が規定する本発明の思想及び範囲を逸脱しない変更態様、等価態様及び代替形態のすべてを包含する。
【0016】
ここに述べるシステム及び方法は種々の形態のハードウエア、ソフトウエア、ファームウエア、特殊目的のプロセッサー、またはこれらの複合体において実施することができる。具体的には、本発明の少なくとも一部は、1つまたは2つ以上のプログラム記憶装置(例えば、ハード・ディスク、磁気フロッピーディスク、RAM、ROM、CDROM、など)で具体化され、適当な構造を有する装置またはマシーン、例えば、プロセッサー、メモリー、及び入/出力インターフェースを有する汎用ディジタルコンピューターによって実行可能なプログラム命令から成るアプリケーションとして実施することが好ましい。また、添付の図面に示すシステム構成成分及び方法ステップの幾つかはソフトウエアにおいて実施することが好ましいから、システム・モジュール間の(または方法ステップの論理流れの)接続は本発明をプログラムする態様に応じて異なることがある。当業者ならば、ここに開示する内容に基づいて、本発明の図示実施態様及び同様の実施態様を案出することができるであろう。
【0017】
発明者は単一の複合分類子を使用するのではなく、対象の空間的位置に基づく複数の異なる分類子を使用することを提案する。このアプローチの背景には、複数の分類子の方が特徴空間全体をカバーする“ユニバーサル”分類子よりも正確に局所コンセプトを学習できるのではないか、という直感的なアイデアがある。局所分類子を採用すれば、特定の類に属する複数の対象がこの特定類中において互いに高度の類似性を有することになる。局所分類子の採用は、特に分類子がカーネル方式である場合、メモリー、ストレージ及び性能全般の向上にもつながる。ここで使用する語“カーネル方式分類子”とは元の訓練データを、分類タスクを容易にする、より高い次元の空間にマップするためにマッピング機能(即ち、カーネル)が使用されている分類子を意味する。
【0018】
図1は本発明の一実施例として、対象の空間的位置に基づいてこの対象を分類する方法100を示す。この方法100が画像を得るステップ(105)は人体の物理的な走査、例えば、コンピューター断層撮像(“CT”)、磁気共鳴撮像(“MRI”)または超音波撮像によって行うことができる。さらに他の実施態様として、衛星画像システムから得ることもできる。尚、画像を得るためには、当業者が考え得る多様な方法、装置のうちから選択された任意の方法、装置を利用することができる。
【0019】
方法100は画像上のエレメントの空間的位置を識別する(110)。例えば、肺の画像において問題となりそうな分類子としては、肺壁に密着しているエレメントを表わす壁密着分類子、気管支に密着しているエレメントを表わす気管支密着分類子、及び肺内部のエレメントを表す肺内部分類子などがある。例えば、心臓のような人体画像を利用することもできる。他の例として、衛星画像を陸塊のタイプ(例えば、山岳、砂漠、降雨林)に分類することも可能である。空間的位置は、例えば、グラフィカル・ユーザー・インターフェースを介して識別することができる。空間的位置はまた、例えば、画像上の種々の位置に関する予備知識を利用して自動的に識別することも可能である。他にも、空間的位置の識別に利用できる種々の自動的な方法(例えば、パターン・マッチング)があることは当業者のよく知るところである。
【0020】
分類子は空間的位置をそれぞれに対応して作成される(115)。例として上述した肺走査の場合には、肺壁に密着しているエレメントを表わす壁密着分類子、気管支に密着しているエレメントを表わす気管支密着分類子、及び肺内部のエレメントを表す肺内部分類子などが問題となりそうな分類子である。分類子は既知データを利用して訓練することができる。上記の肺走査を例に取ると、特定の空間的位置に関して規定されたエレメントの訓練データを利用することによって分類子を訓練することができる。訓練データは既知及び検証済みデータから構成することができる。例えば、小結節の有無を判定する医師による検証例を訓練データとして使用することができる。種々の症状を訓練用のそれぞれ異なる分類子に対応する空間位置に分離させればよい。即ち、壁密着分類子は肺壁に密着するエレメントの訓練データのみを使用して訓練されることになる。この方法の利点は、分類子が特定位置におけるエレメントの(既知及び未知の)新規性を活用できることにある。例えば、気管支におけるエレメントの分類と肺内部のエレメントの分類とを別々の分類子で行うことができる。
【0021】
方法100はキャンディデイトを識別する(120)。ここで使用する語“キャンディデイト(candidates)”とは画像中の問題のエレメント(即ち、構造)を指す。分類子はそれぞれの空間的位置に固有であるから、キャンディデイトの分類は空間的位置を考慮しない場合よりも精度が高くなる。また、このような“局所分類子”を採用することで、複合的なユニバーサル分類子を使用する場合よりもメモリー、ストレージ及び性能の向上に結びつく。キャンディデイトは当業者に公知の多様な方法及び装置を任意に選択して手動的または自動的に識別することができる。例えば、疑わしい問題部位のコンピューター援用自動識別は癌検診の分野において広く知られている。
【0022】
方法100はキャンディデイトが存在する空間的位置と関連する該当の分類子を利用してキャンディデイトを標識の形で分類する(125)。上述した肺走査を例に取ると、もしキャンディデイトが肺内部に位置するなら、キャンディデイトは肺内部分類子を使用して分類される。キャンディデイトは、画像中の構造(即ち、エレメント)が小結節であることを表す“小結節”と標識されるか、または構造が小結節でないことを表す“非-小結節”と標識されることになる。標識としては、当業者に公知の多様な標識のうちのいずれかを使用すればよい。キャンディデイトを複数の標識で分類することもできる。
【0023】
識別を容易にするため、具体的な標識を画像上に物理的にマークすることができる。例えば、上述した肺走査を例に取ると、小結節として識別されたキャンディデイトをマークすれば、観察者(例えば、医師)が病状を容易に識別できる。当業者には公知のように、タイプ及び形状の異なる標識を使用することで、複数の分類子を区別できる。マーキングは、例えば、識別されたそれぞれの小結節を囲む正方形または円であってもよい。
【0024】
図2A及び2Bは本発明の一実施態様として、分類後にマークされる肺CTスキャンを示す。正方形マーキングは壁密着小結節、円形マーキングは肺内部小結節を示す。
【0025】
以上に開示したのは飽くまでも説明のための特定実施態様であり、開示内容を利用する当業者には明らかなように、変更を加え、上記実施態様とは異なるが等価の態様で実施することができる。また、以上に述べた構成またはデザインのうちの、添付の請求項に記載されている以外の細部については如何なる制限も課せられない。即ち、以上に述べた特定の実施態様に変更を加えてもよいことはいうまでもなく、これらの変更実施態様はすべて本発明の範囲と思想に包含される、従って、本発明が請求する保護の範囲は添付の請求項によってのみ規定される。
【0026】
類似のエレメントにそれぞれ類似の参照符号を付した添付図面を参照して、本発明を以下に説明する。
【図面の簡単な説明】
【0027】
【図1】本発明の一実施例として、対象の空間的位置に基づいて該対象を分類する方法のフローダイヤグラムである。
【図2A】本発明の一実施例として、小結節分類後の肺CTスキャン例の写真である。
【図2B】本発明の一実施例として、小結節分類後の肺CTスキャン例の写真である。

【特許請求の範囲】
【請求項1】
画像中のキャンディデイトを分類する方法において、
第1キャンディデイトの空間的位置に特異な訓練データを利用して訓練される第1分類子を使用して画像の第1キャンディデイトを分類し;
第2キャンディデイトの空間的位置に特異な訓練データを利用して訓練される第2分類子を使用して画像の第2キャンディデイトを分類する
ステップを含み、
第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置とが互いに排他的であることを特徴とする前記方法。
【請求項2】
画像を得るステップをも含むことを特徴とする請求項1に記載の方法。
【請求項3】
画像を得るステップが人体の少なくとも一部のCT、MRIまたは超音波画像のうちの少なくとも1つを得るステップであることを特徴とする請求項2に記載の方法。
【請求項4】
画像を得るステップが衛星画像を得るステップであることを特徴とする請求項2に記載の方法。
【請求項5】
画像上の空間的位置を識別するステップをも含むことを特徴とする請求項1に記載の方法。
【請求項6】
画像上の空間的位置を識別するステップがグラフィカル・ユーザー・インターフェースを設けることによって画像上の空間的位置を手動識別するステップであることを特徴とする請求項5に記載の方法。
【請求項7】
画像上の空間的位置を識別するステップが画像上の空間的位置を自動識別するステップであることを特徴とする請求項5に記載の方法。
【請求項8】
画像上の空間的位置を自動識別するステップが空間的位置の既知情報を利用して画像上の空間的位置を自動識別するステップであることを特徴とする請求項7に記載の方法。
【請求項9】
画像上の空間的位置を自動識別するステップがパターン・マッチングを利用して画像上の空間的位置を自動識別するステップであることを特徴とする請求項7に記載の方法。
【請求項10】
人体の少なくとも一部の画像上の空間的位置を識別することを特徴とする請求項5に記載の方法。
【請求項11】
人体の少なくとも一部の画像上の空間的位置を識別するステップが肺の画像上の空間的位置を識別するステップであることを特徴とする請求項10に記載の方法。
【請求項12】
肺の画像上の空間的位置が壁密着領域、肺内部領域及び気管支領域を含むことを特徴とする請求項11に記載の方法。
【請求項13】
人体の少なくとも一部の画像上の空間的位置を識別するステップが心臓の画像上の空間的位置を識別するステップであることを特徴とする請求項10に記載の方法。
【請求項14】
画像上の第1キャンディデイト及び第2キャンディデイトを識別するステップであることを特徴とする請求項1に記載の方法。
【請求項15】
画像上の第1キャンディデイト及び第2キャンディデイトを識別するステップがグラフィカル・ユーザー・インターフェースを設けることによって画像上の第1キャンディデイト及び第2キャンディデイトを手動識別するステップであることを特徴とする請求項14に記載の方法。
【請求項16】
画像上の第1キャンディデイト及び第2キャンディデイトを識別するステップが画像上の第1キャンディデイト及び第2キャンディデイトを自動識別するステップであることを特徴とする請求項14に記載の方法。
【請求項17】
画像上の第1キャンディデイト及び第2キャンディデイトを自動識別するステップがパターン・マッチングを利用して画像上の第1キャンディデイト及び第2キャンディデイトを自動識別するステップであることを特徴とする請求項16に記載の方法。
【請求項18】
第1キャンディデイトを分類するステップが第1キャンディデイトが小結節であるかどうかを自動分類するステップであり、第2キャンディデイトを分類するステップが第2キャンディデイトが小結節であるかどうかを自動分類するステップであることを特徴とする請求項1に記載の方法。
【請求項19】
訓練データが医師によって検証されたデータであることを特徴とする請求項1に記載の方法。
【請求項20】
画像上の小結節を自動検出する方法において、
画像を得;
画像上の互いに排他的な第1空間的位置及び第2空間的位置を識別し;
第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;
第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;
第1空間的位置に特異な訓練データを使用して訓練される第1分類子を利用して第1キャンディデイトが小結節であるかどうかを分類し;
第2空間的位置に特異な訓練データを使用して訓練される第2分類子を利用して第2キャンディデイトが小結節であるかどうかを分類するステップを含み;
第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置とが互いに排他的であることを特徴とする前記方法。
【請求項21】
第1キャンディデイトが小結節なら第1キャンディデイトをマークし;
第2キャンディデイトが小結節なら第2キャンディデイトをマークする
ステップをも含むことを特徴とする請求項20に記載の方法。
【請求項22】
画像中のキャンディデイトを分類する方法をプロセッサーに実行させるための命令を記憶させた機械可読媒体において、前記方法が
第1キャンディデイトの空間的位置に特異な訓練データを使用して訓練される第1分類子を利用して画像の第1キャンディデイトを分類し;
第2キャンディデイトの空間的位置に特異な訓練データを使用して訓練される第2分類子を利用して画像の第2キャンディデイトを分類する
ステップを含み;
第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置が互いに排他的であることを特徴とする前記機械可読媒体。
【請求項23】
画像上小結節を自動検出する方法をプロセッサーに実行させるための命令を記憶させた機械可読媒体において、前記方法が
画像を得;
画像上の互いに排他的な第1空間的位置及び第2空間的位置を識別し;
第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;
第1空間的位置における第1キャンディデイト及び第2空間的位置における第2キャンディデイトを識別し;
第1空間的位置に特異な訓練データを使用して訓練される第1分類子を利用して第1キャンディデイトが小結節であるかどうかを分類し;
第2空間的位置に特異な訓練データを使用して訓練される第2分類子を利用して第2キャンディデイトが小結節であるかどうかを分類する
ステップを含み;
第1キャンディデイトの空間的位置と第2キャンディデイトの空間的位置とが互いに排他的であることを特徴とする前記機械可読媒体。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate


【公表番号】特表2007−502173(P2007−502173A)
【公表日】平成19年2月8日(2007.2.8)
【国際特許分類】
【出願番号】特願2006−523424(P2006−523424)
【出願日】平成16年8月13日(2004.8.13)
【国際出願番号】PCT/US2004/026425
【国際公開番号】WO2005/017815
【国際公開日】平成17年2月24日(2005.2.24)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(593063105)シーメンス メディカル ソリューションズ ユーエスエー インコーポレイテッド (156)
【氏名又は名称原語表記】Siemens Medical Solutions USA,Inc.
【住所又は居所原語表記】51 Valley Stream Parkway,Malvern,PA 19355−1406,U.S.A.
【Fターム(参考)】