説明

データセット間の相関

本発明は、正確な相関を、第1ソース(A1)から収集される第1データセット(1)と第2ソース(A2)から収集される第2データセット(2)との間で、第1及び第2データセット(1,2)のうちの一方に、または両方にノイズが含まれる状態で行なう方法に関する。本発明は、特に、第3データセット(3)を第1ソース(A1)から、第1データセット(1)の収集条件と同じ条件で収集することを教示し、第4データセット(4)を第2ソース(A2)から、第2データセットの収集条件と同じ条件で収集することを教示する。第1ソース(A1)から収集されるデータと第2ソース(A2)から収集されるデータとの測定相関値(rm)を、第1及び第2データセットの可能な組み合わせ(r12)、第1及び第4データセットの可能な組み合わせ(r14)、第3及び第2データセットの可能な組み合わせ(r32)、及び第3及び第4データセットの可能な組み合わせ(r34)からの複数の相関測定値のうちの一つの相関測定値として得る。補正値(C12)を第1データセットと第3データセットとの相関測定値(r13)、及び第2データセットと第4データセットとの相関測定値(r24)に基づき数式(数式(I))に従って計算する。この補正値(C12)を測定相関値(rm)に適用して、数式rc=rm×C12に従う補正済み相関値(rc)が生成される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、正確な相関を、第1ソースから収集される第1データセットと、第2ソースから収集される第2データセットとの間で、第1及び第2データセットのうちの一方に、または両方にノイズが含まれる状態で行なう方法に関する。本発明はまた、利用することによって本発明による方法を実現することができるようなコンピュータプログラム製品、及びコンピュータ読み取り可能な媒体に関する。
【背景技術】
【0002】
ノイズが含まれる場合、2つのデータセット間の測定相関が正しくなく、不正確度がノイズの大きさに関連付けられることが知られている。顕微鏡による画像収集のようなデータ収集におけるノイズの大きさを低減するために、取得時間を長くする、隣接ピクセルを区分する、または複製画像の和を求めることが知られている。一つの画像に含まれるピクセル群が区分されて一つの新規画像を形成するが、1から4までの区分が使用される場合、最終画像には、元のピクセル群のうち25%のピクセルしか含まれない。
【0003】
図1は、平均の画像の数が増えるにつれて、測定される相関値rが大きくなり、既知の値1.00に近づく様子を示す図を示している。しかしながら、既知の値への接近は漸近的であり、相関を正確に、かつ高精度に測定するために十分高い信頼性を持つデータを取得することは難しい。
【0004】
データセット群が画像であり、かつソース群が、例えば顕微鏡システムにおける異なるチャネルであり、各チャネルで、例えば異なる波長の光が使用される場合、コローカリゼーション測定(colocalization measurements)の形態の相関測定が2つのソース画像の間で行なわれることが知られている。このような画像にノイズが含まれる場合には必ず、相関測定またはコローカリゼーション測定を行なっても、同じ試料の2つの画像の間に完全な一致が全ての点で認められるということがなく、同じソースから、かつ同じ試料に関して収集される2つの画像を用いた場合でも、真の一致は、或る種類のノイズまたは歪みが収集データに含まれる場合には認められない。
【0005】
これは、複製データセットを取得することが可能な場合の全てのデータセットに対して言えることであるので、複製データセットにおける各エントリは、元データにおける同じデータの第2測定値となる。ノイズが、データセットまたは他のいずれかの種類の歪みを収集するか、または取得する過程において生じると、絶対に、2つの画像が相関測定において完全に一致するということは起こり得ない。
【0006】
2つのデータセット間の相関を測定する異なる方法が存在することも知られている。一つの方法がスピアマン順位相関(Spearman rank correlation)であり、別の方法がピアソン相関(Pearson correlation)である。これらの公知の方法の両方の精度は、入力データに含まれるノイズによって変わる。
【発明の概要】
【発明が解決しようとする課題】
【0007】
技術分野及び背景技術の節に関連して、相関測定を2つのデータセット間で行なう過程において生じるノイズの影響を最小にすることが課題である。
時間の経過とともに変化する生体材料に関する画像を取得する過程におけるように、条件がデータ収集中に変化する場合、高信頼性データを十分速い速度で収集することが課題である。
【0008】
また、正確な相関測定を不完全なデータセットに対して行なうことが課題である。
これらの課題の全ては、相関を使用して、蛍光材料の分布を示す細胞群または生体試料群のデジタル画像のコローカリゼーションを測定する場合において、存在する。コローカリゼーションについては、細胞及び組織の生物学に関する科学論文に広く記載されている。
【課題を解決するための手段】
【0009】
上に説明したような本発明の分野の視点から、上述の問題のうちの一つ以上の問題が本発明による方法によって、第3データセットを第1ソースから第1データセットの収集条件と同じ条件で収集することにより、第4データセットを第2ソースから、第2データセットの収集条件と同じ条件で収集することにより解決される。
【0010】
本発明は、第1ソースから収集されるデータと第2ソースから収集されるデータとの測定相関値rmを、第1及び第2データセットの可能な組み合わせr12、第1及び第4データセットの可能な組み合わせr14、第3及び第2データセットの可能な組み合わせr32、及び第3及び第4データセットの可能な組み合わせr34からの複数の相関測定値のうちの一つの相関測定値として得ることを教示している。補正値C12は、第1データセットと第3データセットとの相関測定値r13、及び第2データセットと第4データセットとの相関測定値r24に基づき、次の数式に従って計算される。
【0011】
【数1】

次に、この補正値C12を測定相関値rmに適用して、数式rc=rm×C12に従った補正済み相関値rcを生成する。
【0012】
補正値は、互いの複製であるデータセット群の相関測定値に基づいて得られ、第3データセットは、第4データセットが第2データセットの条件と同じ条件で同じソースから収集されるのと全く同じようにして、第1データセットの条件と同じ条件で同じソースから収集され、これは、これらの相関測定値が、第2データセットが同じ、またはほぼ同じ条件で採取されるという条件で少なくとも、これらのデータセットに含まれるノイズの大きさを実際に示していることを意味する。これはまた、補正値C12を、補正済み相関値rcの数式に示すように、データセット群に含まれるノイズの補正値として使用することができることを意味する。
【0013】
従って、本発明は、第1データセットにおける各エントリが、第1ソースからの元データの第1測定値または第1収集値である場合に、第3データセットにおける各エントリは、第1ソースからの同じ元データの第2収集値または第2測定値であることを教示し、第2データセットにおける各エントリが、第2ソースからの元データの第1測定値または第1収集値である場合に、第4データセットにおける各エントリは、第2ソースからの同じ元データの第2収集値または第2測定値であることを教示している。
【0014】
データセット群の相関測定値の精度を更に一層高めるために、測定相関値rmを、第1データセットと第2データセットとの相関測定値r12、第1データセットと第4データセットとの相関測定値r14、第3データセットと第2データセットとの相関測定値r32、及び第3データセットと第4データセットとの相関測定値r34のうちの少なくとも2つの相関測定値の平均値とすることを提案する。最高の精度は、2つのソースからのデータセット群の相関測定値の4つの可能な組み合わせから得られる全ての4つの測定値の平均値を求めることにより実現する。
【0015】
異なる相関測定法を使用することができ、可能な相関法は、スピアマン順位相関法及びピアソン相関法であり、これらの方法は共に、相関測定に使用することができる。
本発明の特定の顕微鏡形態では、第1及び第2ソースは顕微鏡システムにおける異なるチャネルとすることができ、各チャネルで異なる波長の光を使用し、従って第1、第2、第3、及び第4データセットは、顕微鏡システムから収集される第1、第2、第3、及び第4ソース画像となる。2つの、または4つのデータセットを同時に取得することもできる。
【発明の効果】
【0016】
本発明による方法、コンピュータプログラム製品、またはコンピュータ読み取り可能な媒体の利点は、本発明が、正しい相関測定を信頼性の低いデータセット群に基づいて行なう可能性を提供することである。本発明はまた、非常に高速に収集されるために十分高い信頼性を持つことができないようなデータを利用して正確な相関測定を行なう方法を提供する。本明細書において提案されるような補正が行なわれない状態では、高信頼性データを収集するためには、取得時間を長くするか、または複製データセット群の和を求める必要がある。データに要求される信頼性を低くするということは、画像を更に高速に、従って相対的に高い周波数で取得することができて、後続イベントを更に高速に発生させることができることも意味する。正確な測定を、ノイズを含むデータに基づいて行なうことにより、更に、さほど高い機能を必要としない、従ってより安価な検出機器を使用することが可能になる。これらの利点は、生きた細胞または組織のデジタル画像の顕微鏡検査、及び蛍光材料間の相関測定において特に重要となる。
【図面の簡単な説明】
【0017】
【図1】公知の技術による、平均される画像の数が増えるにつれて相関値が大きくなり、既知の値に近づく様子を描いたグラフを示している。
【図2】データセットを2つのソースから収集する様子、及びこれらのデータセットを本発明に従って使用することができる方法を模式的に、かつ非常に簡易化して示している。
【図3】本発明による補正済みの相関値を示すグラフを示している。
【図4】本発明によるコンピュータプログラム製品を模式的に示している。
【図5】本発明によるコンピュータ読み取り可能な媒体を模式的に示している。
【発明を実施するための形態】
【0018】
次に、本発明による方法、コンピュータプログラム製品、及びコンピュータ読み取り可能な媒体について、添付の図面を参照しながら更に詳細に説明することとする。
次に、本発明について図2を参照しながら説明するが、図2は、第1データセット1及び第2データセット2のうちの一方または両方にノイズが含まれている状態で第1データセット1が第1ソースA1から収集され、第2データセット2が第2ソースA2から収集される様子を模式的に示している。
【0019】
図2は模式図であり、本発明を、対象物Aからデータが2つのソースA1及びA2を通して収集される構成として例示している。本発明の実用上の形態は顕微鏡検査であり、この場合、対象物Aが検査対象の試料であり、第1ソースA1は第1チャネルとすることができ、第1チャネルを通して、対象物に関するデータが第1画像として収集され、第2ソースA2は第2チャネルとすることができ、第2チャネルを通して、対象物Aに関するデータが第2画像として収集される。2つのチャネルでは、例えば異なる波長の光を使用し、対象物は、顕微鏡からの光の波長によって変わる異なる特性を示すこともできる。従って、2つの画像間の相関は、これらの異なる特性の間の相関を表わすことになる。
【0020】
しかしながら、2つの画像またはデータセット1,2のうちの一方または両方にノイズが含まれる場合、相関測定は、真の相関を正しく表わすことがなく、相関測定では、ノイズに起因して極めて低い相関値が現われることになる。
【0021】
ノイズを補正するために、またはデータ取得時間が短い状態でも、またはデータセットの精度が低い状態でも真の相関を測定するために、本発明は、第3データセット3を第1ソースA1から、第1データセット1の収集条件と同じ条件で収集することを教示し、第4データセット4を第2ソースA2から、第2データセット2の収集条件と同じ条件で収集することを教示している。
【0022】
データ収集の条件が変化する場合、同じ条件を実現するための一つの方法では、第3データセットを第1データセットの直後に収集し、第4データセットを第2データセットの直後に収集する。これにより、データ収集条件が、それぞれのソースA1,A2からのデータ収集におけるのと同じ条件に維持される確率が最も高くなる状態でデータを収集する可能性を実現することができ、第3データセット3及び第4データセット4は、それぞれ第1データセット1及び第2データセット2のコピーと見なすことができる。
【0023】
本発明による方法は更に、第1ソースA1及び第2ソースA2から収集されるデータの間の測定相関値rmは、相関値r12を生成することになる第1データセット1及び第2データセット2の可能な組み合わせ、相関値r14を生成することになる第1データセット1及び第4データセット4の可能な組み合わせ、相関値r32を生成することになる第3データセット3及び第2データセット2の可能な組み合わせ、及び相関値r34を生成することになる第3データセット3及び第4データセット4の可能な組み合わせからの複数の相関測定値のうちの一つの相関測定値として得ることができることを教示している。
【0024】
次の段階として、本発明による方法は、第1データセット1と第3データセット3との間の測定相関から相関値r13が生成され、第2データセット2と第4データセット4との間の測定相関から相関値r24が生成されることを教示している。これらの2つの測定相関値は、これらのデータセットの間の実際の差がノイズに起因する構成の複数のデータセットに基づいて計算されるので、結果として得られる相関値r13,r24は、それぞれのデータセットに含まれるノイズを正しく表わしている。
【0025】
補正値C12は、相関値r13及びr24に基づき、次の数式に従って計算される。
【0026】
【数2】

本発明による方法は、計算されるこの補正値C12を測定相関値rmに適用することにより、数式rc=rm×C12に従った補正済み相関値rcが得られることを教示している。
【0027】
本発明は、上に示す数式に限定されることがなく、かつ他の補正を用いることもできることに注目されたい。これは、数式はrc=k×rm×C12とすることができることを意味し、この場合、kは、補正済み相関値rcに対する微小な調整のような、適用することができる他のいずれかの補償または補正を表わす。
【0028】
良好な結果を本発明による補正によって実現するために、第1データセット1における各エントリが、第1ソースA1からの元データの第1測定値または第1収集値である場合に、第3データセット3における各エントリを、第1ソースからの同じ元データの第2収集値または第2測定値とすることにより、第3データセット3を第1データセット1のコピーとすることが重要であり、この場合、これらのコピーの差はノイズにある。
【0029】
同じようにして、第2データセット2における各エントリが、第2ソースA2からの元データの第1測定値または第1収集値である場合に、第4データセット4における各エントリを、第2ソースA2からの同じ元データの第2収集値または第2測定値とすることが重要である。
【0030】
本発明はまた、本発明によって、2つのデータセットが各ソースA1,A2からのものである4つのデータセット1,2,3,4が提供されるので、データセットを2つしか用いない場合に得られるよりも正しい測定相関値rmを測定することが可能になることを教示している。このようにして、本発明は、測定相関値rmを、相関値r12を生成することになる第1データセット1及び第2データセット2との相関測定値、相関値r14を生成することになる第1データセット1と第4データセット4との相関測定値、相関値r32を生成することになる第3データセット3と第2データセット2との相関測定値、及び相関値r34を生成することになる第3データセット3と第4データセット4との相関測定値の可能な組み合わせのうちの少なくとも2つの可能な組み合わせの平均値として得ることができることを教示している。例えば、測定相関値rmを、全ての4つの利用可能な相関値r12、r14、r32、r34の平均値として得ることができる。
【0031】
図3は、ポアソンノイズ(Poisson noise)を含むデータセットに適用される補正値C12を示す図を示している。図に示す例では、第1ソースA1から送出されるデータセットと、第2ソースA2から送出されるデータセットとの相関値が0.75であることが分かる。
【0032】
第1ソースA1及び第2ソースA2の品質(量(quanta))が徐々に上昇するにつれて、ソースA1が2倍になり、ソースA2が50%だけ増え、図は、r13及びr24の相関値がそれに応じるようにして大きくなることを示している。第1ソースA1と第2ソースA2との測定相関値rmは、これらのソースの品質が上昇するので、既知の相関値0.75に近付き、本発明による補正値C12は、第1ソースA1及び第2ソースA2の品質が上昇するにつれてほぼ1に低下することも分かる。
【0033】
しかしながら、かつ最も重要なことであるが、補正値C12が測定相関値rmに適用される場合、補正済み相関値rcが真の相関値0.75に、データの信頼性が最も低い状態でも近付くことも分かる。
【0034】
図3では、スピアマン順位相関が相関測定に使用されており、測定相関値群の全ての4つの可能な組み合わせに基づく平均値が測定相関値rmとして使用されている。
ピアソン相関のような他の方法を相関測定に使用することができることを認識されたい。
【0035】
本発明の上首尾の成果は、第1ソースA1及び第2ソースA2が顕微鏡システムにおける異なるチャネルであり、各チャネルで異なる波長の光を使用し、かつ第1、第2、第3、及び第4データセットが、顕微鏡システムから収集される第1、第2、第3、及び第4ソース画像である設定において得られることが判明している。しかしながら、本発明は、ノイズが、異なるデータセットの間の相関測定において問題となる全てのアプリケーションにおいて用いることができる。
【0036】
本発明はまた、コンピュータプログラムコード51を含むコンピュータプログラム製品5に関するものであり、コンピュータプログラムコードがコンピュータ6によって実行されると、コンピュータプログラムコードによってコンピュータ6が、図4に模式的に示すように、本発明による相関処理をデータセットに対して行なう。
【0037】
図5は、本発明によるコンピュータプログラムコード51を格納するコンピュータ読み取り可能な媒体を示し、コンピュータ読み取り可能な媒体はコンパクトディスクによって模式的に例示される。
【0038】
本発明は、デジタル化画像及びデジタルデータに広く適用することができる。本発明は、基礎信号の品質、及び検出及びデジタル化において生じる更に別のノイズの両方を補正する。例えば、本方法は、蛍光材料の顕微鏡画像に適用することができ、顕微鏡画像からは、ピクセルに関して比較的少ない光子しか検出することができず、かつ顕微鏡画像は検出器群からのノイズを含む可能性もある。
【0039】
本発明は、前述の、かつ例示される本発明の例示的な実施形態に制限されることがなく、変形を、添付の請求項に示される発明のコンセプトの範囲内で加えることができることを理解されたい。

【特許請求の範囲】
【請求項1】
正確な相関を、第1ソースから収集される第1データセットと第2ソースから収集される第2データセットとの間で、前記第1及び第2データセットのうちの一方に、または両方にノイズが含まれる状態で行なう方法であって、第3データセットを前記第1ソースから、前記第1データセットの収集条件と同じ条件で収集し、第4データセットを前記第2ソースから、前記第2データセットの収集条件と同じ条件で収集し、前記第1ソースから収集されるデータと前記第2ソースから収集されるデータとの測定相関値(rm)を、前記第1データセット及び前記第2データセットの可能な組み合わせ(r12)、前記第1データセット及び前記第4データセットの可能な組み合わせ(r14)、前記第3データセット及び前記第2データセットの可能な組み合わせ(r32)、及び前記第3データセット及び前記第4データセットの可能な組み合わせ(r34)からの複数の相関測定値のうちの一つの相関測定値として得て、補正値(C12)を前記第1データセットと前記第3データセットとの相関測定値(r13)、及び前記第2データセットと前記第4データセットとの相関測定値(r24)に基づき、次の数式に従って計算し、
【数1】

前記補正値(C12)を前記測定相関値(rm)に適用して、数式rc=rm×C12に従った補正済み相関値(rc)を生成することを特徴とする方法。
【請求項2】
前記第1データセットにおける各エントリは、前記第1ソースからの元データの第1測定値または第1収集値であり、前記第3データセットにおける各エントリは、前記第1ソースからの同じ元データの第2収集値または第2測定値であり、前記第2データセットにおける各エントリは、前記第2ソースからの元データの第1測定値または第1収集値であり、前記第4データセットにおける各エントリは、前記第2ソースからの同じ元データの第2収集値または第2測定値であることを特徴とする、請求項1記載の方法。
【請求項3】
前記測定相関値(rm)を、前記第1データセットと前記第2データセットとの相関測定値(r12)、前記第1データセットと前記第4データセットとの相関測定値(r14)、前記第3データセットと前記第2データセットとの相関測定値(r32)、及び前記第3データセットと前記第4データセットとの相関測定値(r34)のうちの少なくとも2つの相関測定値の平均値とすることを特徴とする、請求項1又は2記載の方法。
【請求項4】
スピアマン順位相関を前記相関測定に使用することを特徴とする、請求項1乃至3のいずれか一項に記載の方法。
【請求項5】
ピアソン相関を前記相関測定に使用することを特徴とする、請求項1乃至3のいずれか一項に記載の方法。
【請求項6】
前記第1及び第2ソースは、顕微鏡システムにおける異なるチャネルであり、各チャネルでは異なる波長の光を使用し、前記第1、第2、第3、及び第4データセットは、前記顕微鏡システムから収集される第1、第2、第3、及び第4ソース画像であることを特徴とする、請求項1乃至5のいずれか一項に記載の方法。
【請求項7】
コンピュータプログラムであって、前記コンピュータプログラムはコンピュータプログラムコードを含み、該コンピュータプログラムコードがコンピュータによって実行されると、該コンピュータプログラムコードによって前記コンピュータが、請求項1乃至6のいずれか一項によるデータセットの相関を実行することが可能であることを特徴とする、コンピュータプログラム。
【請求項8】
コンピュータ読み取り可能な媒体であって、請求項7に記載のコンピュータプログラムコードは、前記コンピュータ読み取り可能な媒体に格納されることを特徴とする、コンピュータ読み取り可能な媒体。

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2010−511237(P2010−511237A)
【公表日】平成22年4月8日(2010.4.8)
【国際特許分類】
【出願番号】特願2009−538670(P2009−538670)
【出願日】平成19年11月8日(2007.11.8)
【国際出願番号】PCT/EP2007/062060
【国際公開番号】WO2008/064982
【国際公開日】平成20年6月5日(2008.6.5)
【出願人】(509152057)
【氏名又は名称原語表記】ADLER,Jeremy
【出願人】(509152080)
【氏名又は名称原語表記】PARMRYD,Ingela
【Fターム(参考)】