情報処理装置、情報処理方法および情報処理プログラム
【課題】十分に使い勝手のよいバイオマーカー検出技術を提供すること。
【解決手段】少なくとも2つのサンプルについて、症例対照研究を利用してバイオマーカーの推定を行なうための情報処理装置であって、サンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、サンプルおよびその属性をリスト表示するための表示制御手段と、表示されたサンプル中において、症例とすべきサンプルと対照とすべきサンプルを識別可能にマーキングするマーキング手段と、マーキング手段でマーキングされたサンプルの識別情報を保持する保持手段と、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとにおける、バイオマーカー候補毎の発現率の相違を解析する解析手段と、を備える。
【解決手段】少なくとも2つのサンプルについて、症例対照研究を利用してバイオマーカーの推定を行なうための情報処理装置であって、サンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、サンプルおよびその属性をリスト表示するための表示制御手段と、表示されたサンプル中において、症例とすべきサンプルと対照とすべきサンプルを識別可能にマーキングするマーキング手段と、マーキング手段でマーキングされたサンプルの識別情報を保持する保持手段と、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとにおける、バイオマーカー候補毎の発現率の相違を解析する解析手段と、を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、統計データの解析を行なう技術に関する。
【背景技術】
【0002】
上記技術分野において、特許文献1に示されているように、組織資料の切片からバイオマーカーを検出する技術が知られている。バイオマーカーとは、尿や血清中などに含まれる生体由来の物質で、生体内の生物学的変化を定量的に把握するための指標(マーカー)となるものを指す。バイオマーカーとしては、例えば、腎機能を評価するために測定する尿中に含まれるアルブミンや、肝機能の指標となる血清中のGPT、GOT等がよく知られている。核酸としては、特定の炎症疾患で発現するインターロイキン6のメッセンジャーRNA、さらにはプロスタタグランジンのような炎症性メディエータのような脂質や、がんマーカーとして知られるシアル酸のような糖鎖も、バイオマーカーとして利用される。このようにバイオマーカーはある特定の疾病や体の状態に相関して量的に変化するために、そのバイオマーカーの量を測定することで疾病の診断や効率的な治療法の確立等が可能となる。
【0003】
既に、生体内に存在する数多くのバイオマーカーが知られているが、従来の検査項目よりも鋭敏かつ詳細に体の状態を反映すると期待される新たなバイオマーカーの発見が常に期待されている。そのようなバイオマーカーの発見のためには、膨大なサンプルを解析し、繰り返し統計的にタンパク質を解析することが重要である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特表2009−537822号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記従来技術では、過去の解析に用いたサンプルの選択履歴を残すことができず、例えば、過去と同じサンプルで解析を繰り返してしまうなど、無駄が生じる可能性があった。言い換えれば、ユーザにとって十分に使い勝手のよいものとはなっていなかった。
【0006】
本発明の目的は、上述の課題を解決する技術を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明に係る装置は、
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理装置であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを取得し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御手段と、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキング手段と、
前記マーキング手段でマーキングされた前記サンプルの識別情報を保持する保持手段と、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補毎の発現率の相違を解析する解析手段と、
を備え、
前記表示制御手段は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持手段が保持する前記識別情報に基づいて、過去にマーキングされた前記サンプルを表示すべく制御することを特徴とする。
【0008】
上記目的を達成するため、本発明に係る方法は、
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理方法であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
を備え、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする。
【0009】
上記目的を達成するため、本発明に係るプログラムは、
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理プログラムであって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
をコンピュータに実行させ、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする。
【発明の効果】
【0010】
本発明によれば、ユーザにとって十分に使い勝手のよいバイオマーカー検出技術を提供できる。
【図面の簡単な説明】
【0011】
【図1】本発明の第1実施形態に係る情報処理装置の構成を示すブロック図である。
【図2】本発明の第2実施形態に係るバイオマーカー検出装置の構成を示すブロック図である。
【図3】本発明の第2実施形態に係るグループ制御部の詳細な構成を示すブロック図である。
【図4】本発明の第2実施形態に係るバイオマーカー検出装置において保存されるグルーピング履歴の一例を示す図である。
【図5】本発明の第2実施形態に係るバイオマーカー検出装置での全体処理の流れを説明するフローチャートである。
【図6】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図7】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図8】本発明の第2実施形態に係るバイオマーカー検出装置でのグルーピング処理の流れを説明するフローチャートである。
【図9】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図10A】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図10B】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図11】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図12】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【発明を実施するための形態】
【0012】
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
【0013】
[背景]
本発明の実施形態について説明する前に、その前提となる背景について簡単に説明する。
【0014】
任意の標的に対して特異的に結合する抗体などを利用したプロテインアレイ、さらには遺伝子発現解析用の遺伝子チップなどが知られている。例えば、発色するプロテインアレイを用いれば、患者から採った尿や血清などに、特定の疾病などに関連するバイオマーカー(例えばタンパク質など立体的な分子構造を有するもの)が含まれるか否かなどを容易に検査することができる。
【0015】
ここで、バイオマーカーとは、尿や血清中などに含まれる生体由来の物質で、生体内の生物学的変化を定量的に把握するための指標(マーカー)となるものである。タンパク質としては、例えば、腎機能を評価するために測定する尿中に含まれるアルブミンや、肝機能の指標となる血清中のGPT、GOT等は良く知られている。核酸としては、特定の炎症疾患で発現するインターロイキン6のメッセンジャーRNA、さらにはプロスタタグランジンのような炎症性メディエータのような脂質や、がんマーカーとして知られるシアル酸のような糖鎖も、バイオマーカーとして利用される。このようにバイオマーカーはある特定の疾病や体の状態に相関して量的に変化するために、そのバイオマーカーの量を測定することで疾病の診断や効率的な治療法の確立等が可能となる。このようなプロテインアレイや遺伝子アレイによるバイオマーカーの測定は、コンパニオン診断(companion diagnostics)と呼ばれる各個人に合わせた診断を行なうために非常に重要である。プロテインアレイ、遺伝子アレイ、脂質や糖鎖アレイを利用して個人のバイオマーカーの発現特性を把握し、治療対象者を選別して、投薬や治療法を決定することが可能となる。
【0016】
このようなプロテインなどのバイオマーカーアレイを活用した解析作業の前に必要となるのは、バイオマーカーとしてどのような物質が存在するのかという解析である。そのため、非常に多くのサンプル(検体)を分類し、非常に多くのタンパク質、脂質、糖、遺伝子等の生体物質との関連性を統計的に解析する必要がある。具体的には、解析者は、大量のサンプルを様々な属性に基づいてグループ化し、ある属性をもつグループとその属性を持たないグループとで、ある程度明確な識別指標となる物質(ヒト血液の場合はタンパク質や脂質)が無いか繰り返し調べる。つまり解析者は、いわゆる症例対照研究(case-control study)と呼ばれる研究を繰り返す。そして、研究対象となる疾病に罹患した集団と罹患していない集団について、特定の要因への曝露状況を調査し比較することで、要因と疾病の関連を評価する。
【0017】
このように、ケースコントロール研究では、対象としている疾病の原因と考えられる要因を複数調べるため、分類作業と、解析処理とその結果の解析とを繰り返し実施する必要がある。その際、過去に行なった分類作業や解析処理がどういったものだったかを把握しながら研究を繰り返すのとそうでないのとでは、研究の効率に大きな差が生じる。
【0018】
このような状況の中、以下の実施形態では、分類を繰り返し実施する際に、過去の思考過程を直感的に表現する手段として、「マーキング」というグラフィックユーザインタフェースを提供する。そしてさらに、過去にマーキングしたサンプルの識別情報を保持し、その過去のマーキングサンプルを参照しながら新たなサンプルを選択することができる、非常にユーザフレンドリなシステムを実現するものである。
【0019】
[第1実施形態]
本発明の第1実施形態としての情報処理装置100について、図1を用いて説明する。情報処理装置100は、少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理装置である。
【0020】
図1に示すように、情報処理装置100は、表示制御部101とマーキング部102とマーキング保持部103とサンプル解析部104とを含む。
【0021】
表示制御部101は、少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを取得し、少なくとも2つのサンプルおよびその属性をリスト表示すべく制御する。
【0022】
マーキング部102は、表示された少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングする。
【0023】
また、保持部103は、マーキング部102でマーキングされたサンプルの識別情報を保持する。
【0024】
さらに解析部104は、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとにおける、各バイオマーカー候補の発現率の相違を解析する。
【0025】
また、表示制御部101は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、保持部103が保持する過去にマーキングされたサンプルを表示すべく制御する。
【0026】
以上の構成によれば、履歴を参照しながら新たなマーキングが行えるので、ユーザにとって十分に使い勝手のよいバイオマーカー検出技術を提供できる。
【0027】
[第2実施形態]
《装置構成》
本発明の第2実施形態に係る情報処理装置としてのバイオマーカー検出装置200について、図2を用いて説明する。図2は、本実施形態に係るバイオマーカー検出装置200の概略構成を説明するための図である。なお、本実施形態では、バイオマーカーとしてプロテインを一例としてあげているが、本発明はこれに限定されるものではない。本発明は、たとえば、遺伝子発現解析や遺伝子の一塩基多型、体内の代謝物や金属イオン、伝達物質、補酵素、ビタミンなど健康や病気の状態を反映する原子や分子の解析など、様々な解析に応用することが可能である。
【0028】
バイオマーカー検出装置200は、表示制御部201、グループ制御部202、解析部204、ソースデータ読出部205、解析結果記憶部206、および操作入力部208を有する。また。バイオマーカー検出装置200は、複数のサンプル(例えば1000人の人間)に関する情報を含むサンプルファイル209を記憶している。
【0029】
サンプルファイル209は、サンプルとその属性との関係性を示すサンプル/属性対応データ291と、サンプルとそのサンプルから採取した血清に含まれるプロテインの発現率との関係性を示すサンプル/プロテイン発現率対応データ292を含む。さらに、サンプルファイル209は、ユーザによって抽出されたサンプル群で構成されるグループに関するグループデータ293と、各グループについて統計解析を行なった結果としての解析結果データ294とを含んでいる。サンプルの属性としては、年齢、性別、疾病、マーカー、投薬の種類、発現率の計測タイミングなどが挙げられる。
【0030】
表示制御部201は、少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のプロテインの発現率を含むデータを取得し、少なくとも2つのサンプルおよびその属性をディスプレイ230にリスト表示すべく制御する。また、表示制御部201は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、過去にマーキングされたサンプルをサンプルファイル209から読出しディスプレイ230に表示する。表示制御部201は、さらに、リザルトテーブルをディスプレイに表示する。このリザルトテーブルは、ケースとコントロールに分けられたサンプル群における、タンパク質毎の統計値を表示するためのテーブルである。
【0031】
グループ制御部202は、ディスプレイ230に表示された少なくとも2つのサンプル中において、ユーザからの操作に基づき、症例とすべきサンプルと対照とすべきサンプルを識別可能にマーキングする。
【0032】
また、サンプルファイル209は、グループ制御部202でマーキングされたサンプルの識別情報を保持する。
【0033】
解析部204は、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとにおける、各プロテインの発現率の相違を解析する。解析部204は、また、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとを解析し、症例を識別するためのバイオマーカーとして有効なプロテインを推定する。表示制御部201は、さらに、解析部204がバイオマーカーとして推定したプロテインを他のプロテインとは識別可能にディスプレイ230に表示する。
【0034】
表示制御部201はソート部211を含み、そのソート部211は、表示制御部201によってリスト表示されたサンプルを、ユーザに選択された属性に応じて並び替える。
【0035】
操作入力部208は、マウス240等のポインティングデバイスやキーボードを介して、ユーザによる操作を入力する。
【0036】
サンプルファイル209は、サンプルをマーキングする際に行なわれたユーザの操作を、マーキングされたサンプルの識別情報と関連付けてグループデータ293として保持する。すなわち、グループデータ293は、グループごとにマーキングされたサンプルを保持するデータとなっている。サンプルファイル209は、さらに、マーキング前にソート部211が行なったソート処理を、マーキングされたサンプルの識別情報と関連付けてグループデータ293として保持する。
【0037】
サンプルファイル209は、また、マーキングされたサンプルに対して解析部204が行なった解析の結果を、マーキングされたサンプルの識別情報と関連付けて解析結果データ294として保持する。
【0038】
図3は、グループ制御部202の詳細な構成を示すブロック図である。図3に示すように、グループ制御部202は、グループ生成部301とサンプル選択部302とピン付加部303とケース/コントロール設定部304と解析方法設定部305とグループ保存部306とを含む。
【0039】
グループ生成部301は、ユーザの操作に応じて、新規なグループ(サンプル群を選択するための入れ物)を生成する。その際、例えば、グループ1、グループ2といった名称を付ける。表示制御部201では、このグループ生成部301での生成処理に応じて、サンプルリストにグループカラム(図10A、10Bのグループカラム1001)を1つ追加して表示する。
【0040】
サンプル選択部302は、ユーザの操作に応じて、グループ生成部301で生成されたグループに含めるべきサンプルを選択する。そして、ピン付加部303は、サンプル選択部302で選択されたサンプルに対して、表示画面上において選択されたサンプルの横に「ピンを付加する」というグラフィックユーザフェースを用いてマーキングする。このときピン付加部303は、操作入力部208を介して入力したユーザの操作に応じて、サンプル選択部302によって選択されたサンプル群ごとに、異なる色のピンを付加することができる。ここで設定された色のピンは、表示制御部201によって、ディスプレイ230に表示される。カラーピンであることにより、どのサンプルがどの時点でグループとして選択されたものか、ユーザは非常に明確に把握することができる。
【0041】
アプリケーションにおいて、選択状態を表現する場合一般的にチェックボックスあるいは、ラジオボタンなどを使用するが、本実施形態ではピンを使用することにより従来の紙媒体などを使用する際にマーキングをするような直感性を再現できる。表形式の表現の場合に行の背景色を変更しても同様の表現が可能だが、この場合には、表全体の視認性が悪くなる。それと比較して異なる色のピンを使用することで、グルーピング状態を明確に表現でき、表全体の視認性を確保することもできる。また、チェックボックスなどの従来部品と比較して、3グループ以上の複数グループ容易に構成することができる。
【0042】
ケース/コントロール設定部304は、操作入力部208を介して入力したユーザの操作に応じて、異なる色のピンを付加して表示されたサンプル群のうち、症例とすべきサンプル群および対照とすべきサンプル群の選択を設定する。
【0043】
解析方法設定部305は、操作入力部208を介して入力したユーザの操作に応じて、解析方法の選択および閾値(有意水準)の設定を受け付ける。
【0044】
グループ保存部306は、ユーザの操作に応じて、グルーピング履歴を保存する。具体的には、グループ名と、グループに含まれるサンプル群の識別情報と、サンプル群に付加されたピンの色と、各色のピンに対応するケース/コントロールの別と、をサンプルファイル209に保存する。さらにグループ保存部306は、設定された解析方法および閾値(有意水準)およびその解析結果をサンプルファイル209に保存してもよい。
【0045】
図4は、サンプルファイル209に保存されるグルーピング履歴の一例を示す図である。サンプルファイル209は、グループの生成および保存操作が行なわれる回数に応じて複数のグルーピング履歴テーブル401、402、...を保存する。
【0046】
1つのグルーピング履歴テーブル401は、グループ名411、グルーピング作業を行なった日時412、グルーピング作業を行なった担当者413、各色のピンが打たれたサンプルおよびケース/コントロールの別414を含んでいる。また、グルーピング履歴テーブル401は、解析部204が解析した結果としてのバイオマーカー候補となるタンパク質の識別情報417をも含んでいる。
【0047】
このようなグルーピング履歴テーブル401を残すことにより、いつどの作業者が、どのようなサンプルを対象にケース/コントロール解析を行なって、どのような結果が出たかを、後の解析の際に参照することが可能となる。
【0048】
《全体処理の流れおよび表示画面》
次に、バイオマーカー検出装置200で行なわれる処理の流れについて表示画面を参照しつつ説明する。図5は、バイオマーカー検出装置200で行なわれる処理の流れを示すフローチャートである。このフローチャートは、バイオマーカー検出アプリケーションの起動と同時に開始される。具体的にはバイオマーカー検出装置200に含まれるCPUが、ストレージに格納されたバイオマーカー検出アプリケーションを実行することによって開始される。
【0049】
まず、ステップS501において、ユーザがケースコントロール研究用のサンプルファイル209を読み込むと、ステップS503においてサンプルリストをディスプレイ230に表示する。図6は、サンプルファイルを読み込んだ段階でディスプレイ230に表示される画面600を示す図である。図6に示すように、画面600には、読み込んだサンプルファイル名601と、サンプルファイルに含まれるサンプルリスト602と、検査時点でプロテインアレイによって検出可能なプロテインリスト603とが表示される。ここで、サンプルリスト602は、サンプル/属性対応データ291に対応し、プロテインリスト603は、サンプル/プロテイン発現率対応データ292に対応するものである。
【0050】
サンプルリスト602は、サンプルを識別する識別情報としてのサンプルID621、クラス名622、喫煙履歴623、の他、図示はされていないが、年齢、性別、疾病歴、マーカー、投薬の種類、発現率の計測タイミングなど、非常に多くのサンプル属性を表示できる。また、どのようなサンプル属性をこのリスト602に表示するかを自由に設定することができる。サンプルリスト602の表示中に、カラムをドラッグすることにより、カラムの順序を変更することができる。カラム名(属性名)をクリックすれば、その属性内容でソートする。つまり、クラス名622のサンプルの属性部分をクリックすれば、例えば、喫煙履歴623によって全サンプルを整理する。言い換えれば、喫煙履歴のある全サンプルが最上部に固まって表示され、次に、喫煙履歴のないサンプルが下方に固まって表示されるようにサンプルを並び替える。
【0051】
(1次解析手法)
本実施形態に係るシステムでは、グループとして区別されたサンプル群を区別する1次解析の結果として、プロテイン毎のP値711、統計量712、Q値713といった指標を導く。P値(P value)711は、サンプル群同士に差が偶然生じる可能性を示す尺度であり、有意確率とも呼ばれる。Q値(Q value)713は、P値の代わりに用いるために作られた多重検定用の仮説有意性指標である。Q値は、FDR(False Discovery Rate)による補正により得られる。
【0052】
統計量712は、統計学的に算出される確率変数を示す。有限個の標本に基づいて、2つの母集団の確率分布が異なるものであるかどうか、あるいは母集団の確率分布が帰無仮説で提示された分布と異なっているかどうかを調べるために用いられる検定方法である。
【0053】
これらの値がプロテインリストに追加されてリザルトテーブル701が構成される。なお、先に設定された閾値以下の統計値をもつプロテインをバイオマーカー候補として有意と判断し、ピン714を自動的に打つ。
【0054】
(2次解析手法)
本実施形態に係るバイオマーカー検出装置200では、2次解析手法として、主成分分析(PCA)を用いる。
【0055】
主成分分析は、複数の変数間の共分散(相関)を少数の合成変数で説明する手法であり、共分散行列の固有値問題の解として得ることができる。本実施形態では、グルーピング処理で抽出されたサンプルをマッピングすることにより生成された、PCAグラフ702を表示する。また、さらに、プロテインリストに表示されたプロテインをマッピングすることにより生成された、PCAグラフ702を表示する。
【0056】
図示はしていないが、本実施形態では、ヒートマップ解析によって、ケースコントロールを分離するバイオマーカーを見つけてもよい。ヒートマップ解析とは、横軸にタンパク質をとり、縦軸にサンプルとして発現率を色の階調を用いて表現することでサンプル全体の発現率を視覚的に表現する解析方法である。例えば、赤く固まっているところを見ると、そのグループに属する人達がどのタンパク質を多く発現しているか分かる。
【0057】
《グルーピング処理および表示画面》
図8は、グルーピングの詳しい処理の流れを説明するための図である。ステップS801では、グループ制御部202のグループ生成部301が、ユーザの操作に応じて、新規なグループ(サンプル群を選択するための入れ物)を生成する。図9は、グループ生成の際に表示される画面900を示す図である。サンプルリスト602のいずれかのセルで右クリックすることにより、操作リスト901が表示され、その中で「Group」を選択すれば、さらにグルーピング処理リスト902が表示される。グルーピング処理としては、グループ追加(Add)、グループ削除(Remove)、カラムからグループ生成(Create from Column)の3種類の処理を選ぶことができる。
【0058】
ここでユーザがグループ追加(Add)を選択すると、さらに、グループ名設定ダイアログ903が表示され、新規に生成するグループに付けたい名前を入力可能となる。ここで例えば、グループ1、グループ2といった名称を付けることができる。表示制御部201では、このグループ生成部301での生成処理に応じて、図10A、10Bに示すように、サンプルリストにグループカラム1001を追加して表示する。図10Aは、グループに含めるべきサンプルを選択し、ピンを付加する操作を行なう際の画面1000を示す図である。図10Bは、グループ2にピンを付加した状態の画面1010および、グループの削除操作を説明するための図である。
【0059】
ステップS803では、サンプルを選択する。表示制御部201は、選択されたサンプルのセル1002を反転して表示する。選択されたサンプルのセル1002で右クリックされると、表示制御部201は、作業ダイアログ1003を表示し、さらに、そこでピン付加(Pins)が選択されると、色設定ダイアログ1004を表示する。色設定ダイアログ1004には、ピンの色を設定する欄の他、ピンの削除を示すコマンドも用意されている。
【0060】
色設定ダイアログ1004においてピンの色が選択されると、表示制御部201は、その色をもつピンを、選択されたサンプル行における選択されたグループ列のセルに付加する(S805)。これにより図10Bのように新たなピンが付加されたカラム1011が生成される。このようにグループを増やすごとにカラムを増やしていくことができる。したがって、過去にどのようなサンプルを選択して解析を行なったかを一目で把握することができる。なお、いずれかのセルで右クリックをして、Group→Removeを選択すると、グループ全体を削除することができる。
【0061】
図10Aのようにセルを選択してピンを付加する場合の他、図11の画面1100のようにサンプル属性を選択してピンを付加することもできる。サンプルリスト602のいずれかのセルで右クリックすることにより、操作リスト901が表示され、その中で「Group」を選択すれば、さらにグルーピング処理リスト902が表示される。グルーピング処理リスト902における、カラムからグループ生成(Create from Column)を選択すると、グループ生成ダイアログ1101が表示される。
【0062】
このグループ生成ダイアログ1101には、サンプルのクラス名と、それぞれのクラスに含まれるサンプル数が列記される。それぞれのクラス名について、プルダウンリストが用意され、どのクラスにどのピンを打つかを選択できる。例えば、クラス名「Control type 1」の横のプルダウンリストで「PIN A」を選択すれば、喫煙者を表わす全サンプルに、赤いピンが付加される。
【0063】
ピンの付加が終了すると、ステップS807に進み、ケース/コントロール設定処理を行なう。具体的には図11に示すように、画面1101において、まず、任意のセル位置で右クリックされると、作業ダイアログ1003を表示する。作業ダイアログ1003において、解析(Analyze)が選択されると、解析設定ダイアログ1102を表示する。
【0064】
解析設定ダイアログ1102は、解析対象となるグループ選択欄1121と、ピンごとにケース/コントロールを選択するケース/コントロール設定欄1122と、解析方法を選択する解析方法選択欄1123と、解析ボタン1124とを含む。この画面1100では、ピンAとピンBをケースとして、ピンCをコントロールと設定しようとしている。また、解析方法として例としてT-Testが選択されており、その有意水準としての閾値(p値)が0.05と設定されている。この状態で解析ボタン1124が押されると、表示制御部201は、解析の進行状況を示すバーグラフ1103をディスプレイ230に表示する。
【0065】
ステップS811では、解析が終了したグループについての情報を保存する。そのさい、グループ保存部306は、ユーザの操作に応じて、グルーピング履歴を保存する。具体的には、グループ名と、グループに含まれるサンプル群の識別情報と、サンプル群に付加されたピンの色と、各色のピンに対応するケース/コントロールの別と、をサンプルファイル209に保存する。さらにグループ保存部306は、設定された解析方法および閾値(有意水準)およびその解析結果をサンプルファイル209に保存してもよい。なお、設定したグループデータ293の保存は、ユーザからの指示に応じたタイミング行なってもよいし、解析処理を行なったと同時に自動的に行なってもよい。
【0066】
以上の通り、本実施形態によれば、バイオマーカーを特定するために繰り返し行なわれる解析作業のなかで、過去の思考過程の履歴を残して、それを参照することが可能となる。ひいては、より効率的なバイオマーカーの検出作業を行なうことができる。
【0067】
[第3実施形態]
本発明の第3実施形態に係る情報処理装置として、タイムコースビューを利用した投薬タイミング検出装置について説明する。この装置は、第2実施形態で説明したケースコントロール研究用の装置に加えて、サンプル毎の投薬タイミングとプロテインの発現率の時系列的な変化を用いて、バイオマーカーの検出タイミングを導くものである。
【0068】
サンプルデータに、サンプル毎の投薬タイミングとプロテインの発現率の時系列的な変化が含まれている場合、薬の投与が行なわれてからバイオマーカーの発現率の変化をグラフ化することができる。そのグラフをタイムコースビューと呼ぶ。
【0069】
本実施形態によれば、薬の投与に対して、バイオマーカーの反応を検出すべきベストなタイミングを検出することができる。バイオマーカーに反応が見られるサンプル(レスポンダー)とバイオマーカーに反応が見られないサンプル(ノンレスポンダー)を区別することができる。
【0070】
[他の実施形態]
以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
【0071】
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
【技術分野】
【0001】
本発明は、統計データの解析を行なう技術に関する。
【背景技術】
【0002】
上記技術分野において、特許文献1に示されているように、組織資料の切片からバイオマーカーを検出する技術が知られている。バイオマーカーとは、尿や血清中などに含まれる生体由来の物質で、生体内の生物学的変化を定量的に把握するための指標(マーカー)となるものを指す。バイオマーカーとしては、例えば、腎機能を評価するために測定する尿中に含まれるアルブミンや、肝機能の指標となる血清中のGPT、GOT等がよく知られている。核酸としては、特定の炎症疾患で発現するインターロイキン6のメッセンジャーRNA、さらにはプロスタタグランジンのような炎症性メディエータのような脂質や、がんマーカーとして知られるシアル酸のような糖鎖も、バイオマーカーとして利用される。このようにバイオマーカーはある特定の疾病や体の状態に相関して量的に変化するために、そのバイオマーカーの量を測定することで疾病の診断や効率的な治療法の確立等が可能となる。
【0003】
既に、生体内に存在する数多くのバイオマーカーが知られているが、従来の検査項目よりも鋭敏かつ詳細に体の状態を反映すると期待される新たなバイオマーカーの発見が常に期待されている。そのようなバイオマーカーの発見のためには、膨大なサンプルを解析し、繰り返し統計的にタンパク質を解析することが重要である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特表2009−537822号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記従来技術では、過去の解析に用いたサンプルの選択履歴を残すことができず、例えば、過去と同じサンプルで解析を繰り返してしまうなど、無駄が生じる可能性があった。言い換えれば、ユーザにとって十分に使い勝手のよいものとはなっていなかった。
【0006】
本発明の目的は、上述の課題を解決する技術を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明に係る装置は、
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理装置であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを取得し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御手段と、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキング手段と、
前記マーキング手段でマーキングされた前記サンプルの識別情報を保持する保持手段と、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補毎の発現率の相違を解析する解析手段と、
を備え、
前記表示制御手段は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持手段が保持する前記識別情報に基づいて、過去にマーキングされた前記サンプルを表示すべく制御することを特徴とする。
【0008】
上記目的を達成するため、本発明に係る方法は、
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理方法であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
を備え、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする。
【0009】
上記目的を達成するため、本発明に係るプログラムは、
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理プログラムであって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
をコンピュータに実行させ、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする。
【発明の効果】
【0010】
本発明によれば、ユーザにとって十分に使い勝手のよいバイオマーカー検出技術を提供できる。
【図面の簡単な説明】
【0011】
【図1】本発明の第1実施形態に係る情報処理装置の構成を示すブロック図である。
【図2】本発明の第2実施形態に係るバイオマーカー検出装置の構成を示すブロック図である。
【図3】本発明の第2実施形態に係るグループ制御部の詳細な構成を示すブロック図である。
【図4】本発明の第2実施形態に係るバイオマーカー検出装置において保存されるグルーピング履歴の一例を示す図である。
【図5】本発明の第2実施形態に係るバイオマーカー検出装置での全体処理の流れを説明するフローチャートである。
【図6】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図7】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図8】本発明の第2実施形態に係るバイオマーカー検出装置でのグルーピング処理の流れを説明するフローチャートである。
【図9】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図10A】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図10B】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図11】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【図12】本発明の第2実施形態に係るバイオマーカー検出装置によって表示される画面例を示す図である。
【発明を実施するための形態】
【0012】
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
【0013】
[背景]
本発明の実施形態について説明する前に、その前提となる背景について簡単に説明する。
【0014】
任意の標的に対して特異的に結合する抗体などを利用したプロテインアレイ、さらには遺伝子発現解析用の遺伝子チップなどが知られている。例えば、発色するプロテインアレイを用いれば、患者から採った尿や血清などに、特定の疾病などに関連するバイオマーカー(例えばタンパク質など立体的な分子構造を有するもの)が含まれるか否かなどを容易に検査することができる。
【0015】
ここで、バイオマーカーとは、尿や血清中などに含まれる生体由来の物質で、生体内の生物学的変化を定量的に把握するための指標(マーカー)となるものである。タンパク質としては、例えば、腎機能を評価するために測定する尿中に含まれるアルブミンや、肝機能の指標となる血清中のGPT、GOT等は良く知られている。核酸としては、特定の炎症疾患で発現するインターロイキン6のメッセンジャーRNA、さらにはプロスタタグランジンのような炎症性メディエータのような脂質や、がんマーカーとして知られるシアル酸のような糖鎖も、バイオマーカーとして利用される。このようにバイオマーカーはある特定の疾病や体の状態に相関して量的に変化するために、そのバイオマーカーの量を測定することで疾病の診断や効率的な治療法の確立等が可能となる。このようなプロテインアレイや遺伝子アレイによるバイオマーカーの測定は、コンパニオン診断(companion diagnostics)と呼ばれる各個人に合わせた診断を行なうために非常に重要である。プロテインアレイ、遺伝子アレイ、脂質や糖鎖アレイを利用して個人のバイオマーカーの発現特性を把握し、治療対象者を選別して、投薬や治療法を決定することが可能となる。
【0016】
このようなプロテインなどのバイオマーカーアレイを活用した解析作業の前に必要となるのは、バイオマーカーとしてどのような物質が存在するのかという解析である。そのため、非常に多くのサンプル(検体)を分類し、非常に多くのタンパク質、脂質、糖、遺伝子等の生体物質との関連性を統計的に解析する必要がある。具体的には、解析者は、大量のサンプルを様々な属性に基づいてグループ化し、ある属性をもつグループとその属性を持たないグループとで、ある程度明確な識別指標となる物質(ヒト血液の場合はタンパク質や脂質)が無いか繰り返し調べる。つまり解析者は、いわゆる症例対照研究(case-control study)と呼ばれる研究を繰り返す。そして、研究対象となる疾病に罹患した集団と罹患していない集団について、特定の要因への曝露状況を調査し比較することで、要因と疾病の関連を評価する。
【0017】
このように、ケースコントロール研究では、対象としている疾病の原因と考えられる要因を複数調べるため、分類作業と、解析処理とその結果の解析とを繰り返し実施する必要がある。その際、過去に行なった分類作業や解析処理がどういったものだったかを把握しながら研究を繰り返すのとそうでないのとでは、研究の効率に大きな差が生じる。
【0018】
このような状況の中、以下の実施形態では、分類を繰り返し実施する際に、過去の思考過程を直感的に表現する手段として、「マーキング」というグラフィックユーザインタフェースを提供する。そしてさらに、過去にマーキングしたサンプルの識別情報を保持し、その過去のマーキングサンプルを参照しながら新たなサンプルを選択することができる、非常にユーザフレンドリなシステムを実現するものである。
【0019】
[第1実施形態]
本発明の第1実施形態としての情報処理装置100について、図1を用いて説明する。情報処理装置100は、少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理装置である。
【0020】
図1に示すように、情報処理装置100は、表示制御部101とマーキング部102とマーキング保持部103とサンプル解析部104とを含む。
【0021】
表示制御部101は、少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを取得し、少なくとも2つのサンプルおよびその属性をリスト表示すべく制御する。
【0022】
マーキング部102は、表示された少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングする。
【0023】
また、保持部103は、マーキング部102でマーキングされたサンプルの識別情報を保持する。
【0024】
さらに解析部104は、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとにおける、各バイオマーカー候補の発現率の相違を解析する。
【0025】
また、表示制御部101は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、保持部103が保持する過去にマーキングされたサンプルを表示すべく制御する。
【0026】
以上の構成によれば、履歴を参照しながら新たなマーキングが行えるので、ユーザにとって十分に使い勝手のよいバイオマーカー検出技術を提供できる。
【0027】
[第2実施形態]
《装置構成》
本発明の第2実施形態に係る情報処理装置としてのバイオマーカー検出装置200について、図2を用いて説明する。図2は、本実施形態に係るバイオマーカー検出装置200の概略構成を説明するための図である。なお、本実施形態では、バイオマーカーとしてプロテインを一例としてあげているが、本発明はこれに限定されるものではない。本発明は、たとえば、遺伝子発現解析や遺伝子の一塩基多型、体内の代謝物や金属イオン、伝達物質、補酵素、ビタミンなど健康や病気の状態を反映する原子や分子の解析など、様々な解析に応用することが可能である。
【0028】
バイオマーカー検出装置200は、表示制御部201、グループ制御部202、解析部204、ソースデータ読出部205、解析結果記憶部206、および操作入力部208を有する。また。バイオマーカー検出装置200は、複数のサンプル(例えば1000人の人間)に関する情報を含むサンプルファイル209を記憶している。
【0029】
サンプルファイル209は、サンプルとその属性との関係性を示すサンプル/属性対応データ291と、サンプルとそのサンプルから採取した血清に含まれるプロテインの発現率との関係性を示すサンプル/プロテイン発現率対応データ292を含む。さらに、サンプルファイル209は、ユーザによって抽出されたサンプル群で構成されるグループに関するグループデータ293と、各グループについて統計解析を行なった結果としての解析結果データ294とを含んでいる。サンプルの属性としては、年齢、性別、疾病、マーカー、投薬の種類、発現率の計測タイミングなどが挙げられる。
【0030】
表示制御部201は、少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のプロテインの発現率を含むデータを取得し、少なくとも2つのサンプルおよびその属性をディスプレイ230にリスト表示すべく制御する。また、表示制御部201は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、過去にマーキングされたサンプルをサンプルファイル209から読出しディスプレイ230に表示する。表示制御部201は、さらに、リザルトテーブルをディスプレイに表示する。このリザルトテーブルは、ケースとコントロールに分けられたサンプル群における、タンパク質毎の統計値を表示するためのテーブルである。
【0031】
グループ制御部202は、ディスプレイ230に表示された少なくとも2つのサンプル中において、ユーザからの操作に基づき、症例とすべきサンプルと対照とすべきサンプルを識別可能にマーキングする。
【0032】
また、サンプルファイル209は、グループ制御部202でマーキングされたサンプルの識別情報を保持する。
【0033】
解析部204は、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとにおける、各プロテインの発現率の相違を解析する。解析部204は、また、症例としてマーキングされたサンプルと、対照としてマーキングされたサンプルとを解析し、症例を識別するためのバイオマーカーとして有効なプロテインを推定する。表示制御部201は、さらに、解析部204がバイオマーカーとして推定したプロテインを他のプロテインとは識別可能にディスプレイ230に表示する。
【0034】
表示制御部201はソート部211を含み、そのソート部211は、表示制御部201によってリスト表示されたサンプルを、ユーザに選択された属性に応じて並び替える。
【0035】
操作入力部208は、マウス240等のポインティングデバイスやキーボードを介して、ユーザによる操作を入力する。
【0036】
サンプルファイル209は、サンプルをマーキングする際に行なわれたユーザの操作を、マーキングされたサンプルの識別情報と関連付けてグループデータ293として保持する。すなわち、グループデータ293は、グループごとにマーキングされたサンプルを保持するデータとなっている。サンプルファイル209は、さらに、マーキング前にソート部211が行なったソート処理を、マーキングされたサンプルの識別情報と関連付けてグループデータ293として保持する。
【0037】
サンプルファイル209は、また、マーキングされたサンプルに対して解析部204が行なった解析の結果を、マーキングされたサンプルの識別情報と関連付けて解析結果データ294として保持する。
【0038】
図3は、グループ制御部202の詳細な構成を示すブロック図である。図3に示すように、グループ制御部202は、グループ生成部301とサンプル選択部302とピン付加部303とケース/コントロール設定部304と解析方法設定部305とグループ保存部306とを含む。
【0039】
グループ生成部301は、ユーザの操作に応じて、新規なグループ(サンプル群を選択するための入れ物)を生成する。その際、例えば、グループ1、グループ2といった名称を付ける。表示制御部201では、このグループ生成部301での生成処理に応じて、サンプルリストにグループカラム(図10A、10Bのグループカラム1001)を1つ追加して表示する。
【0040】
サンプル選択部302は、ユーザの操作に応じて、グループ生成部301で生成されたグループに含めるべきサンプルを選択する。そして、ピン付加部303は、サンプル選択部302で選択されたサンプルに対して、表示画面上において選択されたサンプルの横に「ピンを付加する」というグラフィックユーザフェースを用いてマーキングする。このときピン付加部303は、操作入力部208を介して入力したユーザの操作に応じて、サンプル選択部302によって選択されたサンプル群ごとに、異なる色のピンを付加することができる。ここで設定された色のピンは、表示制御部201によって、ディスプレイ230に表示される。カラーピンであることにより、どのサンプルがどの時点でグループとして選択されたものか、ユーザは非常に明確に把握することができる。
【0041】
アプリケーションにおいて、選択状態を表現する場合一般的にチェックボックスあるいは、ラジオボタンなどを使用するが、本実施形態ではピンを使用することにより従来の紙媒体などを使用する際にマーキングをするような直感性を再現できる。表形式の表現の場合に行の背景色を変更しても同様の表現が可能だが、この場合には、表全体の視認性が悪くなる。それと比較して異なる色のピンを使用することで、グルーピング状態を明確に表現でき、表全体の視認性を確保することもできる。また、チェックボックスなどの従来部品と比較して、3グループ以上の複数グループ容易に構成することができる。
【0042】
ケース/コントロール設定部304は、操作入力部208を介して入力したユーザの操作に応じて、異なる色のピンを付加して表示されたサンプル群のうち、症例とすべきサンプル群および対照とすべきサンプル群の選択を設定する。
【0043】
解析方法設定部305は、操作入力部208を介して入力したユーザの操作に応じて、解析方法の選択および閾値(有意水準)の設定を受け付ける。
【0044】
グループ保存部306は、ユーザの操作に応じて、グルーピング履歴を保存する。具体的には、グループ名と、グループに含まれるサンプル群の識別情報と、サンプル群に付加されたピンの色と、各色のピンに対応するケース/コントロールの別と、をサンプルファイル209に保存する。さらにグループ保存部306は、設定された解析方法および閾値(有意水準)およびその解析結果をサンプルファイル209に保存してもよい。
【0045】
図4は、サンプルファイル209に保存されるグルーピング履歴の一例を示す図である。サンプルファイル209は、グループの生成および保存操作が行なわれる回数に応じて複数のグルーピング履歴テーブル401、402、...を保存する。
【0046】
1つのグルーピング履歴テーブル401は、グループ名411、グルーピング作業を行なった日時412、グルーピング作業を行なった担当者413、各色のピンが打たれたサンプルおよびケース/コントロールの別414を含んでいる。また、グルーピング履歴テーブル401は、解析部204が解析した結果としてのバイオマーカー候補となるタンパク質の識別情報417をも含んでいる。
【0047】
このようなグルーピング履歴テーブル401を残すことにより、いつどの作業者が、どのようなサンプルを対象にケース/コントロール解析を行なって、どのような結果が出たかを、後の解析の際に参照することが可能となる。
【0048】
《全体処理の流れおよび表示画面》
次に、バイオマーカー検出装置200で行なわれる処理の流れについて表示画面を参照しつつ説明する。図5は、バイオマーカー検出装置200で行なわれる処理の流れを示すフローチャートである。このフローチャートは、バイオマーカー検出アプリケーションの起動と同時に開始される。具体的にはバイオマーカー検出装置200に含まれるCPUが、ストレージに格納されたバイオマーカー検出アプリケーションを実行することによって開始される。
【0049】
まず、ステップS501において、ユーザがケースコントロール研究用のサンプルファイル209を読み込むと、ステップS503においてサンプルリストをディスプレイ230に表示する。図6は、サンプルファイルを読み込んだ段階でディスプレイ230に表示される画面600を示す図である。図6に示すように、画面600には、読み込んだサンプルファイル名601と、サンプルファイルに含まれるサンプルリスト602と、検査時点でプロテインアレイによって検出可能なプロテインリスト603とが表示される。ここで、サンプルリスト602は、サンプル/属性対応データ291に対応し、プロテインリスト603は、サンプル/プロテイン発現率対応データ292に対応するものである。
【0050】
サンプルリスト602は、サンプルを識別する識別情報としてのサンプルID621、クラス名622、喫煙履歴623、の他、図示はされていないが、年齢、性別、疾病歴、マーカー、投薬の種類、発現率の計測タイミングなど、非常に多くのサンプル属性を表示できる。また、どのようなサンプル属性をこのリスト602に表示するかを自由に設定することができる。サンプルリスト602の表示中に、カラムをドラッグすることにより、カラムの順序を変更することができる。カラム名(属性名)をクリックすれば、その属性内容でソートする。つまり、クラス名622のサンプルの属性部分をクリックすれば、例えば、喫煙履歴623によって全サンプルを整理する。言い換えれば、喫煙履歴のある全サンプルが最上部に固まって表示され、次に、喫煙履歴のないサンプルが下方に固まって表示されるようにサンプルを並び替える。
【0051】
(1次解析手法)
本実施形態に係るシステムでは、グループとして区別されたサンプル群を区別する1次解析の結果として、プロテイン毎のP値711、統計量712、Q値713といった指標を導く。P値(P value)711は、サンプル群同士に差が偶然生じる可能性を示す尺度であり、有意確率とも呼ばれる。Q値(Q value)713は、P値の代わりに用いるために作られた多重検定用の仮説有意性指標である。Q値は、FDR(False Discovery Rate)による補正により得られる。
【0052】
統計量712は、統計学的に算出される確率変数を示す。有限個の標本に基づいて、2つの母集団の確率分布が異なるものであるかどうか、あるいは母集団の確率分布が帰無仮説で提示された分布と異なっているかどうかを調べるために用いられる検定方法である。
【0053】
これらの値がプロテインリストに追加されてリザルトテーブル701が構成される。なお、先に設定された閾値以下の統計値をもつプロテインをバイオマーカー候補として有意と判断し、ピン714を自動的に打つ。
【0054】
(2次解析手法)
本実施形態に係るバイオマーカー検出装置200では、2次解析手法として、主成分分析(PCA)を用いる。
【0055】
主成分分析は、複数の変数間の共分散(相関)を少数の合成変数で説明する手法であり、共分散行列の固有値問題の解として得ることができる。本実施形態では、グルーピング処理で抽出されたサンプルをマッピングすることにより生成された、PCAグラフ702を表示する。また、さらに、プロテインリストに表示されたプロテインをマッピングすることにより生成された、PCAグラフ702を表示する。
【0056】
図示はしていないが、本実施形態では、ヒートマップ解析によって、ケースコントロールを分離するバイオマーカーを見つけてもよい。ヒートマップ解析とは、横軸にタンパク質をとり、縦軸にサンプルとして発現率を色の階調を用いて表現することでサンプル全体の発現率を視覚的に表現する解析方法である。例えば、赤く固まっているところを見ると、そのグループに属する人達がどのタンパク質を多く発現しているか分かる。
【0057】
《グルーピング処理および表示画面》
図8は、グルーピングの詳しい処理の流れを説明するための図である。ステップS801では、グループ制御部202のグループ生成部301が、ユーザの操作に応じて、新規なグループ(サンプル群を選択するための入れ物)を生成する。図9は、グループ生成の際に表示される画面900を示す図である。サンプルリスト602のいずれかのセルで右クリックすることにより、操作リスト901が表示され、その中で「Group」を選択すれば、さらにグルーピング処理リスト902が表示される。グルーピング処理としては、グループ追加(Add)、グループ削除(Remove)、カラムからグループ生成(Create from Column)の3種類の処理を選ぶことができる。
【0058】
ここでユーザがグループ追加(Add)を選択すると、さらに、グループ名設定ダイアログ903が表示され、新規に生成するグループに付けたい名前を入力可能となる。ここで例えば、グループ1、グループ2といった名称を付けることができる。表示制御部201では、このグループ生成部301での生成処理に応じて、図10A、10Bに示すように、サンプルリストにグループカラム1001を追加して表示する。図10Aは、グループに含めるべきサンプルを選択し、ピンを付加する操作を行なう際の画面1000を示す図である。図10Bは、グループ2にピンを付加した状態の画面1010および、グループの削除操作を説明するための図である。
【0059】
ステップS803では、サンプルを選択する。表示制御部201は、選択されたサンプルのセル1002を反転して表示する。選択されたサンプルのセル1002で右クリックされると、表示制御部201は、作業ダイアログ1003を表示し、さらに、そこでピン付加(Pins)が選択されると、色設定ダイアログ1004を表示する。色設定ダイアログ1004には、ピンの色を設定する欄の他、ピンの削除を示すコマンドも用意されている。
【0060】
色設定ダイアログ1004においてピンの色が選択されると、表示制御部201は、その色をもつピンを、選択されたサンプル行における選択されたグループ列のセルに付加する(S805)。これにより図10Bのように新たなピンが付加されたカラム1011が生成される。このようにグループを増やすごとにカラムを増やしていくことができる。したがって、過去にどのようなサンプルを選択して解析を行なったかを一目で把握することができる。なお、いずれかのセルで右クリックをして、Group→Removeを選択すると、グループ全体を削除することができる。
【0061】
図10Aのようにセルを選択してピンを付加する場合の他、図11の画面1100のようにサンプル属性を選択してピンを付加することもできる。サンプルリスト602のいずれかのセルで右クリックすることにより、操作リスト901が表示され、その中で「Group」を選択すれば、さらにグルーピング処理リスト902が表示される。グルーピング処理リスト902における、カラムからグループ生成(Create from Column)を選択すると、グループ生成ダイアログ1101が表示される。
【0062】
このグループ生成ダイアログ1101には、サンプルのクラス名と、それぞれのクラスに含まれるサンプル数が列記される。それぞれのクラス名について、プルダウンリストが用意され、どのクラスにどのピンを打つかを選択できる。例えば、クラス名「Control type 1」の横のプルダウンリストで「PIN A」を選択すれば、喫煙者を表わす全サンプルに、赤いピンが付加される。
【0063】
ピンの付加が終了すると、ステップS807に進み、ケース/コントロール設定処理を行なう。具体的には図11に示すように、画面1101において、まず、任意のセル位置で右クリックされると、作業ダイアログ1003を表示する。作業ダイアログ1003において、解析(Analyze)が選択されると、解析設定ダイアログ1102を表示する。
【0064】
解析設定ダイアログ1102は、解析対象となるグループ選択欄1121と、ピンごとにケース/コントロールを選択するケース/コントロール設定欄1122と、解析方法を選択する解析方法選択欄1123と、解析ボタン1124とを含む。この画面1100では、ピンAとピンBをケースとして、ピンCをコントロールと設定しようとしている。また、解析方法として例としてT-Testが選択されており、その有意水準としての閾値(p値)が0.05と設定されている。この状態で解析ボタン1124が押されると、表示制御部201は、解析の進行状況を示すバーグラフ1103をディスプレイ230に表示する。
【0065】
ステップS811では、解析が終了したグループについての情報を保存する。そのさい、グループ保存部306は、ユーザの操作に応じて、グルーピング履歴を保存する。具体的には、グループ名と、グループに含まれるサンプル群の識別情報と、サンプル群に付加されたピンの色と、各色のピンに対応するケース/コントロールの別と、をサンプルファイル209に保存する。さらにグループ保存部306は、設定された解析方法および閾値(有意水準)およびその解析結果をサンプルファイル209に保存してもよい。なお、設定したグループデータ293の保存は、ユーザからの指示に応じたタイミング行なってもよいし、解析処理を行なったと同時に自動的に行なってもよい。
【0066】
以上の通り、本実施形態によれば、バイオマーカーを特定するために繰り返し行なわれる解析作業のなかで、過去の思考過程の履歴を残して、それを参照することが可能となる。ひいては、より効率的なバイオマーカーの検出作業を行なうことができる。
【0067】
[第3実施形態]
本発明の第3実施形態に係る情報処理装置として、タイムコースビューを利用した投薬タイミング検出装置について説明する。この装置は、第2実施形態で説明したケースコントロール研究用の装置に加えて、サンプル毎の投薬タイミングとプロテインの発現率の時系列的な変化を用いて、バイオマーカーの検出タイミングを導くものである。
【0068】
サンプルデータに、サンプル毎の投薬タイミングとプロテインの発現率の時系列的な変化が含まれている場合、薬の投与が行なわれてからバイオマーカーの発現率の変化をグラフ化することができる。そのグラフをタイムコースビューと呼ぶ。
【0069】
本実施形態によれば、薬の投与に対して、バイオマーカーの反応を検出すべきベストなタイミングを検出することができる。バイオマーカーに反応が見られるサンプル(レスポンダー)とバイオマーカーに反応が見られないサンプル(ノンレスポンダー)を区別することができる。
【0070】
[他の実施形態]
以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
【0071】
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
【特許請求の範囲】
【請求項1】
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理装置であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを取得し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御手段と、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキング手段と、
前記マーキング手段でマーキングされた前記サンプルの識別情報を保持する保持手段と、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補毎の発現率の相違を解析する解析手段と、
を備え、
前記表示制御手段は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持手段が保持する前記識別情報に基づいて、過去にマーキングされた前記サンプルを表示すべく制御することを特徴とする情報処理装置。
【請求項2】
前記マーキング手段は、表示されたサンプル中においてマーキングすべき少なくとも2つのサンプル群の選択を受け付け、
前記表示制御手段は、選択されたサンプル群ごとに異なるピン画像を付加して表示することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記マーキング手段は、前記異なるピン画像を付加して表示されたサンプル群のうち、症例とすべきサンプル群および対照とすべきサンプル群の選択を受け付けることを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記解析手段は、前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとを識別するための前記バイオマーカーを推定し、
前記表示制御手段は、前記解析手段が推定したバイオマーカーを他のバイオマーカー候補とは識別可能に表示することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
【請求項5】
前記マーキング手段は、ユーザの操作に応じて、サンプルをマーキングし、
前記保持手段は、さらに、前記サンプルをマーキングする際に行なわれた前記ユーザの操作を、マーキングされた前記サンプルの識別情報と関連付けて保持することを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
【請求項6】
前記表示制御手段は、リスト表示された前記少なくとも2つのサンプルについて、ユーザに選択された属性に応じて並び替えて表示するソート手段を含み、
前記保持手段は、マーキング前に前記ソート手段が行なったソート処理を、マーキングされた前記サンプルの識別情報と関連付けて保持することを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記マーキング手段は、グループを生成して、グループごとに、サンプルをマーキングし、
前記保持手段は、グループごとにマーキングされたサンプルを保持することを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。
【請求項8】
前記保持手段は、さらに、マーキングされた前記サンプルに対して前記解析手段が行なった解析の結果を、マーキングされた前記サンプルの識別情報と関連付けて保持することを特徴とする請求項1乃至7のいずれか1項に記載の情報処理装置。
【請求項9】
前記バイオマーカーは、プロテイン、遺伝子の一塩基多型、体内の代謝物、金属イオン、伝達物質、補酵素、およびビタミンのうちの少なくともいずれか一つを含むことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
【請求項10】
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理方法であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
を備え、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする情報処理方法。
【請求項11】
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理プログラムであって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
をコンピュータに実行させ、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする情報処理プログラム。
【請求項1】
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理装置であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを取得し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御手段と、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキング手段と、
前記マーキング手段でマーキングされた前記サンプルの識別情報を保持する保持手段と、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補毎の発現率の相違を解析する解析手段と、
を備え、
前記表示制御手段は、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持手段が保持する前記識別情報に基づいて、過去にマーキングされた前記サンプルを表示すべく制御することを特徴とする情報処理装置。
【請求項2】
前記マーキング手段は、表示されたサンプル中においてマーキングすべき少なくとも2つのサンプル群の選択を受け付け、
前記表示制御手段は、選択されたサンプル群ごとに異なるピン画像を付加して表示することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記マーキング手段は、前記異なるピン画像を付加して表示されたサンプル群のうち、症例とすべきサンプル群および対照とすべきサンプル群の選択を受け付けることを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記解析手段は、前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとを識別するための前記バイオマーカーを推定し、
前記表示制御手段は、前記解析手段が推定したバイオマーカーを他のバイオマーカー候補とは識別可能に表示することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
【請求項5】
前記マーキング手段は、ユーザの操作に応じて、サンプルをマーキングし、
前記保持手段は、さらに、前記サンプルをマーキングする際に行なわれた前記ユーザの操作を、マーキングされた前記サンプルの識別情報と関連付けて保持することを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
【請求項6】
前記表示制御手段は、リスト表示された前記少なくとも2つのサンプルについて、ユーザに選択された属性に応じて並び替えて表示するソート手段を含み、
前記保持手段は、マーキング前に前記ソート手段が行なったソート処理を、マーキングされた前記サンプルの識別情報と関連付けて保持することを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記マーキング手段は、グループを生成して、グループごとに、サンプルをマーキングし、
前記保持手段は、グループごとにマーキングされたサンプルを保持することを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。
【請求項8】
前記保持手段は、さらに、マーキングされた前記サンプルに対して前記解析手段が行なった解析の結果を、マーキングされた前記サンプルの識別情報と関連付けて保持することを特徴とする請求項1乃至7のいずれか1項に記載の情報処理装置。
【請求項9】
前記バイオマーカーは、プロテイン、遺伝子の一塩基多型、体内の代謝物、金属イオン、伝達物質、補酵素、およびビタミンのうちの少なくともいずれか一つを含むことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
【請求項10】
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理方法であって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
を備え、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする情報処理方法。
【請求項11】
少なくとも2つのサンプルについて、症例対照研究(case-control study)を利用してバイオマーカーの推定を行なうための情報処理プログラムであって、
前記少なくとも2つのサンプル、各サンプルの属性および各サンプルにおける少なくとも2種類のバイオマーカー候補の発現率を含むデータを入力し、前記少なくとも2つのサンプルおよびその属性をリスト表示するための表示制御ステップと、
表示された前記少なくとも2つのサンプル中において、症例(case)とすべきサンプルと対照(control)とすべきサンプルを識別可能にマーキングするマーキングステップと、
前記マーキングステップでマーキングされた前記サンプルの識別情報を保持する保持ステップと、
前記症例としてマーキングされたサンプルと、前記対照としてマーキングされたサンプルとにおける、前記バイオマーカー候補の発現率の相違を解析する解析ステップと、
をコンピュータに実行させ、
前記表示制御ステップは、新たにマーキングを行なうべきサンプルを選択する際に参照できるように、前記保持ステップが保持する過去にマーキングされた前記サンプルを表示することを特徴とする情報処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図11】
【図12】
【公開番号】特開2013−8215(P2013−8215A)
【公開日】平成25年1月10日(2013.1.10)
【国際特許分類】
【出願番号】特願2011−140665(P2011−140665)
【出願日】平成23年6月24日(2011.6.24)
【出願人】(000004237)日本電気株式会社 (19,353)
【出願人】(000232092)NECソフト株式会社 (173)
【公開日】平成25年1月10日(2013.1.10)
【国際特許分類】
【出願日】平成23年6月24日(2011.6.24)
【出願人】(000004237)日本電気株式会社 (19,353)
【出願人】(000232092)NECソフト株式会社 (173)
[ Back to top ]