説明

ゲノム情報と臨床情報との統合データベースシステム、および、これが備えるデータベースの製造方法

【課題】ゲノム情報の提供者を特定不可能であるというガイドラインを遵守しつつ、従来とは逆に、ゲノム情報を臨床情報データベースへ取り込むことによって、ゲノム情報と臨床情報との関連性等を容易に検索することを可能とした統合データベースシステムを提供する。
【解決手段】複数の患者の臨床情報10aと、前記複数の患者の少なくとも一部の患者のゲノム情報10cとを記憶するデータ記憶部を含む情報データベース10を備え、前記データ記憶部において、前記臨床情報10aは、患者個人を特定可能な個人情報を含まず、かつ、同じ患者のゲノム情報10cと臨床情報10aとが、当該患者個人を特定不可能なリンク情報10bによって関連付けられて記憶されている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ゲノム情報を臨床情報データベースに取り込むことにより、ゲノム情報と臨床情報との関連性等を容易に検索することを可能とした統合データベースシステムと、この統合データベースシステムが備えるデータベースの製造方法とに関する。
【背景技術】
【0002】
近年、ヒトゲノムや様々な生物のゲノム解析が行われ、ヒトのゲノム塩基配列の全てが既に決定されている。さらに、ゲノム解析によって得られたゲノム情報を、疾病の予防、診断、治療、あるいは、創薬に応用するための研究が進んでいる。そのため、ゲノム情報データベースに臨床情報を統合することにより、特定の遺伝子と特定の症例との関連性を探ることが可能なゲノム情報データベースも構築されている(非特許文献1,2)。
【非特許文献1】Hamosh A, Scott AF, Amberger J, Valle D, McKusick VA, Online Mendelian Inheritance in Man (OMIM), Hum Mutat 15 (2000), pp.57-61
【非特許文献2】Stenson P.D., Ball E.V., Mort M., Phillips A.D., Shiel J.A., Thomas N.S., Abeysinghe S., Krawczak M., Cooper D.N., Human Gene Mutation Database (HGMD), Hum Mutat 21 (2003), pp.577-581
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記従来のデータベースのように、ゲノム情報データベースに臨床情報を統合して得られるデータベースでは、ある特定の疾患に関連する遺伝子を同定するためには、膨大なデータ量を有する臨床情報データベースから、研究者がその遺伝子に関連性がありそうな疾病の罹患者の情報を選択し、ゲノム情報データベースに入力する作業を行う必要があった。このような臨床情報の選択は、研究者の勘に頼ることが多く、試行錯誤を必要とする。このため、上記従来のデータベースにおいては、臨床情報を研究者が選択して入力するために手間を要し、遺伝子の同定を効率的に行うことができない、といった問題があった。
【0004】
また、ゲノム情報の取り扱いに関しては、ゲノム情報またはその検体に関する情報と、その提供者の情報とをリンクできないようにしなければならないというガイドラインが制定されている。これは、ゲノム情報は、その提供者にとってプライバシーレベルが極めて高い情報であるからである。このため、臨床情報の選択と入力との作業負担を軽減するためには、従来とは逆に、臨床情報データベースへゲノム情報を取り込めば良いのであるが、上記のガイドラインを遵守するためには、ゲノム情報の提供者を特定できないようにするための工夫が必要とされる。
【0005】
そこで、本発明は、ゲノム情報の提供者を特定不可能であるというガイドラインを遵守しつつ、従来とは逆に、ゲノム情報を臨床情報データベースへ取り込むことによって、ゲノム情報と臨床情報との関連性等を容易に検索することを可能とした統合データベースシステムを提供することを目的とする。また、この統合データベースシステムが備えるデータベースの製造方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記の目的を達成するために、本発明にかかる、ゲノム情報と臨床情報との統合データベースシステムは、複数の患者の臨床情報と、前記複数の患者の少なくとも一部の患者のゲノム情報とを記憶するデータ記憶部を含むデータベースを備え、前記データ記憶部において、前記臨床情報は、患者個人を特定可能な個人情報を含まず、かつ、同じ患者のゲノム情報と臨床情報とが、当該患者個人を特定不可能なリンク情報によって関連付けられて記憶されていることを特徴とする。
【0007】
この統合データベースシステムのデータベースは、例えば、電子カルテシステムの臨床データのレプリカである臨床情報に、当該臨床情報の少なくとも一部の患者のゲノム情報をインポートすることによって、構築することができる。これにより、操作者が臨床情報の取捨選択を行う手間を省くことができ、豊富な臨床データを利用して、特定の疾患等に影響のある遺伝子を効率的に同定することが可能となる。また、臨床情報が患者個人を特定可能な個人情報を含まず、かつ、同一患者の臨床情報とゲノム情報とが、患者個人を特定不可能なリンク情報によって関連付けられていることにより、この統合データベースシステム上でゲノム情報の提供者を特定することができないので、ゲノム情報の提供者の匿名性が確保されている。
【0008】
また、上記の目的を達成するために、本発明にかかるデータベースの製造方法は、複数の患者の臨床情報と、前記複数の患者の少なくとも一部の患者のゲノム情報とをデータ記憶部に記憶したデータベースの製造方法であって、複数の患者の臨床情報を、各患者に固有の患者識別情報と共に入力し、データ記憶部に記憶する工程と、前記患者識別情報を、所定の変換情報に基づいて、各患者個人を特定不可能なリンク情報に置換する工程と、前記複数の患者の少なくとも一部の患者のゲノム情報を、当該ゲノム情報の検体の提供者を特定可能なゲノム管理情報と共に入力し、データ記憶部に記憶する工程と、前記ゲノム管理情報と前記患者識別情報との対応情報と、前記所定の変換情報とに基づいて、前記ゲノム管理情報を前記リンク情報に置換する工程と、前記臨床情報から、各患者個人を特定可能な個人情報を削除する工程と、前記ゲノム管理情報と前記患者識別情報との対応情報と、前記所定の変換情報とを破棄する工程とを含むことを特徴とする。
【0009】
上記の方法によれば、データベースは、例えば電子カルテシステムの臨床データのレプリカである臨床情報に、当該臨床情報の少なくとも一部の患者のゲノム情報をインポートすることによって、構築される。これにより、操作者が臨床情報の取捨選択を行う手間を省くことができ、豊富な臨床データを利用して、特定の疾患等に影響のある遺伝子を効率的に同定することが可能なデータベースを構築できる。また、臨床情報が患者個人を特定可能な個人情報を含まず、かつ、同一患者の臨床情報とゲノム情報とが、患者個人を特定不可能なリンク情報によって関連付けられており、ゲノム管理情報と患者識別情報との対応情報と、変換情報とは破棄されていることにより、このデータベースの情報からゲノム情報の提供者を特定することは不可能である。これにより、ゲノム情報の提供者の匿名性が確保されたデータベースを構築することができる。
【発明の効果】
【0010】
本発明によれば、ゲノム情報の提供者を特定不可能であるというガイドラインを遵守しつつ、従来とは逆に、ゲノム情報を臨床情報データベースへ取り込むことによって、ゲノム情報と臨床情報との関連性等を容易に検索することを可能とした統合データベースシステムを提供できる。また、この統合データベースシステムが備えるデータベースの製造方法を提供できる。
【発明を実施するための最良の形態】
【0011】
以下、本発明にかかるゲノム情報と臨床情報との統合データベースシステムの一実施形態を例示し、その構成および動作について、図面を参照しながら説明する。
【0012】
図1は、本発明の一実施形態にかかる統合データベースシステムの機能的概略構成を示すブロック図である。図1に示すように、本実施形態にかかる統合データベースシステム1は、少なくとも、情報データベース10、検索条件設定部11、検索実行部12、データベース更新処理部13、表示処理部14を備えている。なお、本実施形態にかかる統合データベースシステム1は、少なくとも情報データベース10をサーバ側に有するクライアント−サーバシステムとして実現することも可能であるが、1台のパーソナルコンピュータ上の非常にコンパクトなシステムとしても実現することが可能である。以下では、本実施形態にかかる統合データベースシステム1を、パーソナルコンピュータで実現する例について説明する。
【0013】
情報データベース10は、パーソナルコンピュータが備えるハードディスクや、パーソナルコンピュータに装着される各種の記憶媒体上に構築される。検索条件設定部11、検索実行部12、データベース更新処理部13、表示処理部14は、パーソナルコンピュータのプロセッサが、必要なタイミングにおいて所定のプログラムを実行することによって実現される機能ブロックである。つまり、これらの機能ブロックは、個別のハードウェア要素として実装されることを要しない。検索条件設定部11は、パーソナルコンピュータの入出力インタフェースを利用して、情報データベース10に対する検索条件を利用者に設定させる機能を有する。検索実行部12は、検索条件設定部11によって設定された検索条件に従って、情報データベース10に対する検索処理を行い、検索条件に応じた情報を抽出する。データベース更新処理部13は、臨床情報またはゲノム情報の更新が必要となった場合に、外部から必要な情報を取り込んで、情報データベース10の内容を更新する。表示処理部14は、パーソナルコンピュータのディスプレイに対して、検索条件の設定画面や検索結果の表示画面等の表示を指示する。
【0014】
また、図1に示すように、情報データベース10には、多数の患者に関する臨床情報10aが含まれている。ゲノム情報10cは、前記多数の患者の一部から提供された検体から得られたゲノム情報である。なお、現状では、ゲノム情報の解析には膨大な費用と時間とを要するが、将来的にゲノム情報の解析が容易になった場合は、情報データベース10に記憶されている臨床情報10aの患者の全てに関してゲノム情報10cを記憶することも考えられる。
【0015】
臨床情報10aは、例えば病院の電子カルテシステム等の臨床データのレプリカ(コピー)から生成される。臨床情報10aの元となる電子カルテシステム上の臨床データは、患者の病名、検査情報、投薬情報、経過情報等の疾患に関する種々のデータの他に、患者個人を特定可能な個人情報として、患者氏名、住所、電話番号、病院で使用されている患者コード、健康保険証番号等も含む。しかし、統合データベースシステム1の臨床情報10aでは、患者個人を特定できないようにするため、これらの個人情報は全て削除されている。
【0016】
ゲノム情報10cは、統合データベースシステム1とは独立したゲノム情報データベースからインポートされる。ゲノム情報データベースにおいては、ゲノム管理番号によって各検体の提供者を特定可能であるが、統合データベースシステム1では提供者個人を特定できないようにするため、ゲノム情報10cのゲノム管理番号は削除されている。その代わりに、統合データベースシステム1内の臨床情報10aとゲノム情報10cとは、この統合データベースシステム1で独自に付与されるリンク情報10bによって、同じ患者の臨床情報10aとゲノム情報10cとが関連付けられている。
【0017】
リンク情報10bは、例えば、電子カルテシステムの患者コードを所定の変換規則によって変換することによって生成されるが、統合データベースシステム1上のリンク情報10bだけからは元の患者コードを得ることが不可能な、または、極めて困難であって事実上不可能な、変換規則が用いられる。例えば、患者コードをランダムな番号に変換する変換テーブルを変換規則として用い、変換後のランダムな番号をリンク情報10bとして用いることが考えられる。また、リンク情報10bを生成する際に用いられた変換規則(上記の例では変換テーブル)は、統合データベースシステム1からは破棄され、統合データベースシステム1外で第三者によって厳重に管理される。
【0018】
このように、統合データベースシステム1においては、(1)臨床情報10aが、患者個人を特定可能な個人情報を含まないこと、(2)ゲノム情報10cが、検体の提供者を特定可能なゲノム管理番号を含まないこと、および、(3)同じ患者の臨床情報10aとゲノム情報10cとは、統合データベースシステム1内で独自に付与されるリンク情報10bによって関連付けられていること、の3つの条件によって、ゲノム情報10cの提供者の匿名性が確保される。
【0019】
なお、図1においては、臨床情報10a、リンク情報10b、ゲノム情報10cとを概念的に示したが、情報データベース10内に格納される際の、これらの情報のデータ構造およびファイル構成は任意である。なお、情報データベース10への臨床情報10a、リンク情報10b、ゲノム情報10cの格納および更新は、データベース更新処理部13によって行われる。
【0020】
ここで、図2を参照しながら、統合データベースシステム1においてデータベース更新処理部13が行う情報データベース10の構築・更新処理の手順について説明する。なお、以下では、情報データベース10を新たに構築する場合の処理手順を説明するが、新しい臨床情報またはゲノム情報を用いて情報データベース10を更新する場合も、基本的には下記の処理手順と同じ手順に準じて更新処理がなされる。
【0021】
データベース更新処理部13は、最初に、統合データベースシステム1の外部の電子カルテシステムから、臨床データをコピーする(ステップS1)。臨床データには、多数の患者について、患者の病名、検査情報、投薬情報、経過情報等の疾患に関する種々のデータの他に、患者個人を特定可能な個人情報として、例えば、患者氏名、住所、電話番号、病院で使用されている患者コード、健康保険証番号等も含まれる。なお、電子カルテシステムから統合データベースシステム1への臨床データのコピーは、電子カルテシステムと統合データベースシステム1とを通信回線で接続することによってオンラインで行っても良いし、記録媒体を介してオフラインで行っても良い。電子カルテシステムから受け取った臨床データは、臨床情報10aとして情報データベース10に格納される。
【0022】
次に、データベース更新処理部13は、臨床データに含まれる患者コードを、所定の変換規則を用いて、この統合データベースシステム1において独自に用いられるリンク情報10bに変換する(ステップS2)。例えば、上述のように、患者コードをランダムな番号に変換する変換テーブルを変換規則として用い、変換後のランダムな番号をリンク情報10bとして用いることが考えられる。これにより、情報データベース10の臨床情報10aに、患者コードの代わりにリンク情報10bが付与される。上記の変換テーブル等の変換規則は、第三者によって管理され、統合データベースシステム1において情報データベース10の構築・更新を行う場合にのみ、前記第三者の許可を得て、統合データベースシステム1において参照することができる。
【0023】
次に、データベース更新処理部13は、統合データベースシステム1の外部のゲノム情報データベースから、ゲノム情報をインポートする(ステップS3)。ゲノム情報のインポートも、ゲノム情報データベースと統合データベースシステム1とを通信回線で接続することによってオンラインで行っても良いし、記録媒体を介してオフラインで行っても良い。インポートされたゲノム情報10cは、情報データベース10に格納される。ただし、この時点におけるゲノム情報10cには、ゲノム情報の検体の提供者を特定可能なゲノム管理番号が含まれている。
【0024】
次に、データベース更新処理部13は、インポートしたゲノム情報10cのゲノム管理番号を、リンク情報10bに変換する(ステップS4)。このため、データベース更新処理部13は、まず、ゲノム管理番号と、電子カルテシステムで用いられている患者コードとの対応表を参照し、ゲノム管理番号を患者コードに一旦変換する。なお、ゲノム管理番号と患者コードとの対応表は、例えば、ゲノム解析を行った機関、またはゲノム情報データベースの作成者が、管理者として厳重管理しており、統合データベースシステム1において情報データベース10の構築・更新を行う場合にのみ、前記管理者の許可を得て、統合データベースシステム1において参照することができる。さらに、データベース更新処理部13は、ステップS2で用いた変換テーブルを参照し、上述のようにゲノム管理番号から変換された患者コードを、さらにリンク情報10bに変換する。これにより、ゲノム情報10cに含まれていたゲノム管理番号は、当該ゲノム情報10cの検体の提供者と同一人物の臨床情報10aに対してステップS2で付与されたものと同じリンク情報10bに置換される。
【0025】
次に、データベース更新処理部13は、電子カルテシステムから受け取った臨床データから、患者個人を特定可能な個人情報を削除する(ステップS5)。ここで削除される個人情報としては、患者氏名、住所、電話番号、FAX番号、メールアドレス、勤務先名称、健康保険証番号等が挙げられる。なお、ここでは、ステップS1〜S4の後に、個人情報を削除するものとしたが、ステップS1において電子カルテシステムから臨床データをコピーする際に、電子カルテシステム側であらかじめこれらの個人情報を削除するようにしても良い。
【0026】
最後に、データベース更新処理部13は、ステップS2で用いた変換テーブル(変換規則)と、ステップS4で用いた対応表とを、統合データベースシステム1から削除する(ステップS6)。
【0027】
以上の処理により、電子カルテシステムの臨床データとゲノム情報データベースのゲノム情報とに基づいて、統合データベースシステム1の情報データベース10を構築・更新することができる。
【0028】
上述のとおり、情報データベース10の臨床情報10aは、複数の患者に関する臨床データを含んでいる。また、情報データベース10のゲノム情報10cは、前記複数の患者の少なくとも一部の患者から得られたゲノム情報を含んでいる。従って、この情報データベース10に対して、ゲノム情報に関する条件を設定して、ゲノム情報が登録されている患者のみを対象とした検索と、ゲノム情報に関する条件を設定しないで、全患者を対象とした検索との両方を行うことが可能である。このため、これらの検索結果を比較することにより、精度の高い検証が可能となる。
【0029】
ここで、統合データベースシステム1における検索処理の具体例について、図3〜図9を参照しながら以下に説明する。
【0030】
まず、第一の具体例として、CYP2C19の遺伝子型の違いによる、PPI(プロトンポンプ阻害薬)の投与による副作用発生状況の確認を行う場合について説明する。CYP2C19の遺伝子型(RM、IM、PM)とPPIの投与状況、副作用(肝障害等)の発生状況(特定の検査値異常)を検索条件に設定し、情報データベース10の検索を行い、この検索条件に該当した患者数を比べることで、遺伝子型と副作用発生との関係を調べる。つまり、CYP2C19の遺伝子型毎の患者数比率と、CYP2C19の遺伝子型毎の副作用の発生患者数との比率が異なる場合には、遺伝子型と副作用発生との間に関連性があると考えられる。例えば、CYP2C19の遺伝子型毎の患者数比率が、RM:IM:PM=100:100:100であるのに対して、CYP2C19の遺伝子型毎の副作用の発生患者数比率が、RM’:IM’:PM’=2:4:8となった場合には、遺伝子型毎の患者数に比べて遺伝子型毎の副作用発生患者数に偏りがあるため、遺伝子型と副作用発生との関連性が疑われる。一方、副作用発生患者数比率が、例えば、RM’’:IM’’:PM’’=5:4:5のような値となった場合は、遺伝子型の違いと副作用発生との関連性は低いと考えられる。
【0031】
なお、CYP2C19の遺伝子型における上記のRMは、Rapid metabolizerの略であり、代謝が早い人はこの遺伝子型を有していることが分かっている。また、このRMは、ゲノム情報10cにおいては、*1/*1と表記されている。同じく、CYP2C19の遺伝子型におけるIM(Intermediate metabolizer)は、代謝が中間の人の遺伝子型であり、ゲノム情報10cにおいては、*1/*2または*1/*3と表記される。さらに、CYP2C19の遺伝子型におけるPM(Poor metabolizer)は、代謝が遅い人の遺伝子型であり、ゲノム情報10cにおいては、*2/*2、*2/*3、または*3/*3と表記される。
【0032】
検索条件の設定は、検索条件設定部11によって行われる。検索条件設定部11は、表示処理部14へ指示を出すことにより、例えば図3に示すような検索条件設定画面をディスプレイに表示させる。図3の検索条件設定画面は、検索対象とするゲノム情報を設定するための画面である。ここで、操作者は、画面上部右側のサブウィンドウでCYP2C19を表示させ、さらにこのCYP2C19の遺伝子型を表示させていずれかを選択することにより、検索条件に追加することができる。つまり、検索条件設定部11は、ゲノム情報10cとして情報データベース10に登録されているゲノム情報の全てを、図3の検索条件設定画面の上部右側のサブウィンドウに表示し、操作者にいずれかの遺伝子型を選択させる。図3の例では、操作者によってCYP2C19の遺伝子型のうちRM(*1/*1))が選択され、検索条件に追加されている。選択された検索条件は、検査宇条件設定部11および表示処理部14により、画面下部のサブウィンドウに表示される。
【0033】
次に、検索条件設定部11は、検索対象とする臨床情報を設定するための検索条件設定画面をディスプレイに表示させる。図4の例は、臨床情報の一つとして、投与薬剤を検索条件として設定させるための画面である。図4の画面の上部右側のサブウィンドウには、PPI(プロトンポンプ阻害薬)のリストが表示され、操作者は、リストから希望の薬剤を選択して検索条件に追加することができる。また、図5は、臨床情報の一つとして、検査値を設定するための検索条件設定画面である。図5の検索条件設定画面では、画面上部左側のサブウィンドウにおいて検査名の検索文字列(ここではGPT)を入力すると、画面上部右側のサブウィンドウに、検索文字列に該当する検査名称が表示される。ここで、操作者がいずれかの検査名称を選択すると、中段のサブウィンドウに、検査コードおよび検査名称と、検査値の単位、標準値などが表示される。また、操作者は、この中段のサブウィンドウ内において、検索対象とする異常値の範囲を指定することができる。中段のサブウィンドウにおいて異常値の範囲を指定すると、下段のサブウィンドウに、検索条件が表示される。図5の例では、「GOT(AST)が100以上」と「GPT(ALT)が100以上」という2つの検索条件がOR条件として指定されている。なお、複数の条件をAND条件等で指定することも、もちろん可能である。
【0034】
以上のようにして、検索条件の設定が終わると、操作者は、検索条件設定画面に表示されている検索実行ボタンをクリックする。これにより、検索実行部12が、設定された検索条件に従って、情報データベース10に対する検索処理を実行する。この検索結果に基づき、検索実行部12は、例えば図6に示すような、上述の検索条件に合致する患者の臨床情報から必要事項を抜粋して示す検索結果画面を生成し、表示処理部14を介してディスプレイに表示させる。なお、図6の検索結果画面において、「患者番号」として表示されている番号が、上述のように、統合データベースシステム1において独自に付与されたリンク情報10bである。
【0035】
その後、操作者は、CPYP2C19の遺伝子型の条件を変えながら検索を繰り返すことにより、条件毎の該当患者数から、遺伝子型と副作用との関係性を考察することができる。
【0036】
また、第二の具体例として、MDR1の遺伝子型の違いによる、癌発生状況の確認について説明する。MDR1(P-糖タンパク)に存在する3箇所の遺伝的単塩基多型(MDR1 1236、MDR1 2677、MDR1 3435)の遺伝子型と、癌の発生状況(病名、検査値等)とを検索条件に設定して情報データベース10の検索を行い、遺伝子型毎に、条件に該当した患者数を比べることで、遺伝子型と癌発生状況との関係性を調べることができる。つまり、MDR1の遺伝子型毎の患者数比率と、該当患者数の比率が異なる場合には、遺伝子型と癌発生状況との間に関連性があると考えられる。なお、MDR1 1236には、C/C、C/T、T/Tの型がある。MDR1 2677には、G/G、G/A、G/T、A/A、A/T、T/Tの型がある。MDR1 3435は、C/C、C/T、T/Tの型がある。
【0037】
まず、検索条件設定部11は、検索対象とする遺伝子型を設定するための検索条件設定画面をディスプレイに表示させる。図7の検索条件設定画面は、操作者が、MDR1の遺伝子型として、MDR1 1236 (C/C)を選択して検索条件に追加した状態を表している。
【0038】
次に、検索条件設定部11は、検索対象とする臨床情報を設定するための検索条件設定画面をディスプレイに表示させる。図8の検索条件設定画面は、操作者が、病名条件として、ICD10分類の「腎尿路の悪性新生物」を選択して検索条件に追加した状態を表している。
【0039】
以上の検索条件を設定した後、操作者が検索実行ボタンをクリックすることにより、検索実行部12が情報データベース10の検索を行い、その結果を、図9に示すような検索結果画面に表示する。操作者は、以降、MDR1の遺伝子型の条件を変えた検索を繰り返し行い、条件毎の該当患者数から、関係性を考察することができる。
【0040】
以上のとおり、本実施形態にかかる統合データベースシステム1によれば、電子カルテシステムの臨床データのレプリカである臨床情報にゲノム情報をインポートしたことにより、豊富な臨床データを利用して、特定の疾患等に影響のある遺伝子を効率的に同定することが可能となる。
【0041】
また、本実施形態にかかる統合データベースシステム1の情報データベース10は、電子カルテの臨床データのレプリカを臨床情報10aとして有しているが、患者個人を特定可能な個人情報を含まず、かつ、同一患者の臨床情報10aとゲノム情報10cとを、統合データベースシステム1にて独自に付与したリンク情報10bによって関連付けている。このため、統合データベースシステム1上でゲノム情報10cの提供者を特定することができないので、ゲノム情報10cの提供者の匿名性が確保されている。
【0042】
なお、上記の実施形態において示した表示画面は、あくまでも一例である。本発明の実施時における画面表示態様は、これらの具体例に限定されない。また、ゲノム情報のフォーマットも、本実施形態において示した例に限定されない。
【産業上の利用可能性】
【0043】
本発明は、ゲノム情報と臨床情報との関連性等を容易に検索することを可能とした統合データベースシステムとして、産業上の利用が可能である。
【図面の簡単な説明】
【0044】
【図1】本発明の一実施形態にかかる統合データベースシステムの機能的概略構成を示すブロック図である。
【図2】上記統合データベースシステムにおけるデータベースの構築・更新処理の手順を示すフローチャートである。
【図3】上記統合データベースシステムにおける検索条件設定画面の一例を示す説明図である。
【図4】上記統合データベースシステムにおける検索条件設定画面の一例を示す説明図である。
【図5】上記統合データベースシステムにおける検索条件設定画面の一例を示す説明図である。
【図6】上記統合データベースシステムにおける検索結果画面の一例を示す説明図である。
【図7】上記統合データベースシステムにおける検索条件設定画面の一例を示す説明図である。
【図8】上記統合データベースシステムにおける検索条件設定画面の一例を示す説明図である。
【図9】上記統合データベースシステムにおける検索結果画面の一例を示す説明図である。
【符号の説明】
【0045】
1 統合データベースシステム
10 情報データベース
10a 臨床情報
10b リンク情報
10c ゲノム情報
11 検索条件設定部
12 検索実行部
13 データベース更新処理部
14 表示処理部

【特許請求の範囲】
【請求項1】
複数の患者の臨床情報と、前記複数の患者の少なくとも一部の患者のゲノム情報とを記憶するデータ記憶部を含むデータベースを備え、
前記データ記憶部において、前記臨床情報は、患者個人を特定可能な個人情報を含まず、かつ、同じ患者のゲノム情報と臨床情報とが、当該患者個人を特定不可能なリンク情報によって関連付けられて記憶されていることを特徴とする、ゲノム情報と臨床情報との統合データベースシステム。
【請求項2】
前記データ記憶部に対する検索条件を設定するための検索条件設定部と、
前記検索条件設定部によって設定された検索条件に従って、前記データ記憶部に対して検索を実行する検索実行部とをさらに備えた、請求項1に記載の統合データベースシステム。
【請求項3】
複数の患者の臨床情報と、前記複数の患者の少なくとも一部の患者のゲノム情報とをデータ記憶部に記憶したデータベースの製造方法であって、
複数の患者の臨床情報を、各患者に固有の患者識別情報と共に入力し、データ記憶部に記憶する工程と、
前記患者識別情報を、所定の変換情報に基づいて、各患者個人を特定不可能なリンク情報に置換する工程と、
前記複数の患者の少なくとも一部の患者のゲノム情報を、当該ゲノム情報の検体の提供者を特定可能なゲノム管理情報と共に入力し、データ記憶部に記憶する工程と、
前記ゲノム管理情報と前記患者識別情報との対応情報と、前記所定の変換情報とに基づいて、前記ゲノム管理情報を前記リンク情報に置換する工程と、
前記臨床情報から、各患者個人を特定可能な個人情報を削除する工程と、
前記ゲノム管理情報と前記患者識別情報との対応情報と、前記所定の変換情報とを破棄する工程とを含むことを特徴とする、データベースの製造方法。
【請求項4】
前記複数の患者の臨床情報を電子カルテシステムから取得する、請求項3に記載のデータベースの製造方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate