Access Agilent 2016年9月号

がん研究の複雑なオミクスの統合を
可能にするマルチオミクス解析

Shweta Shukradas Agilent Bioinformatics Product Manager
Carolina Livi Agilent Academic Segment Manager, Disease Research and Toxicology

近年、生物学の研究にマルチオミクス解析が行われています。このため、ゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクスの実験で得られる、ますます大量かつ複雑なデータセットの解析は大きな課題となっています。マルチオミクスデータを統合的に解析することで、ボトルネックを大幅に軽減し、個々の実験では見過ごされがちな貴重な情報を得ることができます。近年、Agilent GeneSpring Integrated Biology ソフトウェア (Mass Profiler Professional および Pathway Architect を含む) によるマルチオミクスデータセットの統合解析の成果が報告されています。この記事では、解析例を取り上げ、いくつかの重要な発見を紹介します。

図 1. SRL 処理 4 時間後の MAPK シグナル伝達パスウェイ。黄色で塗られた遺伝子は、発現が変動していることを示しています。各エンティティの横にある棒グラフは、各タイムポイントでの遺伝子発現レベルを示しています。

図 1. SRL 処理 4 時間後の MAPK シグナル伝達パスウェイ。黄色で塗られた遺伝子は、発現が変動していることを示しています。
各エンティティの横にある棒グラフは、各タイムポイントでの遺伝子発現レベルを示しています。

キュレーションされたパスウェイ解析による
mRNA と miRNA の関係の研究

転写レベルでの生物学的に重要な知見を得るには、mRNA や miRNA などのノンコーディング RNA の発現を解析することが重要です。結腸癌細胞株 (HT29) における SRL のアポトーシス効果、すなわちスクレロチウム属菌で生成されるレクチンを、パスウェイおよび相関解析を使用して転写レベルの統合解析をしました [1]。

分裂促進因子活性化タンパク質キナーゼ (Mitogen activated protein kinase; MAPK) 遺伝子は、SLR 処理後の早い段階で、顕著に発現変動しました (図 1)。MAP3K14 と DUSP1 も早い段階で発現上昇した遺伝子です。また、MAP3K4 と ATF2 は SRL 処理後 2 時間で発現抑制されました。この結果は、SRL によるアポトーシスの誘導が、MAP キナーゼパスウェイに属するホスファターゼとキナーゼの相互作用に起因していることを示しています。

図 2. A) 4 時間後に発現が変動した MAPK mRNA および miRNA の相関パターンを示す相関解析。B) JUN と hsa-miR-487b の関係を示すスキャッタープロット。

図 2. A) 4 時間後に発現が変動した MAPK mRNA および miRNA の相関パターンを示す相関解析。B) JUN と hsa-miR-487b の関係を示すスキャッタープロット。

図 3. Agilent GeneSpring による TCGA の mRNA 発現データより同定された、54 のタンパク質に基づくコントロール (E) および腫瘍 (T) サンプルの比較。A) サンプル間の相関性 B) PCA

図 3. Agilent GeneSpring による TCGA の mRNA 発現データより同定された、54 のタンパク質に基づくコントロール (E) および腫瘍 (T) サンプルの比較。A) サンプル間の相関性 B) PCA

相関解析により、遺伝子発現の miRNA への依存性が明らかに

miRNAによって、ターゲットの mRNA とそれにより生じるタンパク質のレベルが低下する場合があります。このため、miRNA の発現レベルと推定ターゲット遺伝子間には、逆相関の関係があると予測されます。このことは、発現差解析とシーケンスベースの miRNA ターゲット予測 (GeneSpring プラットフォームでも利用可能) に加えて、別なフィルタリングも可能としています。

アジレントのマイクロアレイを用いた、SRL 処理/未処理の HT29 細胞の経時的な遺伝子発現データセット (mRNA および miRNA を含む) を、相関解析ツールを使いマルチオミクス解析 (multi-omic analysis; MOA) を行いました。Agilent GeneSpring/MPP では、mRNA/miRNA のような 2 種類の異なるテクノロジーを使った 2 つの実験データの相関解析が可能です。図 2A は、SRL 処理の 4 時間後に、発現が変動した miRNA および MAPK 遺伝子の相関性をヒートマップとして示しています。図 2B のスキャッタープロットは、JUN および hsa-miR-487b の発現の相関性を示しています。この相関性より、JUN が miR-487b miRNA のターゲット遺伝子であることが推測されます。

多形性膠芽腫 (GBM) における
重要な遺伝子およびタンパク質の同定

GeneSpring/MPP は、遺伝子発現やプロテオミクスデータセットなど、さまざまなオミクス実験の解析をサポートしています。GBM は、ゲノミクスプロファイリングをする以前は、適切に分類されていなかった脳腫瘍です。この検証では、The Cancer Genome Atlas (TCGA) から入手できるマイクロアレイベースの遺伝子発現データを利用しました。この遺伝子発現データを Agilent GeneSpring にインポートして得られる結果を、GBM サンプルのプロテオミクスの小規模な解析に利用しました。GeneSpring/MPP での相関解析ツールを用いて、ゲノミクスとプロテオミクスのデータセットを比較したところ、重要と考えられる 54 の遺伝子とタンパク質を同定しました (図 3) [2]。さらに、同定された遺伝子、タンパク質から同様な挙動を示す 840 の遺伝子と 587 のタンパク質を示すことができ、Agilent GeneSpring でのマルチオミクスデータ解析における有用性を示しました。これらの結果から、GBM 腫瘍の不均一性は、重要と考えられる遺伝子の mRNA およびタンパク質の量によって、特徴付けられることが示唆されます。これらの見解は、この統合的アプローチを用いた 今後の研究に可能性を広げます。


図 4. A) 有糸分裂期のパスウェイ (Wiki パスウェイポータル由来WP190_81191) に重ね表示した、マウス細胞株の自発的な二倍体化におけるコピー数変化および発現レベル。B) パスウェイでのデータ重ね表示のカラー設定。遺伝子発現データのキルトプロットは青色のバー、CGH 実験のキルトプロットは濃い黄色で示されています。C) A) で示したパスウェイの拡大図。遺伝子 Tbc1d8は 2 回の実験で二倍体にはコピー数変化はなく、中程度の発現レベルを示しています。一倍体の実験 1 は発現が低くコピー数の欠失を示した一方、実験 2 ではコピー数が減少しているにもかかわらず、高い発現が示されています (濃い赤色で表示)。

図 4. A) 有糸分裂期のパスウェイ (Wiki パスウェイポータル由来WP190_81191) に重ね表示した、
マウス細胞株の自発的な二倍体化におけるコピー数変化および発現レベル。B) パスウェイでのデータ重ね表示のカラー設定。
遺伝子発現データのキルトプロットは青色のバー、CGH 実験のキルトプロットは濃い黄色で示されています。C) A) で示したパスウェイの拡大図。
遺伝子 Tbc1d8は 2 回の実験で二倍体にはコピー数変化はなく、中程度の発現レベルを示しています。
一倍体の実験 1 は発現が低くコピー数の欠失を示した一方、実験 2 ではコピー数が減少しているにもかかわらず、高い発現が示されています (濃い赤色で表示)。

GeneSpringでコピー数解析も可能に

研究者は Agilent GeneSpring GX のCGHワークフローによって、遺伝子発現データと CGH データを統合的に解析できます。このワークフローでは、Agilent Cytogenomics ソフトウェアまたは Agilent Genomic Workbench (AGW) のレポートから、CGH のログ比の平均 (Average CGH Log Ratio; 平均 CGHLR) およびヘテロ接合性の消失 (Loss of Heterozygosity; LOH) のスコアを取り込むことができます。その結果、データの視覚化、生物学的なつながり、および、マルチオミクス解析が容易になります。この機能を試すため、NCBI Gene Expression Omnibus (GEO) の CGH およびマウスの遺伝子発現マイクロアレイデータセットを GeneSpring GX にインポートして、統合的に解析しました。この研究は、C57BL/6 または BDF1 F1 のハイブリッドマウスから作製された単為生殖半数体 ES 細胞 (phESC) に対する Wee1 阻害剤 (PD166285) の影響、および、マウスの胚性幹細胞 (mESC) との比較を検証しています [3]。豊富なアノテーションを用い、Agilent GeneSpring GX で、コピー数変化と発現プロファイリングの情報を簡単に統合できます。このデータは、キュレーションされたパスウェイや文献由来のネットワークなどのデータを統合するためのツールにより、簡単に統合できます。パスウェイにデータを重ね表示することで、複雑なバリエーションをヒートマップ、棒グラフ、およびキルトプロットの形式で幅広く視覚化できます (図 4 A~C を参照)。

Agilent GeneSpring ソフトウェアは、
複雑なデータセットも簡単に統合

ここまで、 Agilent GeneSpring ソフトウェアでの相関解析ツール、わかりやすく視覚化したパスウェイ表示を用いて、より一般的なバイオインフォマティクス解析を行う方法について、3 つの例を紹介しました。これらのツールによって、研究者は、関連する遺伝子、代謝物、タンパク質を直観的かつ簡単に同定することが可能になります。その他の例および関連資料については、アジレントのゲノミクス製品の担当者(email_japan@agilent.com または0120-477-111)にお問い合わせください。

本資料掲載の製品は、すべて研究用です。その他の目的にはご利用になれません。

参考文献

  1. Gene Expression and miRNA Study to Understand Signaling Pathways Inducing Apoptosis in Human Colon Cancer HT29 Cells, Agilent Technologies, Application Note, publication number 5991-6377EN, (2016).
  2. Molecular Subtypes in Glioblastoma Multiforme: Integrated Analysis Using Agilent GeneSpring and Mass Profiler Professional Multi-Omics Software, Agilent Technologies, Application Note, publication number 5991-5505EN, (2016).
  3. Working with CGH data in Agilent GeneSpring GX, Agilent Technologies, Technical Overview, publication number 5991-7289EN (2016).