RNA-seq解析

RNA-seq解析とは

次世代シーケンサー(NGS)を用いて全転写産物の塩基配列を決定することにより、転写産物量を網羅的に推定できるだけでなく、新規転写産物の探索も可能です。選択したプローブの範囲内でしか変化を検出できないマイクロアレイ法に対して、転写産物を直接シーケンスして発現プロファイルを取得するため、全く予想しなかった発現変化も検出できます。さらに、アレイ法に比べて高発現でも飽和しにくく感度も高いため、ダイナミックレンジが広く高い定量性を持っています。 

弊社受託解析内容、解析例は下記をご覧ください。

用途

  • 既知/新規遺伝子の網羅的発現量推定
  • 発現変動遺伝子(DEG)の抽出
  • 発現変動遺伝子の機能解析(GO解析*1、GSEA*2など)

解析例1   マウス新生児肝臓で出生後に見られる遺伝子発現変化

マウス新生児の肝臓RNA-seqデータを用いて、マッピング、発現量推定、発現変動遺伝子(DEG)抽出、GO解析を行いました。

マッピング結果

マッピング結果

チトクロムP450ファミリー遺伝子(Cyp1a2)に対するマッピングデータを図示しました。出生後0日肝臓由来RNAのリードカウント(目的遺伝子に由来するRNAの断片数に相当)を青で、10日肝臓由来RNAの結果を赤で、それぞれ2例ずつ、また遺伝子の構造を緑で表示しました。横軸は染色体上の位置を示しています。同様に全遺伝子にマップされた断片数を数えて正規化し、網羅的に全転写産物の発現量を推定しました。

発現変動遺伝子抽出結果の一例

gene_ID gene
name
day0
count
day10
count
day0
FPKM
day10
FPKM
fold
change
p value q value
ENSMUSG
00000025347
Mettl7b 27.517 16,700.500 1.013 615.637 607.736 5.000E-05 3.757E-04
ENSMUSG
00000054827
Cyp2c50 3.981 2,333.840 0.105 55.867 532.067 5.000E-05 3.757E-04
ENSMUSG
00000069456
Rdh16 2.555 1,050.840 0.041 13.705 334.268 7.050E-03 2.665E-02
ENSMUSG
00000003053
Cyp2c29 3.626 950.348 0.088 22.878 259.977 1.000E-04 7.026E-04
ENSMUSG
00000067656
Slc22a27 2.444 707.634 0.055 14.063 255.691 3.500E-04 2.134E-03
発現変動遺伝子抽出結果の一例

(Mouse newborn liver, Day0 vs Day10, n = 3)
統計検定によりday10で有意に発現量が増加した遺伝子の一部を図示しました。この表はデータ項目を簡略化してあり、実際の納品データとは様式が多少異なります。

発現変動遺伝子に対するGO解析

発現変動遺伝子に対するGO解析結果

(day10での発現増加率上位200遺伝子に対するGO解析)
Monooxygenase activityに関するGOタームを持つ遺伝子が有意に高い割合で含まれることが分かりました。新生児期にはmonooxygenaseの一種であるチトクロムP450の種類や発現量が大きく変化すると言われており、そのような変化が検出された可能性が考えられます。RNA-seq解析からはこの様に、細胞集団全体で起こった特徴的な変化を事前予測なしに抽出することが可能です。
しかし、試料中に少数しか存在しない細胞で特徴的な変化が起こるような場合には、感度的には検出可能であっても「網羅的に解析する」ことは困難なため、その様な解析には、1細胞ごとに発現プロファイルを取得するSingle Cell RNA-seq解析法が用いられます。Single Cell RNA-seq解析サービスについてはこちらをご覧ください。

解析例2   幹細胞から分化誘導した心房細胞の薬剤処理による遺伝子発現変化

幹細胞の利用方法の一つとして、多能性幹細胞を分化誘導した細胞を用いた創薬スクリーニングの高効率化が期待されています。ibrutinibは有用な経口白血病治療薬ですが、心房細動を増加させる事が知られています。ヒト多能性幹細胞から誘導した心房心筋細胞をibrutinib処理し、RNA-seq解析を実施したデータを使用して、 ibrutinib処理による心房心筋細胞のRNA発現変化を解析しました。

遺伝子発現量推定結果

gene_ID gene_
symbol
description gene_type cont1 cont2 cont3 drug1 drug2 drug3
ENSG
00000000003
TSPAN6 tetraspanin 6 protein_coding 29.06 25.94 29.97 36.7 38.36 34.16
ENSG
00000000005
TNMD tenomodulin protein_coding 10.74 9.78 9.42 14.55 15.54 16.64
ENSG
00000000457
SCYL3 SCY1 like pseudokinase 3 protein_coding 3.38 2.88 3.26 3.95 3.95 3.41
ENSG
00000000938
FGR FGR proto-oncogene protein_coding 0 0 0 0 0 0.03
ENSG
00000000971
CFH complement factor H protein_coding 1.59 1.17 1.65 2.76 1.6 2.35
遺伝子発現量推定結果

薬剤未処理の(cont1〜3)心房心筋細胞と、薬剤処理した細胞(drug1〜3)の遺伝子発現量推定結果の一部を示しました。

発現変動遺伝子抽出結果の一例

gene_ID gene_
symbol
description gene_type avg_cont avg_drug avg_
log2FC
p_value p_adj
ENSG
00000163536
SERPINI1 serpin family I member 1 protein_coding 5.90 27.40 2.04 1.62E-10 5.67E-08
ENSG
00000264558
AC015674.1 novel transcript, antisense to KPNB1 lncRNA 6.99 28.51 1.89 8.42E-10 2.61E-07
ENSG
00000166426
CRABP1 cellular retinoic acid binding protein 1 protein_coding 2.41 9.72 1.65 3.61E-04 2.00E-02
ENSG
00000018625
ATP1A2 ATPase Na+/K+ transporting subunit protein_coding 6.92 22.41 1.56 1.87E-06 2.42E-04
ENSG
00000073737
DHRS9 dehydrogenase/reductase 9 protein_coding 14.79 45.15 1.55 7.83E-11 2.94E-08
発現変動遺伝子抽出結果

薬剤未処理群(cont1〜3)と、処理群(drug1〜3)の発現変動遺伝子の一部を示しました。

ヒートマップによる発現変動遺伝子の可視化

ヒートマップによる発現変動遺伝子の可視化

発現変動遺伝子の発現変化をヒートマップで一覧表示しました。各サンプルの発現量をZ-scoreで標準化し、発現量が多い遺伝子を赤色、少ない遺伝子を青色、中間を白色で表示しました。図の縦軸は遺伝子、横軸はサンプルを表します。

ボルカノプロットによる発現変動遺伝子の可視化

ボルカノプロットによる発現変動遺伝子の可視化

ボルカノプロットで発現変動比と統計的有意差を一覧表示しました。各点は遺伝子を表しています。発現変動比と調整済みp値によって分類し色分け表示しました。

GSEA(Gene Set Enrichment Analysis)

GSEA(Gene Set Enrichment Analysis)

薬剤処理によって発現が増加・減少した遺伝子が特定の遺伝子セットに濃縮しているか、GSEAを用いて解析しました。

特徴

  • 生物学的意義を踏まえたデータ解析
  • 論文、学会発表に使用できる各種グラフの作成まで一貫してサポート
  • スピーディーな解析結果報告(6営業日~、データ解析のみ時)
  • 統計学の専門用語を極力排除した分かり易い説明
  • 解析結果の生物学的解釈のサポート

解析フロー


RNAサンプル mRNA回収

ライブラリ調製

シーケンシング
シーケンスデータ 発現量推定・正規化

発現変動遺伝子抽出

GO解析・GSEA

クラスタリング

ヒートマップ
各種グラフ可視化
解析結果

① RNAサンプルから解析 
② シーケンスデータから解析 

解析フロー

受入物

① RNAサンプルから解析 ② シーケンスデータから解析
受入物 total RNA mRNA シーケンスデータ (FASTQファイル)
受入
条件
必要量
(通常)
20 ng/ul, 50ul以上
(total 1ug以上)
10 ng/ul, 10ul以上
(total 100ng以上)
  • Illumina HiSeqシリーズ
  • Illumina NovaSeqシリーズ
  • PacBio RS II
  • Sequel
※上記のほか、様々なシーケンサーで取得したデータに対応
必要量
(微量)
total 10ng以上推奨
(1ng以上から可)
必要量
(small RNA*)
total 3ug以上
溶媒 TE buffer
エタノール沈殿 (3ug以上の場合可)
品質 RIN** > 7
28S rRNA : 18S rRNA = 2 : 1 ratio
ご注意
事項
  • FFPEサンプルも解析可能ですが、サンプル状態により解析できない場合がございます。
  • サンプル量、品質等の問題により、解析をお引き受けできない場合がございます。
以下の情報をお知らせください
  • シーケンサー機種
  • ライブラリ調製キット名
  • リード数、リード長
  • シングルエンド or ペアエンド
その他の
留意点
  •   small RNA-seqでターゲットとするRNAサイズについて、22bp前後か、より長いサイズ(〜100bp)も含むかを予めお知らせ下さい。
  •  RIN(RNA Integrity Number)の測定は2100 Bioanalyzerが推奨ですが、測定装置がない場合はご相談ください。

解析フロー

解析内容

mRNAシーケンシング

・網羅的なmRNAの塩基配列決定
・mRNAの網羅的な発現量推定、発現差解析に最適(別途データ解析)

【 解析内容 】
・検体の受入検査(RNA量、濃度、純度、分解の有無)
・ライブラリ調製
・シーケンシング

【 解析条件 】
・検体受入検査 : Agilent Bioanalyzer / TapeStation
・シーケンサー : Illumina Novaseq / HiSeq
・シーケンス  : 100bp、ペアエンド、4,000万リード(4Gb/検体)




Total RNAシーケンシング

・網羅的なmRNA、lncRNA等のnoncoding RNAの塩基配列決定
・分解が進んだtotal RNAからのmRNAの塩基配列決定
・mRNA、lncRNA等のnoncoding RNAの発現量推定、発現差解析に最適(別途データ解析)

【 解析内容 】
・検体の受入検査(RNA量、濃度、純度、分解の有無)
・rRNA除去
・ライブラリ調製
・シーケンシング

【 解析条件 】
・検体受入検査 : Agilent Bioanalyzer / TapeStation
・シーケンサー : Illumina Novaseq / HiSeq
・シーケンス  : 100bp、ペアエンド、4,000万リード(4Gb/検体)




標準データ解析1

・発現量推定が目的で、安価に解析したい場合にお勧めです。
・k-mer countingにより発現量を推定
・既知遺伝子、転写産物の発現量推定
・マッピングの可視化が不要な場合に最適
・他の解析でBAMファイルを使用しない場合に推奨
・mRNAおよびTotal RNAシーケンシングのデータに対応
・レファレンスはトランスクリプトーム

【 解析内容 】
・データ受入検査(データ量、シーケンス品質、アダプタ配列の有無等)
・不要な配列のトリミング
・k-mer counting
・発現量推定・正規化
・発現変動遺伝子抽出(DEG抽出、発現比較解析)




標準データ解析2

・発現量推定が目的で、マッピングの可視化が必要な場合にお勧めです。
・参照ゲノム配列にマッピングし発現量を推定
・既知遺伝子、転写産物の発現量推定
・他の解析でBAMファイルを使用する場合に推奨
・mRNAおよびTotal RNAシーケンシングのデータに対応
・レファレンスはゲノム

【 解析内容 】
・データ受入検査(データ量、シーケンス品質、アダプタ配列の有無等)
・不要な配列のトリミング
・マッピング
・発現量推定・正規化
・発現変動遺伝子抽出(DEG抽出、発現比較解析)

価格・納期

mRNAシーケンシング

・価格  :  ¥60,000  →  ¥39,000
・検体数 :  4検体以上
・納期  :  お問い合わせ下さい
・納品方法:  ダウンロード納品




Total RNAシーケンシング

・価格  :  ¥60,000  →  ¥55,000
・検体数 :  4検体以上
・納期  :  お問い合わせ下さい
・納品方法:  ダウンロード納品




標準データ解析1

・価格  :  ¥40,000  →  ¥20,000
・検体数 :  4検体以上
・納期  :  6営業日~
・納品方法:  ダウンロード納品




標準データ解析2

・価格  :  ¥60,000  →  ¥35,000
・検体数 :  4検体以上
・納期  :  6営業日~
・納品方法:  ダウンロード納品




※表記価格はすべて税抜価格です。
※多検体の場合は割引致しますのでご相談下さい。

サービスの流れ

こちらをご覧ください。

ご注文方法

こちらよりお問い合わせください。

ご注意事項

受入データを品質検査した結果、解析をお引き受けできない場合があります。

参考文献

Sumedha S. Gunewardena et al. “Deciphering the Developmental Dynamics of the Mouse Liver Transcriptome.” PLoS One. 2015 Oct 23;10(10) e0141220. doi: 10.1371/journal.pone.0141220.

Shafaattalab, S. et al. “Ibrutinib Displays Atrial-Specific Toxicity in Human Stem Cell-Derived Cardiomyocytes.” Stem Cell Reports 12, 996–1006 (2019). doi: 10.1016/j.stemcr.2019.03.011.

*1  Gene Ontology
*2  Gene Set Enrichment Analysis