シングルセルRNA-seq解析

Single Cell RNA-seq解析とは

近年の急速な分析技術の進歩により、細胞や分子の性質を、集団の平均値としてではなく、一つひとつの細胞や分子の個性を維持したまま解析することが可能になりました。
シングルセルRNA-seq解析では細胞集団の転写産物を1細胞ごとに網羅的に解析します。そのため、細胞集団を構成する細胞がどう分類できるかが未知のままでも、細胞集団を亜集団にクラスタリングして特徴を抽出することが可能です。
平均値の解析(通常のRNA-seq解析)では他の大多数の細胞のシグナルに埋もれて検出が困難な、少数の細胞からなる亜集団における発現変化も検出可能です(解析例参照)。また、発生過程や細胞リプログラミング過程における細胞系譜(cell lineage)を詳細に追跡できます(Treutlein et al.)。

弊社受託解析内容、解析例は下記をご覧ください。

用途

  • 1細胞レベルでの遺伝子発現解析
  • 細胞集団の異質性(heterogeneity)評価
  • 細胞亜集団の検出
  • 多数の細胞中に混在する少数細胞の発現プロファイルの取得
  • 細胞種推定*1(未知の細胞種検出を含む)
  • 擬似時間解析(pseudotime解析)による細胞系譜の追跡

解析例1   細胞集団のクラスタリング・発現変動遺伝子抽出

ヒト末梢血単核細胞(リンパ球、単球などを含む血球細胞)のsingle-cell RNA sequenceデータより、細胞亜集団の検出、発現プロファイルの取得、発現変動遺伝子(DEG)の抽出を行いました。

クラスタリング結果 (t-SNE, 7,768 cells)

クラスタリング結果 (t-SNE, 7,768 cells)

  1.  1,404  cells
  2.  1,315  cells
  3.  1,138  cells
  4.     976  cells
  5.     941  cells
  6.  1,206  cells
  7.     313  cells
  8.     178  cells
  9.     176  cells
10.       63  cells
11.       58  cells

PCA(主成分分析)により、高次元のデータ(ベクトル)である発現プロファイルを、情報のロスを極力抑えつつ低次元に変換しました。クラスタリング結果をt-SNEにより二次元マップに可視化しました。  

1. 1,404 cells 2. 1,315 cells 3. 1,138 cells
4. 976 cells 5. 941 cells 6. 1,206 cells
7. 313 cells 8. 178 cells 9. 176 cells
10. 63 cells 11. 58 cells

PCA(主成分分析)により、高次元のデータ(ベクトル)である発現プロファイルを、情報のロスを極力抑えつつ低次元に変換しました。クラスタリング結果をt-SNE法により二次元マップに可視化しました。  

各クラスタの発現変動遺伝子(Heatmap)

各クラスタの発現変動遺伝子(Heatmap)

各クラスタで特徴的な遺伝子をヒートマップを用いて可視化しました。 横軸は各クラスタに、縦軸は遺伝子に対応しています。発現量が多い遺伝子は赤、少ないものは黒で示しました。

各クラスタの発現変動遺伝子抽出結果の一例

各クラスタの発現変動遺伝子抽出結果の一例

cluster gene
name
avg.exp
cluster
avg.exp
remaining
cells
log FC p value adjusted
p value
positive
in
cluster
positive
in
remaining
1 TCF7 2.9000235 1.1752915 0.5838199 3.4624E-92 6.3501E-88 0.635 0.354
2 CD14 6.0921281 0.2035910 1.7736759 0 0 0.845 0.070
3 GZMA 8.7835287 1.2861432 1.4538340 1.5491E-154 2.8410E-150 0.823 0.150
4 CD8A 3.0751674 0.5950137 0.9380295 7.2640E-193 1.3322E-188 0.714 0.133
5 IL7R 7.2638716 2.2841786 0.9227766 1.1034E-146 2.0237E-142 0.844 0.405
6 MS4A1 10.2329692 0.1779526 2.2550753 0 0 0.949 0.067
7 GNLY 83.1126526 2.1016837 3.3002119 2.4085E-91 4.4172E-87 0.971 0.200
8 FCGR3A 17.0271784 0.5237682 2.4706942 3.3787E-61 6.1966E-57 0.989 0.094
9 FCER1A 10.6528753 0.0987991 2.3613351 1.4347E-30 2.6313E-26 0.903 0.032
10 IRF7 16.4655939 0.3493973 2.5605748 8.1822E-182 1.5006E-177 0.984 0.138
11 PPBP 39.6762577 0.1345125 3.5794415 5.3095E-12 9.7376E-08 0.655 0.017
cluster クラスタ番号
gene name 遺伝子名
avg.exp cluster 該当クラスタのすべての細胞における各遺伝子の平均発現量
avg.exp remaining cells 該当クラスタ以外のすべての細胞における各遺伝子の平均発現量
log FC 発現変動比
p value 統計的有意差の指標
adjusted p value 補正した統計的有意差の指標
positive in cluster 該当クラスタ内で発現している細胞の割合
positive in remaining 該当クラスタ以外のすべての細胞の内、発現している細胞の割合

各クラスタに特徴的な発現変動遺伝子の一部を列挙しました。この様にsingle-cell RNA-seq解析では、細胞集団の組成に関する事前情報なしにクラスタリングし、特徴的な遺伝子の発現変化を抽出する事ができます。

各遺伝子の発現分布

各遺伝子の発現分布

特徴的な遺伝子の発現分布を図示しました。クラスタに特徴的な遺伝子、複数のクラスタで高発現している遺伝子を視覚的に確認できます。この様な発現プロファイルをもとに、各クラスタの細胞種を推定することも可能です。

解析例2   遺伝子ノックアウトにより異常を生じる少数細胞の発現変動遺伝子抽出

遺伝子Xのノックアウトによって異常が見られる部位になる領域を、野生型(WT)およびノックアウト(KO)マウス胚より取り出しSingle-cell RNA sequenceを行ったデータを解析しました。細胞亜集団の検出、細胞種推定、WTとKOにおける発現変動遺伝子(DEG)の抽出を行いました。

クラスタリング結果(t-SNE)

クラスタリング結果(t-SNE)

PCA(主成分分析)により発現プロファイルの次元削減を行い、クラスタリング結果をtSNEにより可視化しました。左図はWT、KO毎に、右図はクラスタ毎に図示しました。

各クラスタの細胞種推定結果

各クラスタの細胞種推定結果

発現変動遺伝子、細胞種マーカー遺伝子、GO解析等の機能解析結果より総合的に判断し、各クラスタの細胞種を推定し図示しました。Cell type AがKOマウスの表現型の異常に関与すると推定された細胞種です。

野生型とノックアウトにおける発現変動遺伝子の発現分布の一例

野生型とノックアウトにおける発現変動遺伝子の発現分布の一例

WTとKOにおいて、発現変動した遺伝子の一部を図示しました。ほとんどの細胞種で大きな変化は見られませんが、Cell type Aでは、複数の遺伝子に顕著な発現変動が確認できました。これらの発現変動遺伝子の一部はKOマウスの表現型に深く関わっている可能性が考えられます。この様にSingle-cell RNA-seq解析では、一部の細胞でしか起こっていない変化を鋭敏に検出することが可能です。

特徴

  • 各種のシングルセル化法、ライブラリ調整法によるサンプルのシーケンスデータに対応
    (10X Genomics社 Chromiumシステム*2、Fluidigm社 C1システム*3等)
  • 専用ツールでは解析が難しいデータでも、各データに応じた解析手法で解析
  • GO解析*4、GSEA*5等の機能解析を始め、投稿論文、学会発表用の作図まで一貫してサポート
  • スピーディーな結果報告(11営業日~)

解析フロー


シーケンス生データクオリティコントロールマッピング発現量推定・正規化特徴遺伝子抽出次元削減クラスタリング発現変動遺伝子抽出細胞種推定*1

heatmap

納期・価格

ご依頼の解析内容により異なりますので、詳細はこちらよりお問い合わせください。

受入データ

  • シーケンスデータ (FASTQファイル)
  • もしくは
  • シーケンスデータ (BCLファイル、Sample sheet)
  • ※ 10X Genomics社 Chromiumシステム™*²で調製したサンプルの場合はこちらも受入可能。

サービスの流れ

こちらをご覧ください。

ご注文方法

こちらよりお問い合わせください。

ご注意事項

受入データを品質検査した結果、解析をお引き受けできない場合があります。

技術セミナー

無料のオンサイト技術セミナーを開催中です。開催をご希望の方はこちらよりご連絡ください。

参考文献

Treutlein et al. “Dissecting direct reprogramming from fibroblast to neuron using single-cell RNA-seq” Nature vol.534, 391–395, 2016. doi: 10.1038/nature18323.

*1  別途ご相談ください。データにより解析できない場合があります。
*2  ChromiumシステムTMは、10X Genomics社の登録商標です。
*3  C1システムは、Fluidigm社の登録商標です。
*4  Gene Ontology
*5  Gene Set Enrichment Analysis