A single-cell survey of small intestinal epithelium

マウス

すべてのマウス作業は、Institutional Animal Care and Use Committees (IACUC) とブロード研究所とマサチューセッツ工科大学の関連ガイドラインに従い、それぞれプロトコル 0055-05-15 と 0612-058-18 で実施された。 すべての実験について、マウスは、ジャクソン研究所(Bar Harbour)から入手した7〜10週齢の雌または雄の野生型C57BL/6JまたはLgr5-EGFP-IRES-CreERT2(Lgr5-GFP)マウスまたはGfi1beGFP/+(Gfi1b-GFP)マウス43の性別および年齢を一致させてから治療群にランダムに割り当てた。 マウスは、Broad Institute、Massachusetts Institute of TechnologyまたはHarvard T. H. Chan School of Public Healthの動物施設において、特定の病原体を含まない条件で飼育した。

Salmonella腸炎およびH. polygyrusの感染について。 C57BL/6J マウス(Jackson Laboratory)に、Massachusetts General Hospital(Charlestown)の特定病原体非存在下で維持されているH. polygyrusの第3期幼虫200匹またはSalmonella Enterica 108匹を、プロトコール2003N000158で感染させた。 H. polygyrusは、以前に記載されたように増殖させた44。 マウスは H. polygyrus 感染後 3 日および 10 日目に安楽死させた。 Salmonella Entericaについては、以前に記載したように、S. Typhimuriumの天然ストレプトマイシン耐性SL1344株(108個)にマウスを感染させ、感染後48時間で安楽死させた。

細胞解離とクリプト分離

クリプトの分離。 C57BL/6J野生型、Lgr5-GFPまたはGfi1b-GFPマウスの小腸を単離し、冷PBSで洗浄した。 組織を縦に開き、長さおよそ2mmの小片にスライスした。 この組織を20 mM EDTA-PBS中で氷上で90分間、30分ごとに振盪しながらインキュベートした。 その後、組織を激しく振盪し、上清を新しいコニカルチューブにフラクション1として回収した。 組織を新しいEDTA-PBSでインキュベートし、30分ごとに新しいフラクションを回収した。 上清がほぼクリプトだけで構成されるまで、フラクションを回収した。 最終画分(陰窩に富む)をPBSで2回洗浄し、300gで3分間遠心し、TrypLE express(Invitrogen)で37℃、1分間解離させた。 その後、単細胞懸濁液を 40-μm のフィルターに通し、scRNA-seq 用の FACS に染色するか(下記)、オルガノイド培養に使用した。 我々は、追加の単細胞分離法-「全体」(上皮内層を掻き取る)または「絨毛強化型」(画分1;上記参照)をテストして、この方法の頑健性を確認し、有糸分裂後の分化細胞(その主成分は成熟腸細胞)の高い死亡率(アノイキスによる)のおかげで、クリプト強化型単細胞懸濁液が小腸細胞のタイプの組成を忠実に表していることがわかった(データは示されていない)。

濾胞関連上皮の単離。 C57Bl/6JまたはGfi1beGFP/+マウスの小腸からパイエル板を含む小切片(0.2-0.5cm)を抽出し、濾胞関連上皮の上皮細胞を単離した。

セルソーティング

プレートベースの全長scRNA-seq実験では、FACSマシン(Astrios)を使用して、1%の2-メルカプトエタノールを含むTCLバッファーを5μl含む96ウェルPCRプレートの各ウェルに単一細胞をソーティングした。 EpCAM+の分離のために、細胞を7AAD- (Life Technologies), CD45- (eBioscience), CD31- (eBioscience), TER-119- (eBioscience), EpCAM+ (eBioscience); 特定の上皮細胞については、CD24+/- (eBioscience) と c-Kit+/- (eBioscience) も染色した。 特定の腸管上皮細胞集団を濃縮するために、Lgr5-GFPマウスから細胞を分離し、上記の抗体で染色し、GFP-high (幹細胞), GFP-low (TA), GFP-/CD24+/c-Kit+/- (分泌系) または GFP-/CD24-/EpCAM+ (上皮細胞)のゲーティングをした。 より良いPaneth細胞の回収のために、CD24+/c-Kit+と組み合わせて、より高いside scatterおよびforward scatterパラメータを許可し、EpCAM+細胞でのPaneth細胞の回収を検証した。 tuft-2の分離のために、3つの異なるマウスからの上皮細胞を上記と同様に染色したが、EpCAM+/CD45+を用いて2,000個の単一細胞をソートした。

完全長scRNA-seqのソーティングでは、96ウェルプレートをマイクロシールFでしっかり密封し、800gで1分間遠心分離しました。 プレートはすぐにドライアイスで凍結し、ライセートクリーンアップの準備が整うまで-80℃で保存した。 バルク集団の細胞は、1% 2-メルカプトエタノールを含むTCLの100μl溶液を含むエッペンドルフチューブにソーティングし、-80℃で保存した。

液滴ベースのscRNA-seqでは、細胞をプレートベースのscRNA-seqと同じパラメータでソートしたが、50μlの0.4%BSA-PBSを含むエッペンドルフチューブにソートし、GemCode単一細胞プラットフォームに進むまで氷上に保存した

プレートベースscRNA-seq

単一細胞の場合。 SMART-Seq2プロトコルを改変してライブラリーを作成した16。 簡単に言うと、RNA溶解液のクリーンアップはRNAClean XPビーズ(Agencourt)を用いて行い、その後、Maxima Reverse Transcriptase(Life Technologies)による逆転写、KAPA HotStart HIFI 2 × ReadyMix(カパバイオシステムズ)による21サイクルの全反復増幅(WTA) を行った。 WTA産物はAmpure XP beads (Beckman Coulter) で精製し、Qubit dsDNA HS Assay Kit (ThermoFisher) で定量し、高感度DNAチップ (Agilent) で評価した。 RNA-seq ライブラリーは、Nextera XT DNA Library Preperation Kit (Illumina) を用いて、精製したWTA産物から構築した。 各プレートにおいて、集団および無細胞のコントロールは、単一細胞の場合と同じ方法で処理した。 ライブラリーはIllumina NextSeq 500でシーケンスされた。 バルク集団サンプルは、メーカーの推奨に従ってRNeasy Plus Micro Kit(Qiagen)でRNAを抽出し、上記のようにライセートクリーンアップ後に修正SMART-Seq2プロトコルを進めることで処理した。

ドロップレットベースscRNA-seq

単細胞はGemCode Gel Bead, Chip and Library Kits (10X Genomics, Pleasanton)を用いて、メーカーのプロトコルに従ってGemCode Single Cell Platformで処理された。 簡単に説明すると、単一細胞を0.4% BSA-PBSにソーティングした。 6,000個の細胞を各チャンネルに添加し、平均回収率は1,500個であった。 その後、GemCode装置で細胞をエマルジョン中のGel Beadsに分配し、細胞溶解とRNAのバーコード逆転写を行い、増幅、せん断、5′アダプターおよびサンプルインデックスの装着を行った。 ライブラリーはIllumina NextSeq 500で配列決定された。

免疫蛍光法とsmFISH

免疫蛍光法。 小腸組織の染色は、以前に記載したように実施した34。 簡単に言えば、組織をホルマリンで14時間固定し、パラフィンに包埋し、5μm厚の切片に切り出した。 切片は標準的な手法で脱パラフィンし、一次抗体とともに4℃で一晩インキュベートし、次に二次抗体とともに室温で30分間インキュベートした。 スライドはSlowfade Mountant + DAPI (Life Technologies, S36964)でマウントし、密封した。 RNAScope Multiplex Flourescent Kit (Advanced Cell Diagnostics)を製造者の推奨に従って使用し、以下の変更を加えた。 ターゲット回収の煮沸時間を12分に調整し、40℃でのProtease IVとのインキュベーションを8分に調整した。 スライドはSlowfade Mountant+DAPI (Life Technologies, S36964)でマウントし、封をした。

免疫蛍光とsmFISHを組み合わせた。 これは、まず上記のようにsmFISHを実施し、以下の変更を加えることで実施した。 Amp4の後、組織切片を洗浄バッファーで洗浄し、一次抗体とともに4℃で一晩インキュベートし、1×TBSTで3回洗浄し、二次抗体とともに室温で30分間インキュベートした。 スライドはSlowfade Mountant + DAPI (Life Technologies, S36964)でマウントし、封をした。

画像解析

組織切片の画像は、カルマンとシーケンシャルレーザー発光を用いてノイズと信号重複を減らし、共焦点顕微鏡 Fluorview FV1200で撮影された。 スケールバーは共焦点ソフトウェアFV10-ASW 3.1 Viewerを使用して各画像に追加した。 画像はImage Jソフトウェア45を用いて重ね合わせ、可視化した。

抗体およびプローブ

腸オルガノイド培養

クリプトの分離後、1μM Jagged-1 peptide (Ana-Spec) とともに、Maturigel (BD Bioscience) 中に単細胞懸濁液を再懸濁させた。 25μlのMatrigelに包埋した約300個のクリプトを24ウェルプレートの各ウェル上に播種した。 固化したら、マトリゲルを、ストレプトマイシン/ペニシリンおよびグルタミン酸を含み、EGF(100ng ml-1、Peprotech)、R-スポンディン-1(600ng ml-1、R&D) で補った600μl培養液中でインキュベートした。 noggin(100ngml-1、Prepotech)、Y-276432二塩酸一水和物(10μM、Tochris)、N-アセチル-1-システイン(1μM、Sigma-Aldrich)、N2(1X、Life Technologies)、B27(1X、Life Technologies)およびWnt3A(25ng ml-1 、R&D Systems). 3日目に新鮮な培地を交換し、TrypLEによる解離でオルガノイドを継代し、6日目に新しいマトリゲルに1:3の分割比率で再懸濁させた。 特定の実験では、オルガノイドをRANKL(100 ng ml-1、Biolegends)で追加処理した。

定量的PCR

全長ベースのscRNA-seqプレートからtuft-1、tuft-2およびランダムEpCam+の16個の全トランスクリプトーム増幅単一細胞のcDNAを相対qPCRに使用しました。 遺伝子発現は、以下のプライマーセットを用いてLightCycler 480 SYBR green mix(Roche)を用いてLightCycler 480 Instrument II(Roche)上で定量的リアルタイムPCRにより分析した。 HPRT1-F, GTTAAGCAGTACAGCCAAA; HPRT1-R, AGGGCATATCCAACAAACTT; UBC-F, CAGCCGTATCTTCCCAGACT; UBC-R, CTCAGAGGGATGCCAGTAATCTA; tslp-F, TACTCTCAATCCTATCCCTGCTGG.TACTCTCAATCCTACACAACAACGCTG。 Tlsp-R,CCATTTCCTGAGTACCGTCATTTC;Alpi-F,TCCTACCTCCATTCTATGG,Alpi-R,CCGCCTGCTGTGTAG;Dclk1-F,GGTGAGAACCATCTACCATC;Dclk1-R,CCAGCTTCTTAAAGGCTCGAT…。 qPCRプライマーは、すべての転写産物においてエクソン-エクソン境界を考慮して設計された。

計算機解析

液滴ベースのscRNA-seqデータの前処理。 10X Genomics社が提供するCellranger toolkit(バージョン1.0.1)を用いて、de-multiplexing、mm10 transcriptomeへのアライメント、ユニーク分子識別子(UMI)-collapsingが行われた。 各細胞について、少なくとも1つのリードがマッピングされた遺伝子数を定量し、検出された遺伝子が800個未満の細胞はすべて除外した。 細胞jにおける遺伝子iの発現値Ei,jは、遺伝子iのUMIカウントを細胞jのUMIカウントの合計で割り、カバレッジの違いを正規化した後、10,000倍してTPM的値を作成し、最後にlog2(TPM + 1)を計算することにより求めた。 バッチ補正は、Rパッケージsva47に実装されているComBat46を使用し、デフォルトのパラメトリック調整モードを使用して実施した。

変動遺伝子の選択は、対数空間における変動係数の二乗と平均発現量の関係に一般化線形モデルをフィットさせ、フィットした曲線から有意に乖離(P < 0.05 )する遺伝子を選択することで行った48。 BAMファイルは、イルミナ提供のBcl2Fastqソフトウェアパッケージv2.17.1.14を使用して、マージされた非多重化FASTQに変換された。 Bowtie49のパラメータ ‘-q –phred33-quals -n 1 -e 99999999 -l 25 -I 1 -X 2000 -a -m 15 -S -p 6’ で、ペアエンドリードをUCSC mm10 mouseのトランスクリプトームにマップした。 遺伝子の発現量は、RSEM50 v1.2.3がペアエンドモードで算出したTPM値を用いて定量した。 各細胞について、少なくとも1つのリードがマッピングされた遺伝子数を定量し、検出された遺伝子が3,000個以下か、トランスクリプトームマッピングが40%以下の細胞をすべて除外した。

PCAとt-SNEを用いた次元削減を行った。 発現行列を上述の変動遺伝子および高品質細胞のサブセットに制限し、主成分分析(PCA)に入力する前に値を中心化および尺度化しました。この分析は、SMART-seq2データセットに対してstatsパッケージのR関数prcompを用いて実施されました。 液滴ベースのデータセットでは、PCAのランダム化近似を使用し、rsvd Rパッケージのrpca関数を使用して実装し、パラメータkは100に設定しました。 この低ランク近似は、非常に広い行列に対して数桁の計算速度があるため使用されました。 多くの主成分が分散のほとんどを説明しないことを考えると,n個の「有意な」主成分のサブセットを選択することによって,信号対雑音比を大幅に改善することができる. PCAの後、有意な主成分は、jackstraw RパッケージのpermutationPA関数を用いて実装された並べ換え検定51を用いて同定されました。 この検定により、図1bの10Xデータセットおよび拡張データ図2aのSMART-Seq2データセットで、それぞれ13および15の有意な主成分が同定されました。

可視化のために、データセットの次元は、t-SNE52,53の「Barnes-hut」近似バージョンを使用してさらに削減された。

拡散マップを用いた細胞分化軌道の特定

拡散マップ次元削減を実行する前に、以下のようにデータ内の変動性の高い遺伝子を選択した。 まず、過去の研究54と同様に、変動係数とすべての発現遺伝子のUMIカウントの平均値との間のべき乗関係を用いて、データ中のベースライン細胞間遺伝子発現変動に対するヌルモデルを適合させた。 次に、各遺伝子について、観測された変動係数の値とヌルモデルで予想される値との差(CVdiff)を計算した。 CVdiffのヒストグラムは「太い」テールを示した。 この分布の平均μと標準偏差σを計算し、CVdiff > μ + 1.67σ の遺伝子をすべて選択し、761遺伝子をさらに解析にかけた。

拡散マップアプローチによる次元削減を行った22。 簡単に説明すると、各細胞の局所近傍にカーネル幅を調整したガウスカーネルを用いて、細胞-細胞遷移行列を計算した55。 この行列は正規化した後、マルコフ行列に変換された。 この行列の右固有ベクトル vi (i = 0, 1, 2, …) を計算し、固有値 λi (i = 0, 1, 2, …) の小さい順に並べ替え、λ0 = 1 に対応する「トップ」固有ベクトル v0 を除外した(これはマルコフ行列の正規化制約を反映したものである)。 残りの固有ベクトルvi (i = 1, 2, …) は拡散マップの埋め込みを定義し、拡散成分 (DCk, k = 1, 2, …) と呼ばれる。

汚染免疫細胞とダブレットの除去

配列決定前にEpCAMを用いて細胞をソーティングしたが、10Xデータセットでは少数の汚染免疫細胞が観察された。 これらの264個の細胞は、極めて明確なクラスタを形成していたため、最初の教師なしクラスタリング(Rパッケージfpcのdbscan56を用いたt-SNEマップの密度ベースのクラスタリング)で除去された。 SMART-Seq2データセットでは、いくつかの細胞がライブラリの複雑さの点で異常値であり、これはおそらくシーケンスライブラリごとに複数の個々の細胞(「doublets」)に対応する可能性があります。

クラスター解析

発現によって単一細胞をクラスタリングするために、単一細胞CyTOFデータ57およびscRNA-seq10に対するアプローチに従って、Infomapグラフクラスターアルゴリズム9に基づく教師なしクラスターリングアプローチを使用しました。 簡単に説明すると、各細胞のペアについて、有意な主成分のスコア間のユークリッド距離を用いて、データ上にk-最近傍グラフを構築し、k個の最近傍を同定した。 パラメータkは、データセットのサイズと一致するように選択された。 具体的には、7,216細胞の液滴ベースのデータセット(図1b)および1,522細胞のSMART-Seq2データセット(拡張データ図2a)では、kはそれぞれ200および80に設定されました。 RANKL処理オルガノイドは5,434個の細胞を含み、kは200に設定され、SalmonellaおよびH. polygyrusデータセットは9,842個の細胞を含み、kは500に設定されています。 細胞タイプ内のクラスター分析、特に腸内分泌および房細胞サブセットについては、ユークリッド距離の代わりにピアソン相関距離を使用し、腸内分泌サブタイプ(533細胞)についてはk = 15、k = 30およびk = 40、10XおよびSMART-Seq2データセットの166および102房細胞についてはそれぞれ設定されました。 最近傍グラフは、Rパッケージccdの関数nngを使用して計算されました。

検出されたクラスターは、腸管上皮細胞サブタイプの既知のマーカーを使用して、細胞タイプまたは中間状態にマッピングされた。 (

検出されたクラスターは、腸管上皮細胞のサブタイプの既知のマーカーを用いて、細胞タイプまたは中間状態にマッピングされた(拡張データ図1g、拡張データ図2a)。 腸内分泌(EEC)細胞サブ解析(図3)では、有意な主成分スコア間の平均ペアワイズ相関がr > 0.85 のEEC前駆クラスターは、4つのクラスターに統合されました。 これらの4つのクラスターを、Ghrlが高レベルであることに基づいて前駆細胞「A」、幹(Slc12a2、Ascl2、Axin2)および細胞周期遺伝子が減少し、既知のEEC制御因子(Neurod1、Neurod2、Neurog3)が増加することに基づいて前駆(早期)、(中間)、(後期)(この順序で)のラベルを付けた(拡張データ図5c、補足表6)。 SMART-Seq2データセットについては、幹細胞マーカー遺伝子を高レベルで発現する2つのクラスター(拡張データ図2a)をマージして「幹」クラスターを形成し、他の2つのクラスターをマージして「TA」クラスターを形成した。

4,700個の細胞からなる毛包関連上皮データセットのクラスター分析では、微小な細胞は非常にまれ(0.38%)であり、このデータセットでは経験的にk-最近傍グラフアルゴリズムよりも優れたパフォーマンスを示したため、ClusterDP法58を使用して識別した。 k-nearest-neighbour法と同様に、ClusterDPは入力として有意な(P < 0.05)主成分スコア(この場合19)を使用して実行され、パラメータrho = 1を使用して密度Clust RパッケージからfindClustersと密度Clust関数で実行されました。

さらなる分析のための希少な細胞タイプの抽出

全腸データセット (7,216 個の細胞。図 1b) の最初のクラスタリングは、EEC 細胞 310 個と房細胞 166 個のクラスタを示しました。 房細胞はそのままサブ解析に用いたが(図4a、b)、EEC細胞は領域データセット(図2a、右)で確認されたEEC細胞239個の第二クラスターと合わせて、合計549個のEEC細胞が存在することがわかった。 EECマーカーChgaおよびChgbとLyz1、Defa5およびDefa22などのPaneth細胞のマーカーを共発現する16個の細胞群は、ダブレットと解釈して解析から外し、図3の解析の基礎となるEEC細胞は533個となった。 近位および遠位小腸からの腸細胞の発現プロファイルを比較するために(図2b)、地域データセット(図2a)の11,665細胞から同定された1,041腸細胞を用いた。

細胞タイプのシグネチャの定義

細胞タイプに対して最大限特異的に遺伝子を特定するために、すべての可能な対比較に対して各クラスターのペア間で発現差検定を実行した。 次に、与えられたクラスターについて、推定シグネチャー遺伝子を最大FDR Q値を用いてフィルタリングし、最小log2(fold change)でランク付けした。 最小のfold changeと最大のQ値は、すべてのペアワイズ比較で最も弱い効果サイズを表し、したがって、これは厳しい基準である。 図1c、拡張データ図2b、拡張データ図8e、補足表2-4、8に示した細胞型シグネチャー遺伝子は、最大FDRを0.05、最小log2(fold change)を0.5として得られたものである。

細胞型内のサブタイプのシグネチャー遺伝子の場合(図3b、図4b、拡張データ図2b)には、3′(図1c)および完全長(拡張データ図2b)の両方のデータセットですべての遺伝子がこの閾値を通過しています。 7b)、濃縮のための複合P値(ペアワイズ検定全体)がフィッシャーの方法を用いて計算された。これは、単に最大P値を取るよりも甘い基準であり、最大FDR Q値0.01が、房細胞サブタイプ(図4b、拡張データ図7b、補足表7)については最小log2(倍変化)0.25、EECサブタイプ(図3b、補足表6)について0.1というカットオフと一緒に使用された。 EECサブタイプのシグネチャーは3′のみを用いて定義されたが、房細胞シグネチャーのすべての遺伝子は、3′(図4b)と完全長(Extended Data 図7b)の両方のデータセットにおいてこのカットオフを通過した。 細胞数が少ないため(n = 18)、FDRカットオフを0.001として、in vivo microfold cell signatureについてもFisherの複合P値を使用した(図5d、補足表8)。 マーカー遺伝子は最小のlog2(fold change)でランク付けされた。 発現差検定は、R関数wilcox.testを用いて実装したMann-Whitney U検定(Wilcoxon rank-sum testとしても知られている)を用いて実施した。 感染実験(図6)では、技術的品質とマウス間のばらつきの両方を制御するために、2つの部分からなる「ハードル」モデルを使用した。 これはRパッケージMAST59を用いて実装され、差分発現のP値は尤度比検定を用いて計算された。 多重仮説検定の補正は、R関数p.adjustを使用してFDR60を制御することによって行われた。

シグネチャー遺伝子セットを用いた細胞のスコアリング

与えられた細胞内のn遺伝子の特定のセットのスコアを得るために、「バックグラウンド」遺伝子セットが、文献と同様の方法で細胞間の配列決定範囲およびライブラリの複雑さの違いを制御するために定義された。 12. バックグラウンド遺伝子セットは、発現レベルの点で対象遺伝子と類似しているように選択された。 具体的には、全細胞の平均発現量と検出頻度で定義される2次元空間における10n個の最近接遺伝子を選択した。

細胞タイプのサンプリング頻度の推定

各細胞タイプについて、サイズkのサンプルで少なくともn個の細胞を観察する確率は、負の二項NBcdf(k、n、p)の累積分布関数を使用してモデル化され、ここでpはこの細胞タイプの相対存在量である。 同じパラメータpを持つm個の細胞タイプについて、各タイプを少なくともn回見る全体の確率はNBcdf(k;n,p)mである。 このような解析は、http://satijalab.org/howmanycells でユーザーが指定したパラメータで行うことができる。

EEC デンドログラム

平均発現ベクトルは、log2(TPM + 1)値を使用して、すべての12 EEC サブセットクラスターについて計算し、上記のように、EEC susbsets間で有意に変動すると識別された1,361遺伝子のサブセットに制限した(P < 0.05 )。 これらの遺伝子を含む平均発現ベクトルをRパッケージpvclust(スピアマン距離、ward.D2クラスタリング法)を用いて階層的にクラスタリングし、デンドログラムの各ノードについて、10万回の試行における経験的P値としてブートストラップ信頼性推定値を提供した(Extended Data Fig. 6a)。

細胞型特異的転写因子、GPCR、ロイシンリッチリピートタンパク

マウスで転写因子として作用すると特定されたすべての遺伝子のリストは、AnimalTFDB61から取得されました。 GPCRのセットはUniProtデータベース(http://www.uniprot.org/uniprot/?query=family%3A%22g+protein+coupled+receptor%22+AND+organism%3A%22Mouse+%5B10090%5D%22+AND+reviewed%3Ayes&sort=score)から取得した。 各タンパク質の機能的注釈(拡張データ図2d)は、英国薬理学会(BPS)および国際基礎および臨床薬理学連合(IUPHAR)(http://www.guidetopharmacology.org/GRAC/GPCRListForward?class=A )から入手した。 ロイシンリッチリピートタンパク質のリストは、文献から引用した。 62. ヒトからマウスへの遺伝子名へのマッピングは、ヒトとマウスのオルソログをEnsembl (latest release 86; http://www.ensembl.org/biomart/martview) から、またヒトとマウスの遺伝子同義語をNCBI (ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Mammalia/) から、それぞれダウンロードした。

次に、各細胞型に濃縮された遺伝子のリストと、上記で定義した転写因子、GPCR、ロイシンリッチリピートタンパク質のリストを交差させることにより、細胞型に濃縮された転写因子、GPCR、ロイシンリッチリピートタンパク質が同定された。 細胞型に富む遺伝子は、SMART-Seq2データセットを使用して、拡張データ図2e、fにおいて細胞型ごとに最大10遺伝子を保持し、最小log2(fold change)が0、最大FDRが0.5のものとして定義した(完全リストは補足表5に提供されている)。 さらに、より緩やかな閾値を選択することにより、細胞型特異的GPCRのより広範なパネルが同定された(Extended Data 図2d)。 これは、前のセクションで説明した一対の比較の代わりに、各細胞タイプを他のすべての細胞と比較し、差次的に発現したすべてのGPCR遺伝子を選択することによって達成された(FDR < 0.001)

細胞タイプの割合の変化についてのテスト

我々はポワソン過程を用いてランダムカウント変数として解析したそれぞれのマウスにおける各細胞タイプの検出数をモデル化している。 そして、検出率は、各マウスの条件(治療またはコントロール)を共変量として提供し、与えられたマウスでプロファイルされた細胞の総数をオフセット変数として提供することによってモデル化される。 このモデルは、statsパッケージのRコマンドglmを使用して適合させた。

EECサブセットの空間分布の有意性の評価(図3e)については、2群以上の比較とした。 特に、帰無仮説は、3つの腸管領域(十二指腸、空腸、回腸)で検出される各EECサブセットの割合が等しいというものであった。 この仮説を検証するために、我々は、statsパッケージのanova関数を使用して実装された、上記のポアソンモデルフィットに関するχ2検定付きの分散分析(ANOVA)を使用した。

遺伝子セットの濃縮および遺伝子オントロジー分析

遺伝子オントロジー分析は、goseq Rパッケージ63を用いて、有意差発現遺伝子(FDR < 0.)を使用し、実施した。05)をターゲット遺伝子とし、少なくとも10細胞でlog2(TPM + 1) > 3で発現したすべての遺伝子をバックグラウンドとした。

データの入手

コードの入手h3

コメントを残す

メールアドレスが公開されることはありません。