近日,美國圣路易斯華盛頓大學(xué)醫(yī)學(xué)院Yoshiharu Muto教授等在Nature communications發(fā)布了Single cell transcriptional and chromatin accessibility profiling redefine cellular heterogeneity in the adult human kidney的研究論文。文中,作者采用單細(xì)胞核轉(zhuǎn)錄組snRNA-seq和單細(xì)胞核染色質(zhì)可及性snATAC-seq技術(shù),對5個健康成人(50歲到62歲,男性(n = 3)和女性(n = 2))腎臟樣本進行檢測。此文揭示腎臟內(nèi)獨特的細(xì)胞狀態(tài),并重新定義近端小管和粗升肢的細(xì)胞異質(zhì)性。
轉(zhuǎn)座酶染色質(zhì)可及性單核測序(snATAC-seq)也是一種單細(xì)胞表觀遺傳組測序技術(shù)。單細(xì)胞核測序,能夠獲得組織的細(xì)胞圖譜,解決細(xì)胞異質(zhì)性的問題。單細(xì)胞或細(xì)胞核RNA測序(scRNA-seq或snRNAseq)促進了對定義腎臟細(xì)胞特性的基因和途徑的更深入的理解。成熟的人類和小鼠腎臟的多個scRNAseq圖譜已經(jīng)確定了轉(zhuǎn)錄如何有助于細(xì)胞類型的特異性。最近的方法已經(jīng)將這種方法擴展到單細(xì)胞染色質(zhì)可及性分析。單核染色質(zhì)轉(zhuǎn)置可及性測序試驗(snATACseq)是ATAC-seq的擴展,該試劑盒利用Tn5轉(zhuǎn)置酶在數(shù)千個單個細(xì)胞中測量染色質(zhì)可及性。染色質(zhì)可及性是驅(qū)動腎元發(fā)育的動態(tài)過程,而腎元祖細(xì)胞具有不同的染色質(zhì)可及性譜,且隨其分化而變化。染色質(zhì)可及性在促進或抑制腎臟修復(fù)和再生中的作用對于設(shè)計急性和慢性腎臟疾病的治療方案具有重要意義,并可能有助于改善腎臟類器官的定向分化。scRNA-seq和snATAC-seq在成年小鼠腎臟中的聯(lián)合分析為理解染色質(zhì)可及性如何調(diào)節(jié)轉(zhuǎn)錄提供了一個框架。然而,人類腎臟的單細(xì)胞表觀基因組還沒有被描述。
生物信息學(xué)工具可以從snATAC-seq數(shù)據(jù)集中提取出scRNA-seq無法獲取的唯一信息。預(yù)測細(xì)胞類型特異性順式調(diào)控DNA相互作用和轉(zhuǎn)錄因子活性是補充scRNA-seq獲得的轉(zhuǎn)錄信息的兩種方法。長程染色質(zhì)-染色質(zhì)相互作用在轉(zhuǎn)錄調(diào)控中起著重要作用,并受到轉(zhuǎn)錄因子結(jié)合的影響。染色質(zhì)可及性分析將有助于識別通過遠(yuǎn)程相互作用影響轉(zhuǎn)錄的遠(yuǎn)程調(diào)控區(qū)域。
我們已經(jīng)進行了snATAC-seq和snRNA-seq來研究染色質(zhì)可及性如何改善我們對成熟人類腎臟中細(xì)胞狀態(tài)和功能的理解。我們生成了一個包含轉(zhuǎn)錄組和表觀基因組數(shù)據(jù)的交互式多模態(tài)圖譜(http://humphreyslab.com/ SingleCell/)。結(jié)合snRNA-seq和snATAC-seq分析提高了檢測近端小管和厚升肢內(nèi)獨特細(xì)胞狀態(tài)的能力,并重新定義了可能有助于腎臟再生和細(xì)胞特異性離子通透性的細(xì)胞異質(zhì)性。
技術(shù)路線:
一、人類成年腎臟的單細(xì)胞轉(zhuǎn)錄和染色質(zhì)可及性分析
工作流程圖
1)成人腎臟中的單細(xì)胞轉(zhuǎn)錄和染色質(zhì)可及性分析
snRNA-seq基于譜系特異性標(biāo)記的表達(圖1c,補充圖1b),鑒定了腎皮質(zhì)內(nèi)所有主要細(xì)胞類型(圖1b,補充圖1a)。檢測了近端小管(PT)、壁上皮細(xì)胞(PEC)、粗升肢(TAL)、遠(yuǎn)端小管(DCT1、DCT2)、連接小管(CNT)、集合管(PC、ICA、ICB)、內(nèi)皮細(xì)胞(ENDO)、腎小球細(xì)胞類型(MES、PODO)、成纖維細(xì)胞(FIB)和少量白細(xì)胞(LEUK)(補充表2、補充數(shù)據(jù)1)。
值得注意的是,近端小管亞群中VCAM1表達增加(PT_VCAM1)。該亞群還表達了HAVCR1,這是一種急性損傷后近端小管上調(diào)的基因,是長期腎臟預(yù)后的預(yù)測因子。
2)整合單核RNA和ATAC數(shù)據(jù)集,用于預(yù)測和驗證ATAC細(xì)胞類型分配
snATAC-seq捕獲單個細(xì)胞的染色質(zhì)可及性特征。相對而言,我們對細(xì)胞類型特異性染色質(zhì)可及性圖譜的了解較少;因此,我們利用注釋snRNA-seq數(shù)據(jù)集使用標(biāo)簽轉(zhuǎn)移來預(yù)測使用Seurat的snATAC-seq細(xì)胞類型。標(biāo)簽轉(zhuǎn)移是通過從snATAC-seq數(shù)據(jù)創(chuàng)建一個基因活性矩陣來進行的,這是一種衡量蛋白編碼基因的基因體和啟動子內(nèi)染色質(zhì)可及性的方法。
在參考snRNA-seq數(shù)據(jù)集和查詢基因活性矩陣之間識別轉(zhuǎn)移錨點,然后分配預(yù)測的細(xì)胞類型。snATAC-seq預(yù)測分?jǐn)?shù)的分布表明,絕大多數(shù)細(xì)胞具有較高的預(yù)測分?jǐn)?shù),并被自信地劃分為單細(xì)胞類型(補充圖2)。
對snATAC-seq數(shù)據(jù)集使用97%置信閾值對細(xì)胞類型分配進行過濾,以去除異型雙重體。通過標(biāo)簽轉(zhuǎn)移獲得的snATAC-seq細(xì)胞類型預(yù)測(圖1d)與無監(jiān)督簇的編輯注釋(圖1e, f)的比較表明,所有主要的細(xì)胞類型都存在于這兩個數(shù)據(jù)集中,并且在檢測和分配細(xì)胞身份方面,snATAC-seq與snRNA-seq具有可比性(補充圖3)。使用基于基因活性的細(xì)胞類型分配進行下游分析,這是通過對snatc -seq數(shù)據(jù)集的無監(jiān)督聚類獲得的。有趣的是,snATAC-seq能夠檢測到近端小管簇內(nèi)的兩個亞群,這可能代表近端曲小管(圖1e, PCT)和近端直小管(圖1e, PST)。PCT顯示編碼SGLT2的SLC5A2具有更強的染色質(zhì)可及性;而PST在編碼SGLT1的SLC5A1(圖1f,補充圖4)中表現(xiàn)出更強的可達性。SGLT2在近端小管S1和S2段重新吸收葡萄糖,SGLT1位于S3。
二、染色質(zhì)的可及性明確了細(xì)胞的類型
我們使用R包Signac來研究不同細(xì)胞類型間染色質(zhì)可及性的差異。細(xì)胞類型可以根據(jù)差異開放區(qū)域(DARs)是開放的還是封閉的來區(qū)分(Fig. 2a)。
約20%(平均比例= 0.203 0.04)的DAR與各自細(xì)胞類型中的差異表達基因密切相關(guān)(補充表4)。例如,LRP2是一個表達在近端小管的譜系特異性基因,該區(qū)域的覆蓋圖顯示其啟動子和基因體內(nèi)ATAC峰的數(shù)量和幅度增加(圖2a)。事實上,大部分DAR都位于距離最近的轉(zhuǎn)錄起始位點3 kb內(nèi)的啟動子區(qū)域(圖2b,補充圖7)。第二個最常見的位置是內(nèi)含子,DAR在不同細(xì)胞類型中的分布相對保守(圖2c)。
三、染色質(zhì)可及性與細(xì)胞類型特異性轉(zhuǎn)錄因子活性和染色質(zhì)相互作用網(wǎng)絡(luò)有關(guān)
HNF4A編碼驅(qū)動近端小管分化的關(guān)鍵轉(zhuǎn)錄因子。chromVAR檢測到近端小管DAR中HNF4A結(jié)合基序的富集(圖3b,基序活性),這是HNF4A中染色質(zhì)可及性增強(圖3b,基因活性)和snRNA-seq數(shù)據(jù)集中HNF4A轉(zhuǎn)錄增強(圖3b,基因表達)所支持的。我們通過染色質(zhì)免疫沉淀,然后定量PCR (ChIP-qPCR)驗證了HNF4A與腎近端小管上皮細(xì)胞(RPTEC,補充圖8a)中選定的靶基因位點(SLC34A1, SLC5A2, HNF4A) DAR中預(yù)測的HNF4A結(jié)合位點的結(jié)合。 然而,在RPTEC中可檢測到HNF4A的表達水平低于腎皮質(zhì),這表明HNF4A與該細(xì)胞類型中的這些位點具有強大的相互作用(補充圖8b)。
TFAP2B也有類似的模式,它調(diào)節(jié)遠(yuǎn)端腎單位的發(fā)育30。TFAP2B轉(zhuǎn)錄因子活性在粗升肢和遠(yuǎn)端曲小管中增加(圖3b, motif活性),TFAP2B染色質(zhì)可及性增加(圖3b,基因活性),TFAP2B轉(zhuǎn)錄增加(圖3b,基因表達)。
我們對遠(yuǎn)曲小管(DCT)、連接小管(CNT)和主細(xì)胞(PC)進行了偽時間排序,這些細(xì)胞在snRNA和snATAC數(shù)據(jù)集中都形成了一組不同的轉(zhuǎn)錄相關(guān)細(xì)胞類型。
在HNF4A中,觀察到近曲小管中有一個CCAN,在啟動子、基因體和遠(yuǎn)端區(qū)域的差異開放區(qū)域(圖3c,紅框)之間有多個連接(紅色或藍色弧線)(圖3c)。
與coaccessibility score較高的Cicero連接相比,coaccessibility score較低的Cicero連接在GeneHancer double elite數(shù)據(jù)庫中的可能性較小(p <2.2 10 16,卡的平方)。在近端曲小管內(nèi),大部分Cicero連接要么在啟動子區(qū)域內(nèi),要么在啟動子和另一個位置之間(圖3d),這種分布在其他細(xì)胞類型中也類似(補充圖11)。
轉(zhuǎn)錄因子活性與轉(zhuǎn)錄因子表達有適度的相關(guān)性(Pearson r2 = 0.36, p值= 4.2 10 12,圖3e)。
推測motif活性與轉(zhuǎn)錄因子表達呈正相關(guān)的轉(zhuǎn)錄因子可能在DAR中扮演轉(zhuǎn)錄激活因子的角色,而負(fù)相關(guān)的轉(zhuǎn)錄因子則扮演轉(zhuǎn)錄抑制因子的角色。令人驚訝的是,糖皮質(zhì)激素受體(NR3C1)的motif活性與表達呈正相關(guān),而礦皮質(zhì)激素受體(NR3C2)則呈負(fù)相關(guān)(圖3f)。
四、Multimodal 分析突出了肥大的上行肢體的細(xì)胞異質(zhì)性
為了確定我們是否能夠檢測出具有可變claudin表達模式的細(xì)胞亞群,在snRNA-seq數(shù)據(jù)集的umap圖上劃分三個亞種群(TAL1, TAL2和ATL)。ATL,上升細(xì)肢。顯示了TAL各亞群體中富集基因的基因表達模式。一組細(xì)胞(SLC12A1+UMOD+)表達粗升肢標(biāo)記(CLDN16、KCNJ10和PTH1R): TAL1,另一組細(xì)胞表達另一組TAL特異性標(biāo)記,如CLDN10: TAL2(圖4b)。第三組細(xì)胞根據(jù)之前發(fā)表的標(biāo)記的表達被確定為髓袢升支粗段(ATL) 。我們使用免疫組化方法驗證PTH1R和KCNJ10在UMOD+ SLC12A1+細(xì)胞亞群中表達(圖4c)。在snATAC-seq數(shù)據(jù)集的umap圖上進行TAL的亞聚類,劃分三個亞種群(TAL1、TAL2和ATL)(圖4d)。點圖顯示每個TAL亞種群中富集的基因的活性模式(圖4e)。斑點的直徑對應(yīng)于檢測到的基因活性的細(xì)胞比例,斑點的密度對應(yīng)于相對于所有細(xì)胞類型的平均基因活性。Umap顯示CLDN10、CLDN16、S100A2或UMOD(左)的基因活性。TAL1和TAL2之間的chromVAR差異激活轉(zhuǎn)錄因子基序(圖4f)。使用Seurat FindMarkers功能來識別區(qū)分厚升肢細(xì)胞群的DAR,并使用Seurat FindMotifs功能對這些DAR進行轉(zhuǎn)錄因子motif富集(圖4g)。
五、NF-κB調(diào)節(jié)表達VCAM1的近端小管亞群的分子特征
檢測了一組近端小管細(xì)胞,VCAM1的表達和染色質(zhì)可及性增加,我們將其命名為PT_VCAM1(圖1)。免疫熒光研究表明,VCAM1在近端小管上皮中呈散在分布的表達(圖5a)。我們的單細(xì)胞研究估計PT_VCAM1占總細(xì)胞數(shù)的2%,近端小管上皮細(xì)胞數(shù)的6%。我們還證實,在LTL+ PT細(xì)胞中,VCAM1+小管細(xì)胞占4.19 1.58%,而在腎皮質(zhì)的UMOD+ TAL細(xì)胞中,VCAM1+細(xì)胞未被檢測到(圖5b)。雖然之前的研究表明VCAM1在亨利氏襻(dTL)的降肢表達,但我們僅通過AQP1對腎臟切片進行鏈紋檢測,觀察到VCAM1在dTL的一個亞組表達(圖5c)。這些數(shù)據(jù)表明,VCAM1+小管細(xì)胞大部分位于皮質(zhì)內(nèi)近端小管內(nèi)。與VCAM1+ PT細(xì)胞相比,有少數(shù)dTL小管表達VCAM1。免疫熒光分析確定了一個VCAM1+近端小管細(xì)胞亞群表達CD24或CD133(圖5d)。
六、多組學(xué)方法分析表征近端小管細(xì)胞子集
Cicero研究了從PT到PT_VCAM1轉(zhuǎn)變過程中染色質(zhì)可及性的變化。VCAM1和TPM1轉(zhuǎn)錄增加(圖6a)與VCAM1基因體和啟動子區(qū)域染色質(zhì)可及性增加相關(guān)(圖6b, c)。同樣,SLC5A12和SLC4A4轉(zhuǎn)錄降低(圖6c)與染色質(zhì)可及性降低相關(guān)(圖6c,補充圖15)。通過評估chromVAR轉(zhuǎn)錄因子的活性,我們發(fā)現(xiàn)了可能調(diào)節(jié)近端小管和PT_VCAM1之間過渡的轉(zhuǎn)錄因子。有趣的是,近端小管顯示出強大的HNF4A活性,該活性在PT_VCAM1簇中降低,并與增加的REL和RELA活性相一致(圖6d)。我們在PT_VCAM1細(xì)胞核中驗證了減少的HNF4A蛋白表達(圖6e)。
我們從VCAM1基因體中鑒定出一個約60kb的開放染色質(zhì)區(qū)域,該區(qū)域包含一個與VCAM1啟動子相互作用的RELA基序(通過ciscoaccessibility network)。實際上,ChIP-qPCR擴增了該位點,使其能夠與RELA結(jié)合(圖6f,補充圖17b),為該細(xì)胞類型中RELA調(diào)控VCAM1表達提供了實驗證據(jù)。
七、急性腎損傷和慢性腎臟疾病患者PT_VCAM1的比例升高
對小鼠缺血再灌注損傷(IRI)實驗中獲得的大量RNA-seq進行反卷積,以確定PT_VCAM1的比例是否與急性腎損傷有關(guān)。BisqueRNA使用基于scRNA-seq參考的反褶積方法從整體RNA-seq中估算細(xì)胞類型的豐度。PT_VCAM1估計比例在iri后24 h顯著增加,并持續(xù)至少7天;與正常近端小管細(xì)胞比例下降相對應(yīng)(圖7a)。有趣的是,未手術(shù)控制小鼠腎臟中PT_VCAM1的估計比例在老齡小鼠中增加(圖7b)。用BisqueRNA對非腫瘤腎樣本進行反卷積,估計PT_VCAM1細(xì)胞的比例為2.6%(圖7d),這與我們的snRNA-seq和snatc -seq估計一致。接下來,我們分析了來自2型糖尿病患者腎臟活檢的大量RNA-seq。與對照組和早期糖尿病腎病患者相比,晚期糖尿病腎病患者PT_VCAM1的比例明顯更高(圖7e),提示PT_VCAM1和小管損傷可能與糖尿病腎病的疾病進展有關(guān)。
從小鼠IRI到人類的細(xì)胞類型標(biāo)記轉(zhuǎn)移表明,大部分PT_VCAM1與我們最近在小鼠中發(fā)現(xiàn)的修復(fù)失敗的近端小管細(xì)胞(FR-PTC)群體有關(guān)(圖7c)。