推荐产品
公司新闻/正文
一文揭秘单细胞转录组学如何与蛋白质组学联合
人阅读 发布时间:2023-09-19 14:45
近年来高通量组学检测技术的应用,大大促进了研究人员对于疾病发生发展机制的探索。但是,这些技术均是对整块组织或者一群细胞进行整体检测分析,研究的是不同样本/组别之间的差异,反映的是宏观水平上的差异,显然无法回答“从一整块组织或者一群细胞中检测到的基因表达变化,究竟是组织或细胞群中少部分细胞的基因表达变化造成的还是所有细胞的群体行为?”这样的问题。随着医学研究的不断深入,疾病微环境中的异质性以及细胞间的相互作用研究正成为研究者新的探索方向。因此,对宏观上变化的基因/蛋白质进行细胞溯源分析也变得越来越迫切。这可以通过联合单细胞转录组测序和蛋白质组学数据实现。
单细胞转录组测序+蛋白质组学联合分析的常见研究思路是通过蛋白质组学筛选得到候选蛋白标志物,再通过对差异表达蛋白所对应的基因表达量鉴定来在单细胞水平上分析候选蛋白的细胞类型来源。下面我们通过一篇发表在Nature Communication上的文章来看看蛋白质组究竟是怎样与单细胞转录组联合分析的。
案例分析
研究概况
随着年龄的增长,肺功能下降,易患慢性肺病,这是世界上第三大死亡原因。作者使用单细胞组学和基于质谱的蛋白质组学来量化30种细胞类型的细胞活性状态的变化,并绘制年轻和老年小鼠的肺蛋白质组图。
研究发现,衰老导致转录噪声增加,表明表观遗传控制失调。作者观察了衰老的细胞类型特异性效应,发现II型肺细胞和脂成纤维细胞胆固醇生物合成增加,气道上皮细胞相对频率改变是肺衰老的标志。蛋白质组学图谱显示衰老肺脏细胞外基质重塑,包括增加的IV和XVI胶原蛋白和减少的弗雷泽综合征复合蛋白和XIV胶原蛋白。研究通过蛋白质组和单细胞转录组的整合分析预测了调控蛋白质的细胞来源并创建了一个无偏的肺衰老图谱。
样本信息
单细胞测序样本---8只年轻小鼠(3个月龄)和7只年老小鼠(24个月龄)
Bulk RNA-seq样本---3只年轻小鼠(3个月龄)和3只年老小鼠(22个月龄)
蛋白质组测序样本---4只年轻小鼠(3个月龄)和4只年老小鼠(24个月龄)
研究过程及结果
单细胞测序共得到30种细胞,年老肺脏有更高的转录噪音
作者取了15只小鼠一共捕获到14,813个细胞进行单细胞测序,进行无监督聚类最后确定36个细胞群对应30个细胞类型,包括所有主要的已知上皮细胞、间充质细胞和白细胞谱系 (图1)。该研究量化了转录噪声并考虑了UMI总数和细胞类型频率的差异。作者观察到,在大多数细胞类型中,转录噪声随着衰老而增加(图2a)。为了进一步排除技术混淆,作者另外平均了每只小鼠的转录噪声得分,并获得了高度一致的结果(图2b)。为了进一步证实这一发现,作者使用细胞间的斯皮尔曼相关性以另一种方式量化了转录噪声。这一分析证实了该发现,转录噪声随着年龄的增长而增加 (图2c, d)。
图1.t-分布随机邻居嵌入(tSNE)可视化显示无监督的转录组聚类,揭示了30个不同的细胞特性。
图2.随着年龄的增长,大多数细胞类型的转录噪声增加。
(a)箱线图显示了年龄和细胞类型的转录噪声所指示的细胞数量。对于所有的箱线图,方框表示四分位范围,方框中的水平线表示中间值,须表示四分位范围的1.5倍。蓝色和红色分别表示年轻细胞和年老细胞。星号表示显著变化(Wilcoxon 's rank和检验,调整后p值<0.05)。细胞类型是根据年老细胞和年轻细胞之间转录噪声比的降低来排序的
(b) 散点图显示了在X轴和Y轴上分别使用小鼠平均值(n=15)和单个细胞计算出的老年和年轻样本之间转录噪声的log2比值
(c) 散点图描述了年老样本和年轻样本之间转录噪声的log2比值,分别使用X轴上1 -斯皮尔曼相关和Y轴上细胞之间的欧几里德距离来计算。对于两个面板,点的大小对应于细胞类型解析差异转录噪声检验的负log10调整p值,红线对应于稳健线性模型回归拟合
(d)以2型肺细胞为例,显示了所有对年轻细胞和年老细胞之间的1-Spearman相关系数的分布。值越大表示转录噪声增加。蓝色和红色分别表示年轻和年老的样本
mRNA和蛋白质的整合分析
为了验证单细胞RNA测序数据的完整性,以及捕捉到全肺mRNA 和蛋白质含量随年龄变化的变化,作者又分别取了6个(每组3个重复)和8个(每组4个重复)年轻和年老小鼠进行bulk RNA测序和蛋白质组质谱分析(图3a)。为了比较全肺bulk转录组测序和单细胞测序数据,作者通过对每只小鼠的所有细胞的表达量求和模拟出一份bulk RNA数据,通过相关性分析观察到了真实bulk RNA数据与模拟出的bulk数据非常一致,从而排除了单细胞分离过程可能带来的强烈偏差(图3b)。此外,作者还观察到三组数据集在年龄变化上的强烈相关性(图3c)。
上游调节基因表达量变化在转录组和蛋白水平上表现非常相近(图3d)。在转录和蛋白两组数据中,作者发现了一个促炎症特征,包括Il6、Il1b、Tnf和Ifng上调,以及Pparg和Il10下调(图3d)。大多数受年龄调节的基因类别在转录组和蛋白质组上表现出相同的方向,因此注释富集得分的Pearson’s正相关性非常显著(图3e)。许多细胞外基质基因,如胶原蛋白III,在mRNA和蛋白水平上都被下调,而所有基底膜相关的胶原蛋白IV基因在蛋白水平上都被上调,但在转录组数据集的mRNA水平(图3f)和组织切片mRNA近距离连接原位杂交(图3g)中均有所下降。胶原蛋白IV基因在转录组和蛋白组水平的差异突出了单细胞转录组和蛋白组学结合分析的重要性,同时研究可以互为补充。
图3.多组学数据整合揭示了RNA和蛋白质的非耦合调控。
(a)实验设计---分别通过scRNA-seq、bulk RNA-seq和质谱驱动的蛋白质组学对年轻和年老小鼠的三个独立队列进行分析。
(b)左侧:全肺bulk测序样本(n=6)和模拟的bulk测序样本 (n=15) 的基因表达谱平均值,并分别绘制在X轴和Y轴上。红色和黑色线表示线性模型拟合和对角线;
右侧:相关性热图显示了所有Bulk测序样本和模拟的bulk测序样本间的Pearson’s相关性。
(c)真实的bulk RNA测序和模拟的bulk测序数据与蛋白质组数据和分位数归一化合并。前两个主要成分显示了数据模式的聚类。第三个主成分在所有三种数据模式中分离年轻样本和旧样本。蓝色和红色分别表示年轻和年老的样本。
(d)基因表达和蛋白丰度变化倍数被用来预测已知的上游调控因子。这些调控因子可以驱动与实验观察到的类似的基因表达反应。上游调控因子可能是细胞因子或转录因子。颜色编码的激活z分数说明了衰老后活动增加或减少的预测。
(e)散点图显示了基于转录组(x轴)和蛋白质组(y轴)折叠变化的二维注释富集分析的结果,这导致了两个数据集的显著正相关。用于基因注释的数据库类型按图例中所示的颜色编码。
(f)IV型胶原蛋白基因的表达分别在in silica bulk (scRNA-seq), bulk (RNA-seq)和proteome(质谱)实验中。方框表示四分位范围,方框中的水平线表示中间值,须表示四分位范围的1.5倍。
(g)使用×25倍镜共聚焦显微镜获得IV型胶原的免疫荧光图像和Col4a1 mRNA的近距离连接原位杂交(PLISH)染色。值得注意的是,老年小鼠血管周围蛋白质的荧光强度增加,同时mRNA表达下降(标尺:50µm)
蛋白组学发现了基质蛋白的异常变化,根据单细胞测序可追溯细胞来源
从组织蛋白组中定量的5138个蛋白中 (图4a),我们鉴定出32个基质酶体蛋白在衰老过程中发生显著变化。在老年小鼠中,一种与I型胶原原纤维表面相关的FACIT(三螺旋中断的纤维相关胶原)蛋白家族的Collagen XIV被下调(图4b)。通过在单细胞测序中追溯Collagen XIV及其结合伴侣Decorin的表达分布,发现Collagen XIV主要由间质成纤维细胞表达,Decorin主要由间质成纤维细胞和间皮细胞表达 (图4c)。因此,组织蛋白质组学和单细胞转录组学的结合使我们能够预测被调控蛋白质的细胞来源。
图4.单细胞RNA测序 (scRNA-seq)预测年龄依赖性蛋白变化的细胞起源。
(a)火山图中,FDR< 10%的蛋白质以红色标出,显示了由t检验统计量得出的FC和p值。基质体蛋白用绿色基因名标记
(b) 32个显著调节的细胞外基质蛋白的z-score值通过无监督的分层聚类(Pearson相关性)进行分组。
(c) 点图显示了Col14a1和它的结合受体Decorin (Dcn) 在单细胞测序数据中的mRNA表达特异性
结 语
以上研究使用单细胞转录组和蛋白质谱分析量化了30种细胞类型的细胞活性状态变化,并且通过整合分析预测了与衰老相关调节性蛋白的细胞来源,创建了肺衰老细胞参考图谱。
单细胞转录组与蛋白质组联合的作用既然如此显著,近期吉凯也推出了单细胞转录组+蛋白质组联合分析的内容,感兴趣的老师请咨询当地科研顾问或销售工程师。
【参考文献】
1.Angelidis, I., Simon, L. M., Fernandez, I. E., Strunz, M., Mayr, C. H., Greiffo, F. R., Tsitsiridis, G., Ansari, M., Graf, E., Strom, T. M., Nagendran, M., Desai, T., Eickelberg, O., Mann, M., Theis, F. J., & Schiller, H. B. (2019). An atlas of the aging lung mapped by single cell transcriptomics and deep tissue proteomics. Nature communications, 10(1), 963.