MIA 分析的理解和执行
推荐帖子: 【生物信息学】【生物信息学分析目录】(https://jb243.github.io/pages/836)
1. 背景理论
2. 代码
**3. 结果1.** scRNA-seq数据验证
**4. 结果 2.** ST 表征
**5. 结果 3.** MIA(多模态交叉分析)
**6. 结果 4.** 使用 MIA 分析 scRNA-seq 亚群
**8. 结果6.** 使用MIA分析肿瘤微环境
**9. 结果 7.** 使用 TCGA(癌症基因组图谱)进行增强
10. 限制
1.背景理论
⑴单链RNA测序
① 优点 : 公正。高分辨率。
② 缺点: 空间信息丢失。缺乏关于肿瘤微环境(TME)中细胞相互作用和组织的知识。
⑵ ST(空间转录组学)
① 优点 : 公正。包括空间信息。
② 缺点: 细胞分辨率低。每个点仅包含 10-200 个细胞。
○ 换句话说,每个点都包含不同细胞类型的混合物,导致细胞类型信息丢失。
⑶ KNN(k近邻平滑): 用于去除scRNA-seq数据中固有的噪声。
⑷ MIA(多模态交叉分析)
① 与 scRNA-seq 和 ST 并行进行。
② 整合两个数据集。
2.代码
⑴ 使用R中的函数
⑵ 以 10 为底的 n 的对数!
⑶ 使用Fisher精确检验检验两组的统计等价性
⑷ MIA 测定(富集)
⑸ MIA 测定(耗尽)
3.结果 1. scRNA-seq 数据验证
⑴ t-SNE投影(图1b)
① PDAC-A:1,926 个细胞。 PDAC-B:1,733 个细胞。
② 用于识别细胞类型的递归层次聚类方案。
○ 第一第一。 KNN 平滑。
○ 第二第二。特费曼-图基变换。
○ 第三第。使用 Fano 因子和平均表达鉴定大多数可变基因。
○ 第 4。使用 Ward 准则进行聚类。
○ 第五th。基于差异表达基因 (DEG) 命名簇。
○ 第六th。通过比较 PDAC-A、PDAC-B 和 PDAC-C 之间的 UMI 和线粒体含量来去除低质量细胞簇。
○ (评论) 递归层次聚类方案也可以使用 Seurat 包来实现。
③意义:了解癌症簇的位置。
⑵ PDAC-A与PDAC-B的对应关系
① 证明实验的再现性。
⑶ SNV概况(补充图2)
① 按染色体在 x 轴上的位置重排的基因。
② 根据y轴上的导管细胞、_TM4SF1_阳性细胞、_S100A4_阳性细胞自主排列。
③各种细胞亚群的发现。
○ 导管细胞。
○ PDAC-A 中的癌症 (TM4SF1)。
○ PDAC-A 中的癌症 (S100A4)。
○ PDAC-B 中的癌症 (TM4SF1)。
⑷ KRT19、TM4SF1、S100A4 在 t-SNE 上的表达谱:⑶ 的验证方面
① PDAC-A 和 PDAC-B 之间的相似性。
⑸ 双重免疫荧光成像:⑶ 的验证方面
① 图1f
○ TM4SF1 和_S100A4_ 互斥染色。» ○ PDAC-B 中 KRT19 和 TM4SF1 共定位,KRT19 和 S100A4 缺乏共定位,与 ⑵ 匹配。
② 补充图2
○ 恶性导管与非恶性导管的形态不同。
4.结果 2. ST 表征
⑴ H&E 染色
① 每个斑点包含 20 ~ 74 个细胞核(补充图 4)。
⑵ ST 映射
① PDAC-A(图2e):428 个点。
② PDAC-B(图2f):224 个点。
③(评论)scRNA-seq 中潜在的细胞损失,428 × 20 ≫ 1926。
④ 可变表达基因的空间表达与注释的组织学区域相匹配(图2c,d)。
⑶ PCA(主成分分析)
① 所得簇与独立的组织学注释一致(图 2e、f,补充图 5g、h)。
5.结果 3. MIA(多模态交叉分析)
⑴ MIA程序
① 第一第一。研究源自 scRNA-seq 的每种细胞类型的 DEG(P < 10^-5,双尾学生 t 检验)。
② 第二第二。研究源自 ST 数据集的每个区域的 DEG(P < 0.01,双尾学生 t 检验)。
③ 第三第。构建一个矩阵,按细胞类型排列行,按区域排列列。
④ 第 4。对于矩阵的每个单元格,将①和②中的DEG集应用于超几何累积分布。
⑤ 第 5。例如,证明癌症区域中成纤维细胞的丰度。
⑥ 示例
○ 图2g:预期14.44,实际结果15.06356。
○ 图 5b:预期 2.92,实际结果 2.366678。
○(评论)对背景基因了解不够。
⑦(评论)由于样本量的原因,使用卡方独立性检验可能更合适。
⑵ **标准
1.** MIA 富集和消耗结果的公平性(补充图 5i,j)。
①(评论)不太严格的 p 值阈值可能会偏向将相关性较低的基因视为富集。
⑶ 标准2. 特定基因的足够计数。
①当癌症区域特异性基因数量小于100时,成纤维细胞特异性基因对癌症的影响不显着(P > 0.05)。
② 充分增加癌症区域特异性基因可以建立参数独立性。
6。结果 4. 使用 MIA 分析 scRNA-seq 亚群
⑴ 表达_KRT19_的导管细胞分为四个导管亚群
① 亚群(图 3a-d):使用 scRNA-seq 单独分析时,导管细胞分为四个亚群。
○ APOL1_高/缺氧:_APOL1、APOL2、APOL3、CA9、DUOX2、_ERO1A_等基因高表达。
○ 新发现的亚群。
○ 腺泡中央:AQP3、CFTR、CRISP3、REG1A、REG1B、_REG3A_等基因高表达。
○ 先前研究中已有的亚群。
○ 抗原呈递:C1S、C4A、C4B、CFB、CFH、CD74、HLA-DPA1、HLA-DQA2、HLA-DRA、HLA-DRB1、_HLA-DRB5_等基因高表达。
○ 新发现的亚群。
○ 虽然 B 细胞、巨噬细胞和树突状细胞高度表达 MHC II 类,但肝脏、胃肠道和呼吸道的上皮细胞也表达 MHC II 类。
○ 这些抗原呈递导管细胞通过 T 细胞激活调节炎症反应。
○ 终末导管:KRT16、KRT18、TFF1、TFF2、_TFF3_等基因高表达。
○ 先前研究中已有的亚群。
○ 确认这些亚群表达 KRT19,如 H&E 染色所示,证实了 KRT19 表达导管亚群(图 3e-h)。
○ 合并前的图像请参阅补充图 6。
② MIA分析» ○ 在 PDAC-A 和 PDAC-B 中观察到的导管亚群,高度存在于导管上皮中。
○ 由于氧含量低,癌症区域中存在独特的高/缺氧_APOL1_,而胰腺组织中却很少。
⑵ 巨噬细胞分为M1样和M2样亚群
① 亚群(补充图 7a):使用小提琴图进行识别,表明使用 scRNA-seq 很难分离它们。
○ 使用的 M1 标记:IL1B、IL1RN、CLEC5A。
○ 使用的 M2 标记:MS4A6A、SDS、CD163。
② MIA 分析(补充图 7b)
○ M1样巨噬细胞分布于间质和癌区,反映炎症环境。 M2 样巨噬细胞分布在导管中,反映组织驻留巨噬细胞。
⑶ 树突状细胞分裂为A和B
① 亚群(补充图 7c):使用小提琴图进行识别,表明使用 scRNA-seq 很难分离它们。
○ 使用的 A 标记:TUBB、TLR5、CLEC4A。
○ 使用的 B 标记:C1QA、C1QB、HLA-DRB1。
○ B 的特点是丰富的补体途径基因和 MHC II 类表达。
② MIA分析
○ 巨噬细胞等两个亚群的独特模式,每个亚群都有独特的作用。
7.结果 5. 使用 MIA 分析癌症人群
⑴ 问题陈述
① 在PDAC-A中清楚地区分_TM4SF1_-癌和S100A4-癌。
② 然而,MIA 分析表明两种细胞类型都存在于同一区域。
③ 这两种细胞类型是否共存或分布不同?
⑵ 对 PDAC-A-2 和 PDAC-A (PDAC-A-1) 进行额外的 ST 分析,以定义子区域
⑶ MIA结果:癌症簇1高度存在于成纤维细胞丰富区域(可能与基质反应有关),癌症簇2较少存在于成纤维细胞丰富区域(可能与基质反应有关)(图4d)。
8.结果 6. 使用 MIA 分析肿瘤微环境
⑴ 问题陈述
① 最近的 scRNA-seq 研究揭示了多种癌症类型,如胶质母细胞瘤、黑色素瘤和头颈癌。
② 癌症之间的相互作用可能导致不同的癌细胞状态。
③ MIA 分析可以绘制这些癌细胞状态吗?
⑵ 热图(图5a)
⑶ 应激反应模块基因与癌症应激反应模块基因的共富集
① 第一第一。由 Elyada 等人的 scRNA-seq 定义的炎症成纤维细胞特征定义的癌症应激反应模块。
② 第二第二。来自应激反应模块的基因
○ 第二第二-1第一。在 PDAC-A-1 中鉴定出癌症区域点。
○ 第二第二-2第二。由癌症应激反应模块着色。
○ 2nd-3rd。区分高表达点和低表达点。
○ 第二第-4第。研究区分两个区域的 DEG。
③ 第三第。 MIA分析
○ 应激模块点与炎症成纤维细胞的强烈共富集。
○ 单核细胞和 T/自然杀伤细胞显着富集(不如炎性成纤维细胞)。
⑷ 免疫荧光
① 使用在炎性成纤维细胞中高表达的 IL-6 进行免疫荧光。
② 进行_DAPI_、KRT19、IL-6、以及H&E染色。
③ 结论1. IL-6和KRT19共定位:与IL-6在炎症成纤维细胞中高表达的结果相匹配。
④ 结论2. H&E染色证实组织中的上皮细胞确实是恶性细胞。
⑤ 最终结论: 表达应激反应基因模块的炎症成纤维细胞和癌细胞是相关的。
9。结果 7. 使用 TCGA(癌症基因组图谱)进行增强
⑴ 已确定的癌症基因模块的表达与炎症成纤维细胞基因特征之间的相关性> ① 对来自 TCGA 的 142 个 PDAC 肿瘤进行研究。
②缺氧模块、氧化磷酸化模块、应激反应模块中,只有应激反应模块表现出显着的Pearson相关系数。
⑵ 使用Tirosh的scRNA-seq和Thrane等人的ST数据(补充图12)
① 结论1. 成纤维细胞和内皮细胞共定位:经TCGA数据证实,大部分基质组织室由成纤维细胞和内皮细胞组成。
② 结论2. 巨噬细胞仅存在于黑色素瘤区域内的特定区域。
③ 结论3. CD8+ T 细胞标志物明显缺乏:暗示CD8+ T 细胞标志物在预后和治疗反应中的应用潜力。
10。限制
⑴ 局限性 1. ST 阵列不能覆盖整个组织,每个点缺乏单细胞分辨率。
⑵ 限制2. 最佳组织透化条件可能不适用于所有组织学特征。
输入: 2021.01.03 23:28