第 10-2 章。表观基因组测序
推荐阅读:【生物学】第10章【基因组计划与测序技术】(https://jb243.github.io/pages/75)
1.类型1. 识别基因功能
2. 类型2. 识别转录调控
3. 类型3. 识别翻译后调节
4.类型 4. 可编程单元功能
a. 表观遗传学库
1.类型 1. 识别基因功能
⑴ 扰动序列
① 第一第一。使用各种类型的 gRNA 文库处理表达 Cas9 的细胞。
○ 通过使用 CRISPR-Cas9,根据 gRNA 的类型,每个细胞中会发生各种扰动。
○ 过滤后至少应保留250万个细胞。
○ 每个扰动平均至少应有 100 个单元。
○ 每个单元应该有大约 10,000 个 UMI
② 第二第二。使用同时检测 gRNA 和 mRNA 的测序技术(例如 scRNA-seq、MERFISH)
③ 第三第。根据 gRNA 表达对细胞进行分组:细胞根据扰动条件自然分组。
④ 第 4。识别基因功能。
○ 前提:具有相似功能的基因很可能表现出相似的表达模式。
○ 可发现的结果 1. 由于扰动导致基因表达发生变化。
○ 可发现的结果 2. 由于遗传变异导致的扰动效应存在差异。
图 1. Perturb-seq 的总体示意图,包括验证实验
⑵ 体内扰动序列
① 第一第一。将含有 Cre 的 AAV(腺相关病毒)递送给小鼠以诱导 Cas9 表达。
② 第二第二。递送含有 sgRNA 的慢病毒。
③ 第三第。在体内,CRISPR-Cas9 系统根据 gRNA 在每个表达 Cas9 的细胞中诱导各种扰动。
④ 第 4。大约 10 天后执行 scRNA-seq 和 MERFISH。
图 2. 体内 Perturb-seq 过程
2.类型 2. 识别转录调控
⑴ BS-seq(亚硫酸氢盐测序)
① 用亚硫酸氢盐处理以确定甲基化模式。
② 启用表观基因组分析。
③ 应用1. snmC-seq
○ 板基测序。
○ 测量 5-甲基- 和 5-羟甲基-胞嘧啶的总和。
○ 每个单元 1-2 百万次读取。
⑵ ChIP-seq(染色质免疫沉淀测序)
① 定义: 能够分析与特定蛋白质(例如转录因子)结合的 DNA 区域。
② 将 DNA 测序与 ChIP(染色质免疫沉淀)相结合,识别 DNA 相关蛋白的结合位点。
③ 第一第一。用交联剂(例如甲醛)处理以固定蛋白质(例如转录因子)和 DNA。
④ 第二第二。裂解细胞,仅留下 DNA/蛋白质复合物。
⑤ 第三第。使用超声处理将 DNA 打碎成小片段 (200-350 bp);交联的 DNA 保持完整。
⑥ 第 4。添加附着在磁珠上的抗体;施加磁场可以分离特定的蛋白质及其连接的 DNA。
⑦第五th。反向交联:对沉淀物加热,将 DNA 与蛋白质分离。> ⑧ 第 6 名。进行测序以确定 DNA 序列。继续进行 PCR 扩增、片段大小选择、接头添加。
⑨ 第 7。将测序结果与基因组参考进行比较,以确定转录因子的结合位点等。
图 3. ChIP-seq 流程
⑩ 应用1. ChIP-chip:ChIP-chip的HTS版本是ChIP-seq。
⑪ 应用2. ChIP-PET
⑫ 应用 3. ChIA-PET:ChIP-seq 仅识别特定蛋白质的结合位置,而 ChIA-PET 研究结合 DNA 区域之间的相互作用。
⑬ 应用4. RIP-seq
⑭ 应用5. CLIP-seq
⑮ 应用6. meDIP-seq:DNA甲基化或羟甲基化。
⑯ 应用 7. ChIP-exo:使用 lambda 核酸外切酶消化。实验上很难。
⑰ 应用8. CUT&RUN(目标下切割并使用核酸酶释放)
○ 使用微球菌核酸酶 (MNase)。
⑱ 应用9. CUT&Tag(目标下的切割和标记)
○ 概述
○ Tn5 转座酶是一种酶,可切割 DNA 区域,产生各种片段,如单个核小体、二聚体、三聚体等。
○ Tn5 转座酶通过产生粘性末端来催化 DNA 插入。
○ 可以直接合并adapter,实现立即测序。
○ 程序
○ 步骤 1. 将细胞核与珠子结合以将其固定。磁捕获可实现细胞的高度保留。
○ 步骤 2. 添加一抗:数据质量高度依赖于抗体的质量(特异性和敏感性)。
○ 步骤 3. 添加二抗。
○ 步骤 4. 缀合 Tn5 转座酶与复合物结合并切割开放 DNA 的周围区域。
○ 步骤 5. PCR 扩增、片段大小选择、测序
○ 类型
○ MuLTI-Tag:通过直接条形码缀合最大限度地减少复用中的交叉。
○ 多切割和标签:使用带条形码的 Tn5/pA 抗体复合物。识别标记的共定位。
○ spatial-CUT&Tag:在空间上可视化组织切片上的组蛋白修饰和染色质状态。
| 切割并标记 | 剪切并运行 | ChIP 测序 | |
|---|---|---|---|
| 原生状态? | 是的 | 是的 | 没有 |
| 输入样本 | 原子核 | 细胞或细胞核 | 剪切染色质 |
| 手机号码 | 100,000 个细胞 | 500,000 个细胞 | 1-1000万个细胞 |
| 染色质断裂 | 基于 Tn5 的标记 | MNase 消化 | 超声处理 |
| 理想目标 | 组蛋白 PTM | 组蛋白 PTM、染色质相关蛋白、Remodeler | 组蛋白 PTM,染色质相关蛋白 |
| 二抗 | 是的 | 没有 | 没有 |
| 文库准备 | 否(直接 PCR) | 是的 | 是的 |
| 综合图书馆 | 可能的;使用标签 | 不可能 | 不可能 |
| 测序深度 | 5-800 万次阅读 | 3-5百万次阅读 | 20-5000 万次阅读 |
| 工作流程长度 | < 2 天 | < 3 天 | 〜 1 周 |
| 自动化兼容性 | 高 | 高 | 低 |
| 信噪比 | 高 | 高 | 低 |
表 1. CUT&Tag 与 CUT&RUN 与 ChIP-Seq(参考、参考、 参考,参考)
⑶ Hi-C seq(高通量染色质构象捕获测序)
① 定义:研究染色体上自然靠近的序列。
② 检查 DNA 距离以揭示细胞核内染色体的 3D 折叠结构。
图 4. Hi-C seq 流程
③ 应用1. ChIA-PET
○ 区别:Hi-C 研究所有自然发生的 DNA-DNA 相互作用,而 ChIA-PET 侧重于由特定蛋白质介导的 DNA-DNA 相互作用。
⑷ DNA 收报机磁带(prime 编辑)
① 第一第一。最初,仅激活第一个站点。
② 第二第二。第一个事件之后,第二个站点被激活。
③ 第三第。随着时间的推移顺序记录分子事件。
⑸ ENGRAM(增强子驱动的多重转录活性基因组记录)
① 使用与合成增强子连接的 perRNA。
② 记录信号的顺序和强度。
③ 参考文献:Chen et al., bioRxiv (2021)
⑹ ATAC-seq(转座酶可及染色质测序分析)
① 概述
○ 定义:识别常染色质区域的测序技术。由于染色体是成对的,因此 ATAC-seq 中的每个信号可以具有 0、1 或 2 的值。
○ 假表达:常染色质区域可以推断为基因表达区域。
○ Tn5 转座酶是一种酶,可切割 DNA 区域,产生各种片段,如单个核小体、二聚体、三聚体等。
○ Tn5 转座酶通过产生粘性末端来催化 DNA 插入。
○ 可以直接合并adapter,实现立即测序。
○ 在 ATAC-seq 中观察到的 ~10.5 bp 周期性与 DNA 螺旋一整圈需要 10 bp 这一事实有关。
○ Tn5 中的第四个 α 螺旋充当主要的“识别螺旋”,并在 DNA 大沟中从位置 7 到 13 形成几个碱基对特异性接触。 (ref)
○ 与平均 B-DNA 相比,Tn5 转座酶使螺旋轴弯曲,导致滚动角和倾斜角增加,以及主沟和次沟宽度和深度的偏差。 ([参考](https://raymentlab.biochem.wisc.edu/wp-content/uploads/sites/1624/2022/08/117rayment2000_davies.pdf))
○ 这可以解释 10.5 bp 的周期性,这与普通 B-DNA 中的 10 bp 周期性略有不同。
图 5. ATAC-seq 片段大小分布
② 类型 1. 批量 ATAC-seq
○ 步骤 1. 细胞核分离
○ 步骤 2. Tn5 转座酶处理:这会切割染色体中较少浓缩的开放区域并插入 DNA 序列标签。
○ 步骤 3. 扩增和测序
○ 步骤4. 数据分析
③ 类型 2. scATAC-seq
○ 定义细胞类型特异性 CRE,以识别与疾病和性状相关的调节性 TF 和细胞类型。
○ 用于解释 GWAS 变异。
○ scRNA-seq 和 scATAC-seq 的比较
○ scRNA-seq: xij ∈ ℤ≥0
○ scATAC-seq: xij ∈ {0, 1}, j ≫ i
④ 类型 3. 空间 ATAC-seq
⑤ 类型 4. FAIRE-seq:甲醛交联染色质,苯酚-氯仿提取剪切 DNA。
⑥ 类型 5. DNaseI-seq:用于消化染色质的 DNase I 核酸内切酶。可以识别与染色质相互作用的转录因子的类型。
图 6. DNAseI-seq 结果示例
⑦ 类型 6. MNase-seq:内切核酸外切酶,持续消化 DNA 直至阻塞。
图 7. ATAC-seq 与各种测序技术的比较
⑺ NOMe-seq(核小体占据和甲基化组测序)> ① 同时测量 DNA 甲基化和核小体占据。
② 定义 TF 结合的核小体耗尽区域 (NDR)。
③ 识别与染色质相互作用的转录因子。
⑻ MBD-seq
⑼ Bru-seq(溴尿苷测序)& BruChase-seq
① 新转录的新生RNA用Bru(溴尿苷)标记,然后测序。
② 用于研究RNA合成、RNA稳定性和剪接。
③ 第一第一。 Label nascent RNA in cells with bromouridine
④ 第二第二。分离 Bru-RNA
⑤ 第三第。从分离的 Bru-RNA 中制备 cDNA 文库并进行深度测序
⑽ TT-seq(transient transcriptome sequencing)
① 第一第一。 Incorporation of 4-thiouridine into nascent RNA
② 第二第二。分离标记的 RNA
③ 第三第。准备 cDNA 文库并进行深度测序
⑾ MNIST-seq:RNA甲基化对染色质的调控
⑿ GRO-seq(global run-on sequencing)
① 第一第一。 Cell harvesting and permeabilization
② 第二第二。核连续反应
③ 第三第。 RNA extraction and BrU-labeled RNA is isolated
④ 第 4。 Fragmentation and library preparation
⒀ PRO-seq(precision run-on sequencing)
① 第一第一。细胞收获和透化
② 第二第二。生物素化 NTP 的核连续运行
③ 第三第。 RNA extraction and streptavidin pulldown
④ 第 4。 3’ adapter ligation and library prep
3。类型 3. 识别翻译后调控
⑴核糖测序
① 核糖体保护的RNA测序,表明翻译活跃。
② scRibo-seq
○ 测量每个密码子的核糖体占用率。
○ 第一第一。 FACS 和裂解。
○ 第二第二。核酸酶足迹:MNase 核酸酶→失活→足迹释放。
○ 第三第。创建小RNA文库:末端修复→3’连接→5’连接→cDNA合成→索引PCR。
⑵ STAMP-RBP
① 使用 scRNA-seq 鉴定 RNA 结合蛋白 (RBP)。
② 第一第一。将 APOBEC 连接到 RBP。
③ 第二第二。在 APOBEC 和 mRNA 结合的位点启用 C-U 编辑,用尿嘧啶 (U) 替换胞嘧啶 (C)。
④ 第三第。 RNA测序
⑤ 第 4。 Use SAILOR to identify C-U editing sites.
⑥ 还可以使用长读长测序来识别异构体特异性结合谱。₩
4。 Type 4. Programmable cell function
⑴ 雷达
① 第一第一。当目标转录物存在时,它会形成 dsRNA 结构,使 ADAR 能够诱导 A 到 C 编辑。
② 第二第二。这种编辑会诱导细胞行为,例如 GFP 表达和 caspase 激活。
① 光激活基因表达的例子。
输入:2022.01.10 00:03
Modified: 2023.01.28 23:12