第 10 章基因组计划和测序技术
推荐文章:【生物学】【生物学目录】(https://jb243.github.io/pages/1457)
1. 基因组计划
2. 测序技术
a. 焦磷酸测序
b. 表观基因组测序
c. 生物信息学分析目录
d. 转录组学管道
1. 基因组计划
⑴ 概述
① 1990年,在沃森和弗朗西斯·柯林斯的领导下,由六国联合体作为一个为期15年的项目启动。
② 超过350家研究机构的合作研究
○ 2000年6月11日,完成84.5%,并公布草案。
○ 2003年4月15日,发布了准确率99.99%的最终版本。
○ 超过 2,800 名研究人员参与了 13 年,总成本达 27 亿美元。
③人类基因组研究的副作用
○ [生物信息学]的诞生(https://jb243.github.io/pages/1831)。
○ 促进人类蛋白质生产工艺的发展
○ 胰岛素:第一个具有确定序列的蛋白质。
○ 促进自动化DNA测序仪器的发展
○ 促进其他生物学适用生物体的基因组分析
⑵ 方法论1. 逐步测序法:科学家的方法
① 步骤1: 确定限制性内切酶识别位点
○ 用限制性内切酶切割DNA并进行电泳后,可以确定每个片段的大小。
○ 以不同方式处理两种限制性内切酶可揭示其识别位点之间的相对距离。
② 步骤2:构建基因图谱
○ 确定染色体上基因的相对距离。
○ 通过重组率推断基因之间的距离。
③ 步骤3:物理图谱(DNA图谱)构建
○ 确定限制性内切酶识别位点的意义:以每个限制性内切酶识别位点为参考,根据获得的片段的序列信息逐步构建物理图谱。
○ 基因图谱的意义:物理图谱一旦创建,就可以与基因图谱进行比较。内含子存在于基因之间。
○ 使用单一库的方法。
⑶ 方法 2. 鸟枪法测序 (Celera, J. Craig Venter):创业方法
① 以多种方式切割同一个DNA。
② 通过单一方法确定切割片段的完整核苷酸序列。
○ 由于分析样本的长度有限,无法立即确定完整的 DNA 序列。
③ 在每种方法中,核苷酸序列随机排列并重复,直到获得一致的结果。
④ 基于计算机科学的方法。
⑷ 科学家的方法与企业家的方法
① 科学界:由沃森和弗朗西斯·柯林斯领导的人类基因组计划(HGP)。最终成本为27亿美元。
② 创业部门:Celera Genomics(1998年成立),由Craig Venter领导。最终成本为3亿美元。
③ 两个小组均于2001年发布了人类基因组草图。
④ 科学界对此表示不满,认为创业部门的贡献和投资被认为是功劳。
⑤ 创业界对科学界不共享数据感到沮丧,从而导致了新方法论的发展。
⑥ 基因组图谱的最终完成被认为是两个小组的共同成果。
图1. 逐步测序法和鸟枪法测序法
① 编码项目
② 千人基因组计划
③ GTEx联盟
④ 4D核联合体
⑤ 泛基因组联盟
⑥ Cellxgene 普查
⑦ 十亿细胞计划
⑧ GREGoR联盟
⑨ 阿特拉斯计划
2.测序技术
⑴ 概述
① DNA测序:应用DNA复制原理。
○ 模板:每条DNA链
○ 底物:dNTP(dATP、dCTP、dGTP、dTTP)
○ NTP 在 2’ 碳上附着有一个羟基 (-OH),可作为 RNA 聚合的构建模块。
○ DNA 聚合酶:下一个核苷酸的磷酸盐与脱氧核糖的 3’-OH 结合。
○ 合成方向:5’→3’,与模板形成互补碱基对。
○ ddNTP:DNA 聚合终止,因为第 3 个碳原子缺少 OH 基团。
② RNA测序:应用RNA转录原理。
③ 合成测序
○ 定义:通过检测聚合酶将核苷酸掺入引物序列时发出的信号来确定核苷酸序列的方法。
○ 类型 1. CRT(循环可逆终止):由掺入、成像和去保护组成的循环过程。
○ 类型 2. SNA(单核苷酸添加):一次仅添加一个核苷酸。
○ 示例:离子半导体测序 (PGM)、焦磷酸测序 (Roche 454)
④ 连接测序
○ 定义:通过检测连接酶将杂交序列与引物序列连接时发出的信号来确定核苷酸序列的方法。
○ 一次可以掺入 1 个或多个核苷酸(例如二碱基)。
○ 示例:纳米球测序、Thermo Fisher SOLiD
⑵ 体外克隆:最早的测序方法
⑶ 双脱氧链终止法(=桑格测序):1977年报道。桑格第二次获得诺贝尔奖。
① 底物:dNTP + ddNTP(少量)+ 缓冲液(pH 稳定)
○ ddNTP 缺少 3’-OH 基团,因此会终止聚合反应。
○ 如果大量添加 ddNTP,所有模板 DNA 都会快速终止。
② 底漆
○ 示例:p32 引物 (CTAG)
③ 第一第一。添加模板 DNA 和聚合酶。
④ 第二第二。聚合反应后,加热以分离复制的链。
⑤ 第三第。电泳后,从 X 射线胶片上读取序列或使用荧光检测序列。
图2. 双脱氧链终止法的流程
⑥ 优点:可以读取很长的链,因此仍在实验室中使用。
⑦缺点:需要大量相同的DNA链。
⑷ 染料双脱氧链终止法:采用激光。
① 在 dNTP 中添加少量 ddNTP,每个 ddNTP 都用四种荧光染料中的一种进行标记。
② 实现自动 DNA 测序。
图3. 染料双脱氧链终止法的流程
⑸ 离子半导体测序(PGM)
① 合成测序。
② 容易出现插入/删除错误。
⑹ 焦磷酸测序 (罗氏 454)
①定义:依赖于DNA合成过程中产生的焦磷酸量产生的成比例发光的DNA测序方法。每次读取约 400 bp。> ② 通过合成测序:当核苷酸掺入时会发出光,在热解图中显示为峰。
③ 容易出现插入/删除错误。
④ 不再使用。
图 4. 焦磷酸测序图
图5. 焦磷酸测序过程
⑺ 纳米球测序
① 连接测序
⑻ 赛默飞固体
① 连接测序
② 不再使用。
⑼ Illumina 固相扩增(参考、YouTube 剪辑)
图 6. Illumina 固相扩增
图7. 荧光颜色分布照片
① 第一第一。片段化:随机切割给定的 DNA 样本。
② 第二第二。基于凝胶的大小选择:如有必要,可以限制每个 DNA 片段的大小。
③ 第三第。接头结合:使用转座体将接头连接到所有 DNA 样本片段的两端。
④ 第 4。放大
○ 第 4位 - 第 1位。将 DNA 变性为单链。
○ 第 4 - 第 2。将单链 DNA 连接至 Illumina 流动池。
○ 第 4 - 第 3。添加酶以使单链 DNA 在固相基质上形成桥。
○ 第 4th - 4th。在单链DNA桥上添加引物后,引物可以与桥结合。
○ 第 4 - 第 5。添加未标记的单链 DNA 并诱导 DNA 合成:形成双链 DNA 桥。
○ 第 4 - 第 6。通过变性,双链 DNA 桥转变为锚定的单链 DNA。
○ 第 4 - 第 7。重复上述六个步骤,创建具有相同碱基序列的锚定单链簇。
○ 特征: 锚定的单链簇形成数百万个簇。
⑤ 第 5。仅保留正向链以防止不必要的引发。
⑥ 第六th。边合成边测序 (SBS)
○ 第 6位 - 第 1位。添加四种类型的标记可逆终止子(基于核苷酸类型)、引物和 DNA 聚合酶。
○ 第 6第 - 第 2第。当标记的可逆终止核苷酸形成磷酸二酯键时,会发出荧光。
○ 第 6 - 第 3。获得每个簇的荧光颜色分布图像。
○ 第 6th - 4th。洗涤
○ 第 6th - 5th。重复上述四个步骤即可确定整个核苷酸序列。
○ 类型 1. 单端测序 (SES):仅使用一个接头进行测序。
○ 类型 2. 双端测序 (PES):使用两个接头进行测序。»> ○ 首先,使用一个适配器进行测序(Read1 采集),然后使用相反的适配器进行测序(Read2 采集)。
○ 来自同一 DNA 片段的 Read1 和 Read2 可以轻松匹配,因为它们来自同一簇。
○ 优点:准确度更高(由于Read1和Read2比较),易于检测DNA变异,易于分析重复序列,易于在不同物种之间作图。
○ 缺点:比SES成本更高,步骤更多。
⑦ ~100 bp/read:最近达到250 bp。
⑽ WGS(全基因组测序)
① SNV、插入、缺失、结构变异、CNV
② 测序深度 > 30X
⑾ WES(全外显子测序)
① 仅在蛋白质编码基因中存在 SNV、插入、缺失和 SNP。
② 测序深度 > 50X ~ 100X
③ 性价比高。
⑿ RNA测序
① 概述
○ 微阵列数据具有连续值形式的原始数据,而RNA-seq具有计数数据形式的原始数据。
○ 与微阵列数据相比,即使对于表达水平非常低或非常高的基因,RNA-seq 也可以稳健地捕获信号。
② 第一第一。显微切割:分离特定组织以提取 RNA。
○ LCM(激光捕获显微切割):用激光束切割特定组织。坚固但劳动密集型。
○ TOMO-seq:使用冷冻切片和基于计算机的 3D 切片。不适合临床用途。
○ 【体内转录组分析】(https://www.nature.com/articles/nmeth.2804)
○ ProximID
○ STRP-seq
③ 第二第二。连接 Poly T 可识别 RNA 的 Poly A 尾。
④ 第三第。 RNA 片段:200-400 nt。
⑤ 第 4。将引物连接至 RNA。
⑥ 第 5。第一次 cDNA 合成。
⑦ 第六th。第二次 cDNA 合成。
⑧ 第 7。处理 RNA 的 3’ 和 5’ 末端。
⑨ 第 8。连接 DNA 测序接头。
⑩ 第 9th。用 PCR 扩增连接片段。
⑪ 应用1. dUTP法:链特异性测序的代表性方法。
○ 背景:用于研究基于RNA方向的生物学功能(例如反义miRNA的调控)。
○ 步骤 1. DNA 和 RNA 杂交:使用 dT 引物(针对 mRNA 聚 A 尾)和逆转录酶合成 cDNA(第一链或反义链)。
5’-//-U-//-AAAAAA-3’
3’-//-A-//-TTTTTT-5’
○ 步骤 2. ds cDNA:使用 dUTP 代替 dTTP,以 cDNA 的第一链为模板合成 cDNA 的第二条(或有义)链。
3’-//-A-//-TTTTTT-5’
5’-//-U-//-AAAAAA-3’
○ 步骤 3. 连接 ds cDNA:将 Y 接头连接到 ds cDNA 的两端。
○ 步骤 4. 当用 UDG(尿嘧啶 DNA 糖基化酶)处理时,含有尿嘧啶的 DNA 第二条链 被降解。
○ 步骤 5. 扩增剩余的反向反义链(第一条链) 以创建文库。
○ 文库原始数据中,
_1.fastq代表第一条链,_2.fastq代表第二条链。
○ 因此,_2.fastq 代表原始 RNA 谱。
⒀ 单细胞测序
① 类型
○ 单链DNA测序
○ scRNA-seq(2013年度方法):Chromium、Smart-seq等» ○ 单细胞表观遗传学测序
② 步骤1. 单细胞的分离
○ 方法1. 简单隔离:非常早期的方法。
○ 方法 2. 基于 FACS 或 LCM(激光显微切割)
○ 方法3. 声学分离
○ 通过流体动力学分离单个细胞,对细胞造成的影响最小。
○ CyTOF(飞行时间细胞计数)是一种代表性方法。
○ 方法4. 免疫磁分离
○ 将磁铁附着到细胞上。
○ 可以获得大量细胞。
○ 分为需要离心和不需要离心的情况。
③ 步骤2. 反转录
④ 步骤3. cDNA 扩增
⑤ Step 4. 文库构建:Drop-seq等
⑥ 单细胞基因组学(scDNA-seq)+单细胞转录组学(scRNA-seq)
○ 它可以帮助我们了解基因组中的突变模式与转录组中的基因表达之间的关系。
○ DNA和RNA分离技术:G&T seq、SIDR-seq、DNTR-seq
⒁ 单核 RNA 测序 (snRNA-seq)
① 目的 1. 肌肉是多核细胞,因此需要在核水平上进行分析,因为它们不会被 scRNA-seq 捕获。
② 目的2. 与scRNA-seq相比,snRNA-seq捕获了更多种类的RNA,包括内含子、前mRNA、非编码RNA。
③ 目的3. 在snRNA-seq中,主要捕获核RNA:但也检测到少量细胞质RNA。
④ 目的4. 由于snRNA-seq主要是新生RNA,因此它比scRNA-seq更好地反映了细胞的状态
① 概述
图 8. 空间组学概述
| 年份 | 方法 | 样品 | 目标 | 分辨率 | 单细胞? | 探针 | 面积 | 细胞数量 | 基因数量 | |
|---|---|---|---|---|---|---|---|---|---|---|
| 基于点的空间转录组学 | ||||||||||
| 2014年 | Tomo-seq | 新鲜冷冻 | 全转录组 | - | 没有 | - | - | - | 每个切片 12,000 个基因 | |
| 2016 | 2016维苏姆 | 新鲜冷冻和 FFPE | A 尾 RNA 转录本和目标基因 | 100微米 | 没有 | 打印 | 6.5 毫米 × 6.5 毫米 | 20,000 ~ 40,000 个细胞 | 每个点约 1.700 个基因 | |
| 2017 | 2017地理序列 | 新鲜冷冻 | 全转录组 | - | 是的 | - | - | 每切片 5-40 个细胞 | 约 8,000 个基因 | |
| 2019 | 2019幻灯片序列/V2 | 新鲜冷冻 | A尾RNA转录本 | 10微米 | 没有 | 珠子 | Φ3.0毫米 | - | 每次读取 550 UMI | |
| 2019 | 2019高清ST | 新鲜冷冻 | A尾RNA转录本 | 2微米 | 没有 | 珠子 | 5.7 毫米 × 2.4 毫米 | 每个六边形约 60,000 个细胞 | 每 5× 珠子 44 UMI | |
| 2020 | DBiT-seq | FFPE | A尾RNA转录本 | 25微米 | 没有 | 免费探针 | 2.5 毫米 × 2.5 毫米 | 约 50,000 个细胞 | 每像素 1,000 个基因 | |
| 2021 | Seq 范围 | 新鲜冷冻 | A尾RNA转录本 | 〜0.6微米 | 是的 | 原位合成 | 0.8 毫米 × 1 毫米 | - | 每个细胞约 1,617 个基因 | |
| 2021 | 图片 | 新鲜冷冻 | 全转录组 | 75-5,000 微米 | 是的 | 光笼寡核苷酸 | 随着采集时间的变化 | 组织切片中有 10 个或更多细胞 | 约 8,000 个基因 | |
| 2021 | 科学空间 | 新鲜冷冻 | A尾RNA转录本 | 222 微米 | 是的 | 珠子 | 18 毫米 × 18 毫米 | 121,909 个细胞 | 每个细胞 1,231 个基因 | |
| 2022 | 2022立体声序列 | 新鲜冷冻 | A尾RNA转录本 | 0.5微米 | 是的 | 原位合成 | 最大 132 毫米 × 132 毫米 | 100,000-16,900,000 个细胞 | 每个细胞 1,910 个 UMI 和 792 个基因 | |
| 2022 | 2022像素序列 | 新鲜冷冻 | A尾RNA转录本 | 〜1微米 | 是的 | 原位合成 | 75 毫米 × 25 毫米 | 每切片 15,000 个细胞 | 每个细胞约 500 个基因 | |
| 2023 | 幻灯片标签 | 新鲜冷冻 | A尾RNA转录本 | 10微米 | 是的 | 珠子 | Φ3.0毫米 | 81,000 个细胞 | 每个单元 2,377 个 UMI | |
| 2024 | 2024 Visium 高清 | 新鲜冷冻,FFPE | 靶向转录组学 | 2微米 | 是的 | 打印 | 6.5 毫米 × 6.5 毫米 | 20,000-40,000 个细胞 | 7,605 个探测器 | |
| 2024 | 2024开放-ST | 新鲜冷冻 | A尾RNA | 0.6微米 | 是的 | 原位合成 | 6.3 毫米 × 89 毫米 | - | 每个单元约 1,000 个 UMI | |
| 基于图像的空间转录组学 | ||||||||||
| 2013 | 国际空间站 | 细胞、组织切片 | 靶向RNA | - | 是的 | 挂锁探头 | 222 × 166 微米² | 450 个电池,覆盖面积 0.16 mm² | 39 个基因 | |
| 2014年 | 菲塞克 | 细胞、组织切片 | 非靶向RNA | - | 是的 | 荧光探针 | 10 毫米 × 10 毫米 | - | 4,171 个大小 >5 像素的基因 | |
| 2015 | 2015人鱼 | 细胞、组织切片 | 靶向RNA | - | 是的 | 寡核苷酸探针 | 随着采集时间的变化 | ~100 个,最多 40,000 个细胞 | 130 个基因,多达 10,050 个基因 | |
| 2018 | 星图 | 组织切片 | 靶向RNA | - | 是的 | 挂锁探头 | 1.7 毫米 × 1.4 毫米 × 0.1 毫米 | > 30,000 个细胞 | 每个样本 160 至 1,020 个基因 | |
| 2019 | 2019 seqFISH+ | 细胞、组织切片 | 靶向RNA | - | 是的 | 寡核苷酸探针 | 随着采集时间的变化 | 2,963 个细胞 | 10,000 个基因 | |
| 2021 | ExSeq | 细胞、组织切片 | 非靶向/靶向RNA | - | 是的 | 挂锁探头 | 0.933 毫米 × 1.140 毫米 × 0.02 毫米 | 约 2,000 个细胞 | - | |
| 2021 | 易鱼 | 组织切片 | 靶向RNA | 0.23×0.23×0.42微米 | 是的 | - | - | 80,000 个细胞 | - | |
| 2022 | 2022鳗鱼 | 组织切片 | 靶向RNA | - | 是的 | 主探头 | 随着采集时间的变化 | 128,000 个细胞 | 883 基因 | |
| 2023 | 星图PLUS | 组织切片 | 靶向 RNA 和抗体蛋白 | - | 是的 | 挂锁探头 | 194 毫米 × 194 毫米 × 345 毫米 | - | 1,022 个基因 | |
| 基于多组学 | ||||||||||
| 2018 | 法典 | 细胞、组织切片 | 抗体蛋白 | - | 是的 | - | - | - | - | |
| 2020 | 寡聚FISSEQ | 细胞、组织切片 | 基因组学 | - | 没有 | 条形码oligopaint探针 | - | - | - | |
| 2020 | DBiT-seq | 新鲜冷冻 | A 尾 RNA 转录物和抗体蛋白 | 10 / 25 / 50 微米 | 没有 | 免费探针 | 2.5 毫米 × 2.5 毫米 | 约 50,000 个细胞 | 每 50 μm 像素约 4,000 个基因 | |
| 2021 | DNA seqFISH+ | 细胞 | 基因组学 | 不适用(每个单元 5,616.5 ± 1,551.4 点) | 是的 | 主探头 | 随着采集时间的变化 | 446 细胞 | 每个细胞 3,660 个染色体位点 | |
| 2021 | 易格斯 | 细胞、组织切片 | 基因组学 | 400-500 纳米 | 是的 | 发夹 DNA | - | 113 细胞 | - | |
| 2021 | 幻灯片 DNA 测序 | 新鲜冷冻 | 基因组学 | 10微米 | 是的 | 珠子 | Φ3毫米 | 2,274 个细胞 | - | |
| 2022 | 2022 CAD-HCR | 细胞 | 靶向 RNA 和抗体蛋白 | - | 是的 | 挂锁探头 | - | - | - | |
| 2022 | 2022马赛克 | 细胞,FFPE | 靶向 RNA 和抗体蛋白 | - | 是的 | 主要代码 | - | - | - | |
| 2022 | 2022 SM-组学 | 新鲜冷冻 | A 尾 RNA 转录物和抗体蛋白 | 55微米 | 没有 | 打印 | 6.5 毫米 × 6.5 毫米 | - | - | |
| 2022 | 2022空间剪切&标签 | 新鲜冷冻 | 表观基因组学 | 20微米 | 没有 | - | - | - | H3K27me3:9,735; H3K4me3:每 20 μm 像素大小 3,686 个 | |
| 2022 | 2022空间-TREX | 新鲜冷冻 | A 尾 RNA 转录本和 CloneID | 单细胞/55μm | 是的 | - | - | 65,160 个细胞 | 5,000-10,000 个基因 | |
| 2022 | 2022扰动图 | 新鲜冷冻 | A 尾 RNA 转录本和 CRISPR 靶向基因 | 55微米 | 是的 | - | - | - | - | |
| 2022 | 2022幻灯片-TCR-seq | 新鲜冷冻 | A尾RNA转录本和靶向T细胞受体基因 | 10微米 | 没有 | 珠子 | Φ3.0毫米 | - | - | |
| 2022 | 2022 SmT | 新鲜冷冻 | 宿主转录组和微生物组范围 | 55微米 | 没有 | 打印 | 6.5 毫米 × 6.5 毫米 | - | - | |
| 2022 | 2022 RIBO 地图 | 细胞、组织切片 | 核糖体结合 mRNA | - | 是的 | 三探针(分裂 DNA 探针、挂锁探针、引物探针) | - | 60,481 个细胞 | 5,413 个基因 | |
| 2022 | 2022表观基因组MERFISH | 细胞、组织切片 | 表观基因组学 | - | 是的 | 寡核苷酸探针 | 随着采集时间的变化 | 约 5,400 个细胞 | 3 个组蛋白修饰,H3K4me3:127 个基因/位点; H3K27ac:142 个目标基因组位点 | |
| 2023 | 空间 ATAC | 新鲜冷冻 | 表观基因组学 | 55微米 | 没有 | 夹板寡核苷酸、空间条形码表面寡核苷酸 | - | - | - | |
| 2023 | 空间-CITE-seq | 新鲜冷冻 | A 尾 RNA 转录物和抗体蛋白 | 50微米 | 没有 | 免费 | 2.5 毫米 × 2.5 毫米 | 37,500-50,000 个细胞 | 每个像素 411 个基因和 153 个蛋白质 | |
| 2023 | 立体CITE-seq | 新鲜冷冻 | 靶向 RNA 和抗体蛋白 | 500纳米 | 是的 | 原位合成 | 最大 132 毫米 × 132 毫米 | 100,000-16,900,000 个细胞 | 每箱 4.05K UMI50 | |
| 2023 | 空间 ATAC-RNA-seq | 新鲜冷冻 | A 尾 RNA 转录本和转座酶染色质 | 20 / 50 微米 | 没有 | 免费 | 2.5 毫米 × 2.5 毫米 | 37,500-50,000 个细胞 | - | |
| 2023 | 前 ST | 新鲜冷冻 | A尾RNA转录本 | 20微米 | 没有 | 打印 | 6.5 毫米 × 6.5 毫米 | 8,000-16,000 个细胞 | 每个点约 500 个基因 | |
| 2023 | 免疫SABRE | 细胞 | 抗体蛋白 | - | 是的 | - | - | - | - | |
| 2023 | SCDVP | 新鲜冷冻 | 蛋白质 | - | 没有 | - | - | - | 1,700 种蛋白质 | |
| 2023 | scSpaMet | 新鲜冷冻,FFPE | 代谢组学和靶向多重蛋白 | - | 是的 | - | - | - | - |
表1. 不同空间组学技术的比较
图 9. 不同基于点的空间组学技术的比较
② 类型 1. 空间基因组学
○ 实施例1. 肿瘤研究:肿瘤具有异质性。此外,还可以分析拷贝数变异。
○ 示例2. 脾脏研究:成熟的免疫细胞具有不同的遗传组成。> ③ 类型2. 空间转录组学:2020 年年度方法
○ 示例 1. 大脑皮层:白质、灰质、L6、L5、L4、L3、L2、L1
○ 示例 2. 脾脏:红髓、白髓、中间区
○ 示例3. 皮肤:表皮、真皮、平滑肌
○ 示例 4. 肾脏:皮质、亨利袢、集合管
○ 示例 5. 肝脏:门静脉周围、门静脉周围、中间
○ 示例 6. 睾丸:I-III、IV-VI、VII-VIII、IX-XII
○ 实施例7. 叶:上表皮壁、下表皮壁
④ 2-1. 基于斑点的空间转录组学:多基因+少量斑点
○ ST(空间转录组学)
○ 将带条形码的寡核苷酸随机分散到组织上,然后从每个组织区域捕获 mRNA 的方法。
○ 10X Visium
○ 原理:在每个点上附着点特异性寡核苷酸,与组织来源的RNA杂交→获得点状转录组。
○ 表面积:6.5毫米×6.5毫米
○ 厚度:10 ~ 20 μm
○ 点数:最多 4992 个(基于之前版本的 Visium HD)
○ 点间距:100 μm
○ 光斑直径:55 μm
○ 灵敏度:每个点 10,000 个转录本
○ 类型 1. Direct Visium(基于oligo-dT 的方法)
○ 使用聚 dT 捕获 mRNA。
○ 仅适用于 FF(新鲜冷冻)样品:用于 FFPE 的试剂与直接 Visium 不兼容。
图10. Visium FF 原理
○ 类型 2. 基于探头的 Visium
○ FF(新鲜冷冻)和 FFPE(福尔马林固定石蜡包埋)样品均可进行。特别是,FFPE(福尔马林固定石蜡包埋)样品由于 RNA 降解而无法直接进行 Visium,其中 mRNA 分子会碎裂成各种片段。
○ 为了识别目标 mRNA,所有三对 LHS 和 RHS 必须连接在一起:每个探针的长度为 25 个碱基对。 RTL(基于探针的 RNA 模板连接化学)用于此目的。
图 11. 基于探针的 Visium 原理
○ 优势:与直接 Visium 相比,数据质量更高。
○ 缺点:与 Visium FF 相比,分析自由度有限,因为仅检测探针指定的基因。
○ 自 2024 年 6 月起,10x 将停止 Visium FFPE 服务,CytAssist 除外。
○ CytAssist 图像代表基因表达的分布,用于图像对齐。
○ 基本数据由直径为 2 μm 的光斑组成,还提供 8 μm 和 16 μm 分档的附加数据。
○ Slide-seq 和 Slide-seq V2(直径 10 μm)
○ 将空间珠随机分散,然后进行原位测序的方法。
○ 97% 的斑点由一种或两种细胞类型组成。
○ 由于它标记细胞核本身,因此不需要核分割。
○ Curio Seeker:Slide-seq V2 的商业化版本。
○ HDST
○ 将带有条形码的珠子放置在图案化的晶圆上,然后进行系列杂交。
○ NanoString GeoMx»> ○ 2023年Nanostring与10x Genomics的专利纠纷([ref1](https://www.businesswire.com/news/home/20230711643008/en/Delaware-District-Court-Permits-NanoString%E2%80%99s-Counterclaims-that-10x-Genomics-and-Harvard-Violated-the-Antitrust-Laws), ref2) → Nanostring 破产(ref) → Nanostring 的并购([参考](https://www.businesswire.com/news/home/20240310548568/en/Patient-Square-Capital-a-Leading-Health-Care-Focused-Investment-Firm-Agrees-to-Acquire-NanoString-Technologies))
○ 立体声序列
○ 使用 Illumina 或 MGI 测序读取刻在流动池上的寡核苷酸图案,然后进行条形码调用。
○ 直径:220 nm
○ 点间距:500 或 715 nm
○ Seq 范围
○ 比 Visium 更高的空间分辨率。
○ 使用 Illumina 或 MGI 测序读取刻在流动池上的寡核苷酸图案,然后进行条形码调用。
○ PIC(光隔离化学)
○ 像素序列
○ XYZeq (直径500 μm)
○ 将组织置于空间条形码微孔上→单逆转录→细胞去除→单细胞测序。
○ sci-Space (sc-space;直径222 μm)
○ 将组织放置在带有空间网格哈希寡核苷酸的载玻片上→组织透化(寡核苷酸转移)→成像→核去除→细胞固定→测序。
○ sci-RNA-seq
○ TIVA-seq
○ NICHE-seq
○ ZipSeq
○ 一种成像技术,用光笼寡核苷酸处理细胞以观察 RNA 的实时图案照明(即邮政编码)。
○ DBiT-seq
○ 将带条形码的寡核苷酸放置在正交微流体的固定位置,以获得组织的位置特异性转录组。
○ 滑动标签(直径 10 μm)
图 12. CITE-seq 图表
○ 使用链霉亲和素-生物素将寡核苷酸的 5’ 末端连接至抗体。
○ 寡核苷酸可以与oligo-dT 引物互补杂交。
○ 链霉亲和素-生物素键在还原条件下可以解离。
○ 最近还开发了perturb-CITE-seq。
○ 景点
○ 空间蛋白质和转录组测序
○ 使用聚腺苷酸化 DNA 条形码抗体间接评估 Visium 上的蛋白质水平。
○ 开放-ST
○ Nova-ST
○ MAGIC-seq
○ 空间地理序列
④ 2-2. 基于图像的空间转录组学:少量基因+大量斑点
○ ISS(原位测序):在组织中的原始位置对 RNA 进行测序的技术。连接测序
○ 类型 1. 第一个国际空间站
○ 类型 2. 带挂锁探头的 ISS
○ 逆转录酶创建 RNA 靶标的 cDNA。
○ 挂锁探针可以与 cDNA 的两个区域杂交。
○ 目标序列扩增通过滚环扩增 (RCA) 进行。
○ RCA 产物通过连接进行原位测序。»> ○ 类型 3. ISS 使用荧光探针和交联
○ 类型 4. 基于条形码的方法
○ 类型 5. 间隙填充国际空间站
○ 【荧光原位杂交】(https://jb243.github.io/pages/77#5-hybridization) (FISH)
○ smFISH(单分子 FISH)(2008)
○ seqFISH(连续 FISH)(2014):通过 DNase I 处理、随后连续染色和成像获得 RNA 转录信号。 12 个伪彩色,每个需要 4 轮。每个条形码包含 5 个伪彩色。
○ seqFISH+:每轮编码使用20个探针,有效划分荧光通道以获得基因组规模转录组的技术。
○ Vizgen - MERSCOPE(技术名称:MERFISH(多重抗差错 FISH)):基于 ISH。
○ 直接探针杂交,无需单独的扩增机制。
○ 每个 FISH 探针与每个基因 1:1 对应(尽管此假设可能并不总是成立)。
○ 条形码分配(即条形码调用)使用纠错方法:汉明码
○ 步骤 1. 每个 FISH 探针的荧光状态随时间变化,捕获多个图像。
○ 步骤2. 通过解码从每个RNA读取的二进制代码来推断相应的基因。
图13. MERFISH原理
○ 10x - Xenium:基于国际空间站。
○ 少量挂锁探针+滚环放大(RCA)
○ 步骤 1. 挂锁探针以钳形结合互补 RNA 转录物,形成环。
○ 步骤2. RCA(滚环扩增):环形成后,相应的RNA转录物被扩增。
○ 步骤3. 将每个RNA转录物与荧光探针杂交,然后进行荧光成像→洗涤。
○ 步骤 4. 重复 步骤 3 并从生成的图像中解码每个基因的标签。
图14. Xenium的原理
○ 纳米线 - CosMx:基于 ISH。
○ 少量探针+支链杂交
○ Nanostring与10x Genomics的专利纠纷(2023) ([ref1](https://www.businesswire.com/news/home/20230711643008/en/Delaware-District-Court-Permits-NanoString%E2%80%99s-Counterclaims-that-10x-Genomics-and-Harvard-Violated-the-Antitrust-Laws), ref2) → Nanostring 破产(ref) → Nanostring 的并购([参考](https://www.businesswire.com/news/home/20240310548568/en/Patient-Square-Capital-a-Leading-Health-Care-Focused-Investment-Firm-Agrees-to-Acquire-NanoString-Technologies))
图15. CosMx原理
○ FISSEQ 和oligoFISSEQ
○ 维拉诺姆
○ 画画
○ 波洛拉米斯
○ STARmap 和 STARmap PLUS:连接测序
○ SEDAL 测序
○ ExSeq
○ BaristaSeq:合成测序
○ BARSeq 和 BARSeq2
○ 混合动力系统
○ 军刀
○ 夹FISH
○ 分裂-FISH
○ 截图
○ 普拉什
○ osmFISH
○ 荧光原位杂交
○ par-seqFISH
○ EASI-FISH(扩增辅助迭代荧光FISH)
○ SGA
○ 校正FISH» ○ EEL FISH(增强型电鱼)
○ VeraFISH
○ 飞镖鱼
○ RAEFISH
⑤ 类型3. 空间蛋白质组学:大致分为基于质谱 的方法和基于成像的方法。
○ 开关
○ MXIF
○ t-CyCIF
○ 伊贝克斯
○ 德伊
○ 法典
○ 免疫-SABER
○ 美国运输安全管理局
○ 蛋白石 IHC
○ 米比
○ 整合管理公司
○ 高清-MIBI
○ GeoMx 数字空间分析仪 (DSP):100 毫米刻度
○ 使用与 UV 可切割 DNA 条形码结合的抗体或基因探针。
○ 4i 多重成像
⒃ 其他测序技术
① TCR-seq(T细胞受体测序):用于追踪T细胞亚型和克隆的测序。
② Invade-seq:一种用于分析宿主微生物组的测序技术。
③ 长读长测序:【2022年度最佳方法】(https://jb243.github.io/pages/1059) (ref)
| 短读序列 | 长读序列 | |
|---|---|---|
| 发布年份 | 2000 年代初 | 2010 年代中期 |
| 平均阅读长度 | 150-300 bp | 5,000-10,000 bp |
| 准确度 | 99.9% | 95-99% |
表 2. 短读序列和长读序列之间的差异
图 16. 短读序列和长读序列之间的差异
○ 在没有测序间隙的情况下,可以进行以下分析。
图16. 长读长测序和短读长测序
○ 优点1. 【AS分析】(https://jb243.github.io/pages/2050#footnote_link_67_56)(选择性剪接分析):可以识别选择性剪接事件、异构体等。
○ 优点2. 【CNV分析】(https://jb243.github.io/pages/2050#footnote_link_67_56)(拷贝数变异分析):例如,重复序列的数量在亨廷顿病中至关重要。
○ 优势3. 表观遗传学和转录组学的整合更容易
○ 示例 1. Pacific Biosciences SMRT(单分子实时)测序:平均读长约为 20 kb
○ 示例 2. Oxford Nanopore 测序:平均读长约为 100 kb
○ 平均读取长度:~100 kb
○ 最大读取长度:>2 Mb
○ 错误率高:5-10%。作为参考,Illumina测序的错误率约为0.1-1%。
④ 无创测序
○ 无需破坏细胞即可进行测序的技术。
⑤ Halo-seq:一种获取与特定蛋白质相邻的RNA转录组的技术。
○ 步骤 1. 将 HaloTag 域附加到特定目标。
○ 步骤 2. HaloTag 充当产生自由基的 Halo 配体,从注入的炔烃手柄中释放氢自由基 (H∙),以生成炔烃手柄自由基。
○ R-H → R· + H·
○ 步骤 3. 类似地,HaloTag 通过从 RNA 中释放氢自由基 H· 来生成 RNA 自由基。
○ RNA-H → RNA· + H·
○ 步骤 4. 炔烃基团与 RNA 基团结合。
○ 步骤 5. 将炔烃-RNA 与生物素叠氮化物反应,生成生物素化 RNA。
○ 步骤 6. 使用带有链霉亲和素的亲和层析仅分离生物素化的 RNA。» ○ 步骤 7. RNA-seq 可以检测接近特定靶标的 RNA。
○ 原因:自由基不稳定,无法长距离传播。
图17. Halo-seq原理
⑥ multi-NTT seq(纳米抗体系留转座后测序)
⑦【表观基因组测序】(https://jb243.github.io/pages/1431)(表观基因组测序)
⑧ 3D测序
⑨ 时间排序
○ 记录序列
○ 实时测序
○ TMI
○ 分子记录
⑩ 时空组学
○ 轨道 (单分子DNA折纸旋转测量)
○ 4D 时空 MRI 或超极化 MR
○ 透明小鼠体内 4D 组学
⑪ 空间多组学
○ Lunaphore:空间转录组学 + 空间蛋白质组学
○ DBiT ARP-seq (ATAC + RNA + 蛋白质)
○ DBiT CTRP-seq (CUT&Tag (H3K27me3) + RNA + 蛋白质)
○ Patho-DBiT:RNA 生物学的空间多组学(例如,lncRNA、microRNA、miscRNA、rRNA、snoRNA、snRNA、tRNA、Y RNA)
⒄ NGS(二代测序)概要
① 基因组分析的成本
○ 2001 年:根据人类基因组计划,每人 1 亿美元。
○ 2007 年:4 年内投入 1 亿美元。
○ 2008 年:454 1,000,000 美元/人,基于 454 生命科学。
○ 2009 年:48,000 美元/人(基于 Helicos BioSciences)。
○ 预计到 2014 年 1,000 美元就足够了 (Nature 456, 23-25, 2008)。
② 基因组分析规模
图18. 基因组分析规模趋势
③深度与覆盖率的关系
○ 测序深度(读深度):表示特定核苷酸平均出现的次数。
图 19. 深度的定义
○ “10x”表示已读取 10 次。
○ 可以为每个核苷酸定义。
○ 覆盖范围 (c)
○ c := LN / G
○ L:读取长度
○ N:读取次数
○ G:单倍体基因组长度
○ 【深度对比覆盖率](https://www.ecseq.com/support/ngs/how-to-calculate-the-coverage-for-a-sequencing-experiment#:~:text=The%20term%20%E2%80%9Ccoverage%E2%80%9D%20in%20NGS%20always%20describes%20a%20relation% 20%20sequence%20reads%20和%20a%20reference%20之间(例如%20a%20whole%20genome%20or%20al%20locus\ )%2C%20与%20sequencing%20深度%20不同,%20描述%20a%20total%20read%20number%20\(图%201\)。)
○ 总读取数以测序深度表示。
○ 序列读数和参考(例如,全基因组、基因座)之间的关系表示为覆盖度。
○ 除了这种区别之外,深度和覆盖范围是非常相似的概念。
④ 批量与读取的关系
○ 批量:总 RNA 产量» ○ 当深度相同时,会出现不合理现象,即 RNA 读数计数与体积大小的增加成反比。 ([参考](https://genomebiology.biomedcentral.com/articles/10.1186/gb-2010-11-3-r25#:~:text=估计%20normalization%20factors,factor%20of%202。))
○ 示例:在空间转录组学中,体积通常较大且深度较低,导致 RNA 读取计数较低。
○ 标准化:已经引入了各种方法来解决这种不合理性。
⑤ read count与reads数的关系
○ 如果读长小于250 bp,则无法检测到序列错误。
○ 读取长度和每次运行读取次数之间的关系:存在权衡。
图 20. 读段长度和每次运行的读段数之间的关系
⑥ 转录组reads计数与基因表达的关系
○ 读取计数:实际转录本数量。
○ 基因表达:通过[标准化过程]从读取计数更正值(https://jb243.github.io/pages/2050#footnote_link_67_50)。
输入时间:2015.07.02 23:31
更新时间:2022.03.13 13:11