细胞类型分类管道
推荐帖子: 【生物信息学】【生物信息学分析目录】(https://jb243.github.io/pages/836)
1. 矩阵和稀疏矩阵
2. PCA 降维
3. 聚类
5. 软件包介绍
b. 通过分散确定细胞类型
1.矩阵和稀疏矩阵
⑴ 稀疏矩阵是表示非零数据的值和位置的矩阵。
⑵ 由于生物信息学数据量较大,因此采用稀疏矩阵。
2.使用 PCA 降维
⑴ PCA不能直接应用于大型数据集,因此需要进行优化。
⑵ 优化策略1: 使用大约30,000个基因中变异性最高的基因子集。
⑶ 优化策略2: 设置解释95%以上输入方差的基因数量。
3。聚类
⑴ 用PCA后得到的10个主成分进行聚类。
⑵ 使用t-SNE等聚类算法。
4。探索 DEG(差异表达基因)
⑴ DEG : 与其他簇相比,在一个簇中表达更多的基因。
⑵ 采用t检验分析或GLM等方法。
⑶ 找出代表每个簇的基因的生物学意义,并将细胞类型分配给每个簇(不能自动化)。
⑷ 具有生物学意义的代表性基因称为标记基因。
5。套餐介绍
⑴ 在R中,Seurat和Scater等包实现了上述管道。
⑵ 在Python中,Scanpy实现了上述管道。
输入: 2019.11.22 13:49