R 中有用的主要函数的集合
高级类别:【RStudio】【R Studio索引】(https://jb243.github.io/pages/1761)、【生物信息学】【生物信息分析索引】(https://jb243.github.io/pages/836)
1. 概述
2. 基础知识
3. 文件I/O
4. 向量和矩阵
5. gsub
6. 统计分析
7. 生物信息学
8. 绘图生成
a. GitHub(可执行.R文件)
1.概述
⑴ 下面定义的函数可以如下调用。
受保护_0
① 但是,上述代码可能会出现以下问题。
② 问题1. sum 错误 (dim(scRNaseqData): 缺少参数“b”,没有默认值
③ 问题2. “do.call” r 参数”b”丢失,没有默认值
⑵ .R文件的使用方法如下:
受保护_1
⑶ 下面定义的函数可以如下使用:
受保护_2
2.基础知识
⑴ 检查数据类型
受保护_3
⑵ 一个函数,它在一个自然数前面填充几个零,得到总共五位数字。
受保护_4
⑶ 等待回车的函数。 ([参考](https://stackoverflow.com/questions/15272916/how-to-wait-for-a-keypress-in-r))
受保护_5
⑷ 多重处理
受保护_6
⑸ %in% 运算符
受保护_7
3。文件输入/输出
⑴ 检查目标文件夹是否存在
受保护_8
⑵ 检查目标文件夹是否有写权限
受保护_9
⑶ 在“destination.folder”下创建“Filtered_bams”文件夹
受保护_10
⑷ 读取.gz文件并解压缩的代码
受保护_11
4。向量和矩阵
⑴ 将给定向量按a、b、c的顺序排序。
受保护_12
⑵ 给定字符串(given_str)是否包含特定字符串(partial_str):grepl(参考)
受保护_13
⑶ 包含来自给定字符串向量的特定字符串“str”的索引输出。
受保护_14
⑷ 三个向量的交集
受保护_15
⑸ 将给定向量的 NA 部分转换为零的函数
受保护_16
⑹ 排除给定向量的 NA 部分的函数
受保护_17
⑺ 用给定向量中的另一个元素替换特定元素的函数
受保护_18
⑻ 返回矩阵或数据框左上角的函数
受保护_19
⑼ 给定任意两个矩阵时输出 cbind 的函数
受保护_20
⑽ 给定任意两个矩阵时输出 rbind 的函数
受保护_21
⑾ 输出给定矩阵或数据框中的 A 行和 B 行的函数
受保护_22
⑿ 在给定矩阵或数据框中切换 A 列和 B 列的函数
受保护_23
5。 gsub
⑴ 从给定字符串中删除连字符(-)的函数
受保护_24
⑵ 从给定字符串中删除“(”)等特殊符号的函数(参考)
受保护_25
⑶ 从给定字符串中删除 x 和 x 之后的所有字符的函数(参考)
受保护_26
⑷ 删除 后面所有数字的函数。和 。来自给定字符串,对于“ABCD.123”
受保护_27
⑸ 从给定字符串中删除 x 和 x 之前的所有字符的函数
受保护_28
⑹ 给定字符串类型变量(’given_str’)中从头到尾用“x”填充字符并返回的函数
受保护_29
⑺ 用于收集给定字符串(’given_str’)内遵循特定模式的数字的代码
受保护_30
6。统计分析
⑴ 10%到90%的百分位数代码
受保护_31
⑵ n!取log10得到的值!
受保护_32
⑶ 获取[二项式系数]的函数(https://nate9389.tistory.com/1221#footnote_link_67_52) nCk,即从n中选择k的情况数:改进代码,因为简单地使用阶乘就可以创建inf
受保护_33
⑷ 两组间t检验
受保护_34
⑸ 两组间ANOVA检验
受保护_35
⑹ 三组间ANOVA检验
受保护_36
⑺ 四组间ANOVA检验
受保护_37
⑻ 五组间方差分析检验
受保护_38
⑼ 六组间的ANOVA检验
受保护_39
⑽ 研究两个向量的FC、p值
受保护_40
⑾ 如何使用费舍尔效应检验检验两组的统计等价性(第 1 版)
受保护_41
⑿ 如何使用费舍尔效应检验检验两组的统计等价性(版本 2)
受保护_42
⒀ MIA 测定(富集)
受保护_43
⒁ MIA 测定(耗尽)
受保护_44
7.生物信息学
⑴ 探索以特定关键词开头的基因
受保护_45
⑵ enembl_gene_id 与gene_symbol 之间的转换
①从ensembl.gene转换为gene.symbol
受保护_46
② 从 enembl.gene 转换为gene.symbol(使用表格)
受保护_47
③ 将gene.symbol转换为ensembl.gene
受保护_48
④ 从 gen.symbol 转换为 enembl.gen(使用表格)
受保护_49
⑤ 人类整体转录物到基因名称(参考)
受保护_50
⑥ 小鼠基因转MGI符号(使用表格)
受保护_51
⑦ MGI符号转小鼠基因(使用表格)
受保护_52
⑧人类基因转HGNC符号(使用表格)
受保护_53
⑨ 人类基因的HGNC符号(使用表格)
受保护_54
⑩【人和小鼠以外的动物转化表】(https://nate9389.tistory.com/837)
⑶ Affymetrix 探针 ID、enembl_gen_id、gain_name
① 将Affymetrix探针ID转换为ensembl_gene_id、gene_name
受保护_55
⑷ 人和小鼠基因同源性
① 概述
○ 人类基因有36601
○ 小鼠体内有32285个基因。
○ 人类和小鼠的基因几乎相同,但也有很多差异。
○ 因此,有必要知道如何将人类基因转化为小鼠基因,或者反之亦然。»> ○ 很多情况下,小鼠基因并不是简单地将小鼠基因大写的人类基因。
② 方法1. BiomaRt
受保护_56
○ 属性1. 确定MGI符号和HGNC符号的对应关系。
○ 属性2. 确定ENSMUSG码与ENSG码的对应关系。
○ 属性3. 确定NCBI增益ID与NCBI增益ID之间的对应关系。
○ 对于每个属性,左边是鼠标的信息,右边是人物的信息。
○ 目前不起作用:目前,已发现以下错误信息,且不起作用。
受保护_57
受保护_58
⑸ 染色体位置到hgnc_symbol
受保护_59
受保护_60
⑺ 基因名称描述
受保护_61
⑻ 基因名称转bioType
受保护_62
⑼ 更改Seurat对象对象基因的名称:需要创建一个新对象(参考)
受保护_63
⑽ 更改集群信息
受保护_64
⑾ Idents 允许您为所需的元数据编写 FindAllMarkers (参考1,参考2)
受保护_65
⑿ 重新排序 Seurat 对象的 orig.ident 图中的位置
受保护_66
⒀ 将 Seurat 对象 pbmc3k 保存为 h5ad (参考)
受保护_67
① 生成的.h5ad文件可以在Python中使用以下代码打开
受保护_68
⒁ 将 Seurat 对象另存为 h5ad (ver.2)
① 自Seurat版本更新到5.0后,上述方法不再适用。
受保护_69
⒂ 当tissue_dir目录下有matrix.mtx、barcodes.tsv、features.tsv文件和spatial文件夹时,提供在R中读取Visium数据的代码。
受保护_70
⒃ 提供在R中读取.h5ad格式保存的Visium数据的代码。
受保护_71
⒄ 获取高变异基因的代码
受保护_72
⒅ PCA
受保护_73
受保护_74
8. 情节生成
⑴ 将图片存储为png的示例
受保护_75
⑵ 绘制散点图与给定 x 和 y 的斜率之间的置信区间的函数
受保护_76
⑶ 当给定 x、y 和颜色时绘制空间特征图的函数
受保护_77
⑷ 空间特征图
受保护_78
⑸ 给定gene.list、log FC值向量和调整后的p value向量的增强火山图
受保护_79
⑹ 如何从基因列表中找到基因本体(GO)
受保护_80
⑺ 如何从基因列表中绘制基因本体论 (GO) 图 (▶ 如何解读 GO 图)
受保护_81
⑻ 如何从基因列表中绘制cnetplot
受保护_82
⑼ 小提琴图与统计分析
受保护_83
输入:2022.05.03 00:13