Korean, Edit

R 中有用的主要函数的集合

高级类别:【RStudio】【R Studio索引】(https://jb243.github.io/pages/1761)、【生物信息学】【生物信息分析索引】(https://jb243.github.io/pages/836)


1. 概述

2. 基础知识

3. 文件I/O

4. 向量和矩阵

5. gsub

6. 统计分析

7. 生物信息学

8. 绘图生成


a. GitHub(可执行.R文件)

b. Python 中的有用函数



1.概述

⑴ 下面定义的函数可以如下调用。


受保护_0


① 但是,上述代码可能会出现以下问题。

问题1. sum 错误 (dim(scRNaseqData): 缺少参数“b”,没有默认值

问题2. “do.call” r 参数”b”丢失,没有默认值

⑵ .R文件的使用方法如下:


受保护_1


⑶ 下面定义的函数可以如下使用:


受保护_2



2.基础知识

⑴ 检查数据类型


受保护_3


⑵ 一个函数,它在一个自然数前面填充几个零,得到总共五位数字。


受保护_4


⑶ 等待回车的函数。 ([参考](https://stackoverflow.com/questions/15272916/how-to-wait-for-a-keypress-in-r))


受保护_5


⑷ 多重处理


受保护_6


⑸ %in% 运算符


受保护_7



3。文件输入/输出

⑴ 检查目标文件夹是否存在


受保护_8


⑵ 检查目标文件夹是否有写权限


受保护_9


⑶ 在“destination.folder”下创建“Filtered_bams”文件夹


受保护_10


⑷ 读取.gz文件并解压缩的代码


受保护_11



4。向量和矩阵

⑴ 将给定向量按a、b、c的顺序排序。


受保护_12


⑵ 给定字符串(given_str)是否包含特定字符串(partial_str):grepl(参考)


受保护_13


⑶ 包含来自给定字符串向量的特定字符串“str”的索引输出。


受保护_14


⑷ 三个向量的交集


受保护_15


⑸ 将给定向量的 NA 部分转换为零的函数


受保护_16


⑹ 排除给定向量的 NA 部分的函数


受保护_17


⑺ 用给定向量中的另一个元素替换特定元素的函数


受保护_18


⑻ 返回矩阵或数据框左上角的函数


受保护_19


⑼ 给定任意两个矩阵时输出 cbind 的函数


受保护_20


⑽ 给定任意两个矩阵时输出 rbind 的函数


受保护_21


⑾ 输出给定矩阵或数据框中的 A 行和 B 行的函数


受保护_22


⑿ 在给定矩阵或数据框中切换 A 列和 B 列的函数


受保护_23



5。 gsub

⑴ 从给定字符串中删除连字符(-)的函数


受保护_24


⑵ 从给定字符串中删除“(”)等特殊符号的函数(参考


受保护_25


⑶ 从给定字符串中删除 x 和 x 之后的所有字符的函数(参考


受保护_26


⑷ 删除 后面所有数字的函数。和 。来自给定字符串,对于“ABCD.123”


受保护_27


⑸ 从给定字符串中删除 x 和 x 之前的所有字符的函数


受保护_28


⑹ 给定字符串类型变量(’given_str’)中从头到尾用“x”填充字符并返回的函数


受保护_29


⑺ 用于收集给定字符串(’given_str’)内遵循特定模式的数字的代码


受保护_30



6。统计分析

⑴ 10%到90%的百分位数代码


受保护_31


⑵ n!取log10得到的值!


受保护_32


⑶ 获取[二项式系数]的函数(https://nate9389.tistory.com/1221#footnote_link_67_52) nCk,即从n中选择k的情况数:改进代码,因为简单地使用阶乘就可以创建inf


受保护_33


⑷ 两组间t检验


受保护_34


⑸ 两组间ANOVA检验


受保护_35


⑹ 三组间ANOVA检验


受保护_36


⑺ 四组间ANOVA检验


受保护_37


⑻ 五组间方差分析检验


受保护_38


⑼ 六组间的ANOVA检验


受保护_39


⑽ 研究两个向量的FC、p值


受保护_40


⑾ 如何使用费舍尔效应检验检验两组的统计等价性(第 1 版)


受保护_41


⑿ 如何使用费舍尔效应检验检验两组的统计等价性(版本 2)


受保护_42


⒀ MIA 测定(富集)


受保护_43


⒁ MIA 测定(耗尽)


受保护_44



7.生物信息学

⑴ 探索以特定关键词开头的基因


受保护_45


⑵ enembl_gene_id 与gene_symbol 之间的转换

①从ensembl.gene转换为gene.symbol


受保护_46


② 从 enembl.gene 转换为gene.symbol(使用表格)

human_genes_36601.tsv

mouse_genes_32285.tsv


受保护_47


③ 将gene.symbol转换为ensembl.gene


受保护_48


④ 从 gen.symbol 转换为 enembl.gen(使用表格)


受保护_49


⑤ 人类整体转录物到基因名称(参考


受保护_50


⑥ 小鼠基因转MGI符号(使用表格)


受保护_51


⑦ MGI符号转小鼠基因(使用表格)


受保护_52


⑧人类基因转HGNC符号(使用表格)


受保护_53


⑨ 人类基因的HGNC符号(使用表格)


受保护_54


⑩【人和小鼠以外的动物转化表】(https://nate9389.tistory.com/837)

⑶ Affymetrix 探针 ID、enembl_gen_id、gain_name

① 将Affymetrix探针ID转换为ensembl_gene_id、gene_name


受保护_55


⑷ 人和小鼠基因同源性

① 概述

○ 人类基因有36601

○ 小鼠体内有32285个基因。

○ 人类和小鼠的基因几乎相同,但也有很多差异。

○ 因此,有必要知道如何将人类基因转化为小鼠基因,或者反之亦然。»> ○ 很多情况下,小鼠基因并不是简单地将小鼠基因大写的人类基因。

方法1. BiomaRt


受保护_56


属性1. 确定MGI符号和HGNC符号的对应关系。

属性2. 确定ENSMUSG码与ENSG码的对应关系。

属性3. 确定NCBI增益ID与NCBI增益ID之间的对应关系。

○ 对于每个属性,左边是鼠标的信息,右边是人物的信息。

○ 目前不起作用:目前,已发现以下错误信息,且不起作用。


受保护_57


方法2. 使用MGI网站提供的人鼠转换表

HOM_MouseHumanSequence.csv


受保护_58


⑸ 染色体位置到hgnc_symbol


受保护_59


⑹ 基因名称到染色体位置:使用转换表(human, 鼠标)


受保护_60


⑺ 基因名称描述


受保护_61


⑻ 基因名称转bioType


受保护_62


⑼ 更改Seurat对象对象基因的名称:需要创建一个新对象(参考)


受保护_63


⑽ 更改集群信息


受保护_64


Idents 允许您为所需的元数据编写 FindAllMarkers参考1参考2)


受保护_65


⑿ 重新排序 Seurat 对象的 orig.ident 图中的位置


受保护_66


⒀ 将 Seurat 对象 pbmc3k 保存为 h5ad (参考)


受保护_67


① 生成的.h5ad文件可以在Python中使用以下代码打开


受保护_68


⒁ 将 Seurat 对象另存为 h5ad (ver.2)

① 自Seurat版本更新到5.0后,上述方法不再适用。


受保护_69


⒂ 当tissue_dir目录下有matrix.mtx、barcodes.tsv、features.tsv文件和spatial文件夹时,提供在R中读取Visium数据的代码。


受保护_70


⒃ 提供在R中读取.h5ad格式保存的Visium数据的代码。


受保护_71


⒄ 获取高变异基因的代码


受保护_72


PCA


受保护_73


Kaplan-Meier 生存分析


受保护_74



8. 情节生成

⑴ 将图片存储为png的示例


受保护_75


⑵ 绘制散点图与给定 x 和 y 的斜率之间的置信区间的函数


受保护_76


⑶ 当给定 x、y 和颜色时绘制空间特征图的函数


受保护_77


⑷ 空间特征图


受保护_78


⑸ 给定gene.list、log FC值向量和调整后的p value向量的增强火山图


受保护_79


⑹ 如何从基因列表中找到基因本体(GO)


受保护_80


⑺ 如何从基因列表中绘制基因本体论 (GO) 图 ( 如何解读 GO 图)


受保护_81


⑻ 如何从基因列表中绘制cnetplot


受保护_82


⑼ 小提琴图与统计分析


受保护_83



输入:2022.05.03 00:13

results matching ""

    No results matching ""