Python 中有用的函数
推荐:【Python】【Python索引】(https://jb243.github.io/pages/786)、【生物信息学】【生物信息分析索引】(https://jb243.github.io/pages/836)
1. 概述
2. 基础知识
3. 数学函数
4. 文件输入和输出
5. 数据结构
6. 图像处理
7. 数据科学
8. 深度学习函数
9. 异常处理
10. 生物信息学
a. Python语法
b. Python 应用程序库
c. R 中有用的主要函数集合
1.概述
⑴ 下面定义的函数可以按如下方式调用。从 GitHub 调用 .py 到 python。
受保护_0
⑵ 下面定义的函数可以如下使用。 Python 在定义函数时使用“def”,就像 C 语言一样。
受保护_1
2.基础知识
⑴ 必须记住的代码
① 类型检查:
type(x)
② 长度:
len(x)
③ 尺寸(例如
numpy.ndarray、cv2.imread):x.shape
④ 尺寸(例如
PIL.PngImagePlugin.PngImageFile、PIL.Image.open):x.size
⑤ 投射到
int:.astype(int)
⑥ 给定数组中的一组唯一元素:
.unique()
⑦ 等待 x 秒:
time.sleep(x)
⑧ 当您有列表时创建带索引的 for 循环的简单方法:
for index, e in enumerate(my_list): ...
⑨ 将给定的句子用“_”分割,只取前面的部分:
myStr.split('')[0]
⑵ 将自然数补零,使其总共五位数的函数
受保护_2
⑶ 给定字符串全部小写字母或全部大写字母
受保护_3
⑷ 给定字符串是否包含部分字符串
受保护_4
⑸ 给定字符串是否以特定字符串结尾
受保护_5
⑹ 给定字符串(give_str)是否包含特定字符串(partial_str)
受保护_6
⑺ 从给定字符串(str)中删除前几个字符并返回它们的函数
受保护_7
⑻ 从给定字符串 (str) 中删除最后几个字符并返回它们的函数
受保护_8
⑼ 给定元素(e)是否包含在列表(l)中
受保护_9
⑽ 输出哪个元素(e)在列表(l)中的函数
受保护_10
⑾ 输出两个列表交集的函数
受保护_11
⑿ 日期表示法转换功能:以“Mar 02, 2018”转换为20180301。
受保护_12
⒀ 创建一个包含两个列表的数据框
受保护_13
⒁ 获取函数的源代码
受保护_14
⒂ 接收字符串形式的变量名称并动态利用它们
受保护_15
3。数学函数
⑴ 求最大公约数的代码
受保护_16
4。字段输入和输出
⑴csv文件读取
受保护_17
⑵ 文本文件读取
受保护_18
⑶ 切换到数据框并写入.csv:使用 iloc 从 pandas.DataFrame 获取精确的行和列
受保护_19
⑷ 读取目录下所有.csv文件
受保护_20
⑸ 创建、读取和分组 HDF (.h5) 文件⑹ 网站爬取(参考)
受保护_21
⑺ 合并 PDF 文件(参考)
受保护_22
⑻ HTML 到 MarkDown
受保护_23
⑼ MarkDown 到 HTML
受保护_24
⑽ 合并给定文件夹中的所有 PDF 文件(按字母顺序排列)
受保护_25
⑾ 收集特定 HTML 文档的所有下载链接,然后下载文件
受保护_26
⑿ 将一个 GIF 文件分割成多个 PNG 文件的代码。
受保护_27
⒀ 输出目录树结构的代码
受保护_28
⒁ 将 PDF 文件拆分为每个页面的单独 PDF 文件
受保护_29
5。数据结构
⑴ 概述
① 数组
② 链接列表
③ 堆栈
④ 队列
⑤ 树
⑥ 图
⑦ 哈希
⑧ 【设置】(https://nate9389.tistory.com/2132#footnote_link_67_58)
⑵ 统计岛屿算法:统计世界上1为陆地、0为水域时岛屿数量的函数,是一个M×N的列表
受保护_30
6。图像处理
⑴【基本图形生成代码】(https://nate9389.tistory.com/1192#footnote_link_67_53)
① 给定 x, y 绘制散点图的函数
受保护_31
② 绘制给定图像直方图的函数
受保护_32
③ 绘制4参数逻辑(4PL)曲线的代码:在药理学的药物反应曲线中大量使用。
受保护_33
⑵ 图像保存
① 将图像保存为 png 的示例 (ref)
受保护_34
② 将图像另存为pdf的示例
受保护_35
⑶ cv2图像RGB颜色重排
受保护_36
⑷ cv2图像resize:例如img为(1024, 1024, 3),img_re为(512, 512, 3)。
受保护_37
⑸ RGB图像到灰度图像的转换
受保护_38
⑹ 将红色图像(1×W×H)从3通道RGB图像修改为二维图像(W×H)的函数
受保护_39
⑺ 将图像中的一个值替换为另一个值的函数
受保护_40
⑻ 将整数的 numpy.ndarray 更改为实数的 numpy.ndarray (参考)
受保护_41
⑼ 一幅图像中红色和绿色的相关性
受保护_42
⑽ 两幅图像之间的相关性
受保护_43
⑾ 一幅 3D 图像中红色和绿色之间的相关性
受保护_44
⑿ 获取一对图像的SSIM值的代码
受保护_45
⒀ 获取一对图像的互信息值的代码(参考)
受保护_46
⒁ 获取回归曲线的代码
受保护_47
⒂ 在空间转录组学 (ST) 中给定背景图像、x 坐标、y 坐标和颜色 c 时,创建点映射图像。
受保护_48
⒃ 决定图像浮雕和凹雕的函数:如果返回值(-1到1)为正,则为浮雕;否则为凹版。
受保护_49
⒄ 一个有用的代码,可以组合多个图像来表示一个图像
受保护_50
⒅ 图片base64编码被截断时的解密代码。
受保护_51
⒆ 图表到文本 (ref)
⒇ 创建与给定图像大小相同的随机图像
受保护_52
⒇ 大津阈值法
受保护_53
⒇ 在互联网上可视化图像
受保护_54
7.数据科学
⑴ K表示聚类
受保护_55
⑵ 根据序列计算基尼系数
受保护_56
⑶ 给定序列时计算香农项
受保护_57
8.深度学习功能
⑴ 深度学习示例:将深度学习模型应用于 MNIST(即手写数字)数据集。
受保护_58
⑵ 当存在 60,000 个数据 Xtr 和 60,000 个标签 Ytr 时将 10,000 个 Xte 分类为 KNN 的算法
受保护_59
⑶ 一维CNN实现的二元分类器功能
受保护_60
⑷ 通过预训练的CNN从任意图像中提取512维特征的函数
受保护_61
⑸ 从 Hugging Face 中获取 BERT 或 BioBERT 来为给定句子创建注意力矩阵的函数
受保护_62
⑹ 将任意变长自然语言句子转换为 384 维,同时考虑其含义的函数。 (参见 CeLLaMA)
受保护_63
⑺【自然语言处理与LLM实用函数合集】(https://jb243.github.io/pages/2404)
9。异常处理
⑴ 基本异常处理语法
受保护_64
⑵ 打印错误信息(参考)
受保护_65
10。生物信息学
⑴ 获取高变异基因的代码
受保护_66
⑵ 获取最高表达基因的代码
受保护_67
⑶ GO 情节(第 1 版)(not recommended)
受保护_68
⑷ GO 情节(第 2 版)(recommended)
受保护_69
① gseapy 似乎与 plt.subplot 不兼容。
⑸ 使用表格将ensembl.gene 转换为gene.symbol
受保护_70
⑹ 使用表格将gene.symbol转换为ensembl.gene
受保护_71
⑺ 人类基因、小鼠基因互变
受保护_72
⑻ 当存在包含matrix.mtx、barcodes.tsv、features.tsv和spatial文件夹的tissue_dir目录时,Python中读取Visium数据的代码。
受保护_73
⑼【有机化学相关Python函数合集】(https://jb243.github.io/pages/2396)
⑽ 获取人和小鼠基因序列(但只需人类基因)
受保护_74
⑾ 将图像放入 Visium anndata obs 的 Python 代码。
受保护_75
⑿ 将Visium ST数据读取为AnnData,然后进行数据QC(质量控制)操作的代码
受保护_76
⒀ 放大 sc.pl.spatial 尺寸。
受保护_77
⒁ 从 sc.pl.spatial 中删除颜色条
受保护_78
⒂ 转置数据:交换基因名称和条形码名称
受保护_79
⒃ 当您有matrix.mtx、barcodes.tsv 和features.tsv(或genes.tsv)时创建h5ad 文件:假设所有三个文件具有相同的前缀。
受保护_80
⒄ 将 adata 对象列表连接成单个 adata 的代码
受保护_81
⒅ 用于提供 H5 文件中每个条形码的读取次数的代码。
受保护_82
⒆ 用于从 h5 文件提供特征(基因)的代码。
受保护_83
⒇ 使用omnipath输出包含特定基因的所有配体-受体对
受保护_84
⒇ 返回表示 DNA 序列的输入字符串的反向补码。
受保护_85
⒇ 从多个序列列表构建位置频率矩阵 (PFM)
① 对于 A、C、G 和 T,
ord(char) >> 1 & 3的结果分别变为 0、1、3 和 2。
② 长度 ≥ max(len(seq))
受保护_86
⒇ 从 PFM 构造 PWM(统一分配 p = 0.25 和 bg = 0.25)
受保护_87
⒇ 根据 PWM 计算给定序列的得分。
受保护_88
⒇ Motif 搜索算法:对于长序列,搜索与 PWM 分数最高的 PWM 长度对应的 k 聚体,同时考虑 + 链和 - 链。
受保护_89
⒇ BWT模式匹配:测序比对的核心原理
受保护_90
⒇ GSEA Python 代码
受保护_91
⒇ BANKSY: 空间转录组学的空间域识别算法
受保护_92
输入:2022.05.07 00:43