Korean, Edit

Python 中有用的函数

推荐:【Python】【Python索引】(https://jb243.github.io/pages/786)、【生物信息学】【生物信息分析索引】(https://jb243.github.io/pages/836)


1. 概述

2. 基础知识

3. 数学函数

4. 文件输入和输出

5. 数据结构

6. 图像处理

7. 数据科学

8. 深度学习函数

9. 异常处理

10. 生物信息学


a. Python语法

b. Python 应用程序库

c. R 中有用的主要函数集合



1.概述

⑴ 下面定义的函数可以按如下方式调用。从 GitHub 调用 .py 到 python。


受保护_0


⑵ 下面定义的函数可以如下使用。 Python 在定义函数时使用“def”,就像 C 语言一样。


受保护_1



2.基础知识

⑴ 必须记住的代码

① 类型检查:type(x)

② 长度:len(x)

③ 尺寸(例如numpy.ndarraycv2.imread):x.shape

④ 尺寸(例如PIL.PngImagePlugin.PngImageFilePIL.Image.open):x.size

⑤ 投射到 int: .astype(int)

⑥ 给定数组中的一组唯一元素:.unique()

⑦ 等待 x 秒:time.sleep(x)

⑧ 当您有列表时创建带索引的 for 循环的简单方法:for index, e in enumerate(my_list): ...

⑨ 将给定的句子用“_”分割,只取前面的部分:myStr.split('')[0]

⑵ 将自然数补零,使其总共五位数的函数


受保护_2


⑶ 给定字符串全部小写字母或全部大写字母


受保护_3


⑷ 给定字符串是否包含部分字符串


受保护_4


⑸ 给定字符串是否以特定字符串结尾


受保护_5


⑹ 给定字符串(give_str)是否包含特定字符串(partial_str)


受保护_6


⑺ 从给定字符串(str)中删除前几个字符并返回它们的函数


受保护_7


⑻ 从给定字符串 (str) 中删除最后几个字符并返回它们的函数


受保护_8


⑼ 给定元素(e)是否包含在列表(l)中


受保护_9


⑽ 输出哪个元素(e)在列表(l)中的函数


受保护_10


⑾ 输出两个列表交集的函数


受保护_11


⑿ 日期表示法转换功能:以“Mar 02, 2018”转换为20180301。


受保护_12


⒀ 创建一个包含两个列表的数据框


受保护_13


⒁ 获取函数的源代码


受保护_14


⒂ 接收字符串形式的变量名称并动态利用它们


受保护_15



3。数学函数

⑴ 求最大公约数的代码


受保护_16



4。字段输入和输出

⑴csv文件读取


受保护_17


⑵ 文本文件读取


受保护_18


⑶ 切换到数据框并写入.csv:使用 iloc 从 pandas.DataFrame 获取精确的行和列


受保护_19


⑷ 读取目录下所有.csv文件


受保护_20


创建、读取和分组 HDF (.h5) 文件⑹ 网站爬取(参考)


受保护_21


⑺ 合并 PDF 文件(参考


受保护_22


⑻ HTML 到 MarkDown


受保护_23


⑼ MarkDown 到 HTML


受保护_24


⑽ 合并给定文件夹中的所有 PDF 文件(按字母顺序排列)


受保护_25

⑾ 收集特定 HTML 文档的所有下载链接,然后下载文件


受保护_26

⑿ 将一个 GIF 文件分割成多个 PNG 文件的代码。


受保护_27


⒀ 输出目录树结构的代码


受保护_28

⒁ 将 PDF 文件拆分为每个页面的单独 PDF 文件


受保护_29



5。数据结构

⑴ 概述

数组

链接列表

堆栈

队列

哈希

⑧ 【设置】(https://nate9389.tistory.com/2132#footnote_link_67_58)

⑵ 统计岛屿算法:统计世界上1为陆地、0为水域时岛屿数量的函数,是一个M×N的列表


受保护_30



6。图像处理

⑴【基本图形生成代码】(https://nate9389.tistory.com/1192#footnote_link_67_53)

① 给定 x, y 绘制散点图的函数


受保护_31


② 绘制给定图像直方图的函数


受保护_32


③ 绘制4参数逻辑(4PL)曲线的代码:在药理学的药物反应曲线中大量使用。


受保护_33


⑵ 图像保存

① 将图像保存为 png 的示例 (ref)


受保护_34


② 将图像另存为pdf的示例


受保护_35


⑶ cv2图像RGB颜色重排


受保护_36


⑷ cv2图像resize:例如img为(1024, 1024, 3),img_re为(512, 512, 3)。


受保护_37


⑸ RGB图像到灰度图像的转换


受保护_38


⑹ 将红色图像(1×W×H)从3通道RGB图像修改为二维图像(W×H)的函数


受保护_39


⑺ 将图像中的一个值替换为另一个值的函数


受保护_40


⑻ 将整数的 numpy.ndarray 更改为实数的 numpy.ndarray (参考)


受保护_41


⑼ 一幅图像中红色和绿色的相关性


受保护_42


⑽ 两幅图像之间的相关性


受保护_43


⑾ 一幅 3D 图像中红色和绿色之间的相关性


受保护_44


⑿ 获取一对图像的SSIM值的代码


受保护_45


⒀ 获取一对图像的互信息值的代码(参考


受保护_46


⒁ 获取回归曲线的代码


受保护_47


⒂ 在空间转录组学 (ST) 中给定背景图像、x 坐标、y 坐标和颜色 c 时,创建点映射图像。


受保护_48


⒃ 决定图像浮雕和凹雕的函数:如果返回值(-1到1)为正,则为浮雕;否则为凹版。


受保护_49


⒄ 一个有用的代码,可以组合多个图像来表示一个图像


受保护_50


⒅ 图片base64编码被截断时的解密代码。


受保护_51


⒆ 图表到文本 (ref)

⒇ 创建与给定图像大小相同的随机图像


受保护_52


大津阈值法


受保护_53


⒇ 在互联网上可视化图像


受保护_54



7.数据科学

⑴ K表示聚类


受保护_55


⑵ 根据序列计算基尼系数


受保护_56


⑶ 给定序列时计算香农项


受保护_57



8.深度学习功能

⑴ 深度学习示例:将深度学习模型应用于 MNIST(即手写数字)数据集。


受保护_58


⑵ 当存在 60,000 个数据 Xtr 和 60,000 个标签 Ytr 时将 10,000 个 Xte 分类为 KNN 的算法


受保护_59


⑶ 一维CNN实现的二元分类器功能


受保护_60


⑷ 通过预训练的CNN从任意图像中提取512维特征的函数


受保护_61


⑸ 从 Hugging Face 中获取 BERT 或 BioBERT 来为给定句子创建注意力矩阵的函数


受保护_62


⑹ 将任意变长自然语言句子转换为 384 维,同时考虑其含义的函数。 (参见 CeLLaMA


受保护_63


⑺【自然语言处理与LLM实用函数合集】(https://jb243.github.io/pages/2404)



9。异常处理

⑴ 基本异常处理语法


受保护_64


⑵ 打印错误信息(参考


受保护_65



10。生物信息学

⑴ 获取高变异基因的代码


受保护_66


⑵ 获取最高表达基因的代码


受保护_67


⑶ GO 情节(第 1 版)(not recommended)


受保护_68


⑷ GO 情节(第 2 版)(recommended)


受保护_69


① gseapy 似乎与 plt.subplot 不兼容。

⑸ 使用表格将ensembl.gene 转换为gene.symbol


受保护_70


⑹ 使用表格将gene.symbol转换为ensembl.gene


受保护_71


⑺ 人类基因、小鼠基因互变


受保护_72


⑻ 当存在包含matrix.mtx、barcodes.tsv、features.tsv和spatial文件夹的tissue_dir目录时,Python中读取Visium数据的代码。


受保护_73


⑼【有机化学相关Python函数合集】(https://jb243.github.io/pages/2396)


图片


⑽ 获取人和小鼠基因序列(但只需人类基因)


受保护_74


⑾ 将图像放入 Visium anndata obs 的 Python 代码。


受保护_75


⑿ 将Visium ST数据读取为AnnData,然后进行数据QC(质量控制)操作的代码


受保护_76


⒀ 放大 sc.pl.spatial 尺寸。


受保护_77


⒁ 从 sc.pl.spatial 中删除颜色条


受保护_78


⒂ 转置数据:交换基因名称和条形码名称


受保护_79


⒃ 当您有matrix.mtx、barcodes.tsv 和features.tsv(或genes.tsv)时创建h5ad 文件:假设所有三个文件具有相同的前缀。


受保护_80


⒄ 将 adata 对象列表连接成单个 adata 的代码


受保护_81


⒅ 用于提供 H5 文件中每个条形码的读取次数的代码。


受保护_82


⒆ 用于从 h5 文件提供特征(基因)的代码。


受保护_83


⒇ 使用omnipath输出包含特定基因的所有配体-受体对


受保护_84


⒇ 返回表示 DNA 序列的输入字符串的反向补码。


受保护_85


⒇ 从多个序列列表构建位置频率矩阵 (PFM)

① 对于 A、C、G 和 T,ord(char) >> 1 & 3 的结果分别变为 0、1、3 和 2。

② 长度 ≥ max(len(seq))


受保护_86


⒇ 从 PFM 构造 PWM(统一分配 p = 0.25 和 bg = 0.25)


受保护_87


⒇ 根据 PWM 计算给定序列的得分。


受保护_88


⒇ Motif 搜索算法:对于长序列,搜索与 PWM 分数最高的 PWM 长度对应的 k 聚体,同时考虑 + 链和 - 链。


受保护_89


⒇ BWT模式匹配:测序比对的核心原理


受保护_90


GSEA Python 代码


受保护_91


BANKSY: 空间转录组学的空间域识别算法


受保护_92



输入:2022.05.07 00:43

results matching ""

    No results matching ""