我的小破站

snakemake初学笔记

snakemake是一款强大的工作流管理工具，用于构建和运行复杂的数据分析工作流。其工作流是基于python语言描述的，类似于Makefile的工作流描述语言。Makefile指定的是源文件之间的依赖关系，以及如何将它们编译成可执行文件和库，而snakemake指定的是数据处理过程中的依赖关系和规则，并自动化执行这些规则生成最终的输出。

2024-04-08 学习笔记

阅读全文

基因家族分析——鉴定基因家族成员

最近基因家族分析的文章越来越多（铺天盖地的培训班宣传），知网上几乎天天都有更新这类文章。很多的这类文章都是纯生信分析，用的公共数据库中的基因组、蛋白序列和转录组数据，最多加个qPCR验证（甚至有些文章都没有），内容没有深度比较氵。写这篇笔记并不是鼓励大家水文章，只是掌握一门分析方法，不要把这类分析看得太难，0代码基础也可以做分析。

2024-04-04 基因家族分析学习笔记

阅读全文

基因家族分析——顺式作用元件预测及作图

整理一下前段时间做的基因家族分析笔记，这部分分析用的代码部分比较少，因为有现成的软件以及网站可以分析，没什么太多需要自己创造的地方，按部就班的分析流程实在让我提不起兴趣……简单记录下需要自己整理数据和写代码作图的部分——基因家族顺式作用元件预测。

2024-04-01 基因家族分析学习笔记

阅读全文

转录组差异基因表达趋势分析

经历了三个月小论文+大论文的摧残，最近终于闲下来了一点，继续更新一下学习笔记~

今天主要记录下怎么做的转录组趋势（时序）分析。大多数时候，我们的转录组数据不仅仅只有一组处理组和对照组，比如梯度实验会设置不同处理浓度，或者同一浓度处理下设置不同取样时间，来观察取样组织中基因随着浓度、时间等的变化规律，也就是进行基因表达的趋势分析。

2024-03-28 学习笔记转录组数据分析

阅读全文

非模式生物的GO和KEGG富集

最近在做非模式生物的GO和KEGG富集分析，参考了网上的一些帖子和知乎专栏，发现代码总有一些小问题，于是自己摸索修改终于跑通了= =，这里做个记录。

2023-12-23 学习笔记

阅读全文

基因家族收缩扩张分析

最近用自己组装的植物基因组在做基因家族分析，简单记录下自己对数据的处理以及分析的流程。

随着现在测序技术的普及，越来越多的植物做了全基因组测序，对于基因组比较小的植物，现在纯做基因组组装和注释已经很难发文章了，一般来说我们还要再提出和解决一些生物学问题，最基础的就是通过比较基因组学，对系统发育中的代表性物种之间的基因家族进行比较分析、构建系统发育图谱，来揭示这些基因家族的起源和功能。

2023-12-01 学习笔记比较基因组学

阅读全文

基因家族分析——自动化提交在线网站数据和处理结果

最近在做一个植物物种的基因家族分析，花了一周时间把能做的图都做了一遍，有空就把所有分析流程都记录一下。

先说一个蛋白性质和序列分析中碰到的问题，我这里也收录了不少蛋白类的在线分析工具和数据库，可以点击这里查看 (shelven.com)，这些工具我每年会做一次更新。有的在线分析网站只能输入一条序列分析，当你手上很多序列的时候，一条条数据复制粘贴，点击提交，然后下一个页面再复制粘贴你要的数据，属实麻烦= =

2023-11-10 基因家族分析学习笔记

阅读全文

python解决github的2FA认证

今天收到一封来自github的邮件，大致的意思是需要我在一个半月内完成2FA认证，否则后续将无法登录github。

2023-11-01 github

阅读全文

Python自学笔记（9）——Numpy库

Numpy(Numerical Python)是python的一个语言拓展程序库，它提供了一个强大的多维数组对象（ndarray），以及用于操作数组的函数和工具。NumPy是许多其他科学计算库和数据分析库的基础，如SciPy(Scientfic Python)、Pandas和Matplotlib(绘图库)。

2023-10-26 编程自学

阅读全文

记一次PostgreSQL漏洞引起的kdevtmpfsi挖矿病毒攻击

事情是这样的，为了存放qq机器人的用户数据，昨天我下载了PostgreSQL的docker镜像，当时docker运行一切正常。然后今天下午3点过，服务器商那边发了个邮件提醒服务器存在恶意文件，一连发了三条：

2023-10-24 网络相关

阅读全文