抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

げんえい

博学而笃志,切问而近思

snakemake是一款强大的工作流管理工具,用于构建和运行复杂的数据分析工作流。其工作流是基于python语言描述的,类似于Makefile的工作流描述语言。Makefile指定的是源文件之间的依赖关系,以及如何将它们编译成可执行文件和库,而snakemake指定的是数据处理过程中的依赖关系和规则,并自动化执行这些规则生成最终的输出。

最近基因家族分析的文章越来越多(铺天盖地的培训班宣传),知网上几乎天天都有更新这类文章。很多的这类文章都是纯生信分析,用的公共数据库中的基因组、蛋白序列和转录组数据,最多加个qPCR验证(甚至有些文章都没有),内容没有深度比较氵。写这篇笔记并不是鼓励大家水文章,只是掌握一门分析方法,不要把这类分析看得太难,0代码基础也可以做分析。

整理一下前段时间做的基因家族分析笔记,这部分分析用的代码部分比较少,因为有现成的软件以及网站可以分析,没什么太多需要自己创造的地方,按部就班的分析流程实在让我提不起兴趣……简单记录下需要自己整理数据和写代码作图的部分——基因家族顺式作用元件预测。

经历了三个月小论文+大论文的摧残,最近终于闲下来了一点,继续更新一下学习笔记~

今天主要记录下怎么做的转录组趋势(时序)分析。大多数时候,我们的转录组数据不仅仅只有一组处理组和对照组,比如梯度实验会设置不同处理浓度,或者同一浓度处理下设置不同取样时间,来观察取样组织中基因随着浓度、时间等的变化规律,也就是进行基因表达的趋势分析

最近在做非模式生物的GO和KEGG富集分析,参考了网上的一些帖子和知乎专栏,发现代码总有一些小问题,于是自己摸索修改终于跑通了= =,这里做个记录。

最近用自己组装的植物基因组在做基因家族分析,简单记录下自己对数据的处理以及分析的流程。

随着现在测序技术的普及,越来越多的植物做了全基因组测序,对于基因组比较小的植物,现在纯做基因组组装和注释已经很难发文章了,一般来说我们还要再提出和解决一些生物学问题,最基础的就是通过比较基因组学,对系统发育中的代表性物种之间的基因家族进行比较分析、构建系统发育图谱,来揭示这些基因家族的起源和功能。

最近在做一个植物物种的基因家族分析,花了一周时间把能做的图都做了一遍,有空就把所有分析流程都记录一下。

先说一个蛋白性质和序列分析中碰到的问题,我这里也收录了不少蛋白类的在线分析工具和数据库,可以点击这里查看 (shelven.com),这些工具我每年会做一次更新。有的在线分析网站只能输入一条序列分析,当你手上很多序列的时候,一条条数据复制粘贴,点击提交,然后下一个页面再复制粘贴你要的数据,属实麻烦= =

今天收到一封来自github的邮件,大致的意思是需要我在一个半月内完成2FA认证,否则后续将无法登录github。

Numpy(Numerical Python)是python的一个语言拓展程序库,它提供了一个强大的多维数组对象(ndarray),以及用于操作数组的函数和工具。NumPy是许多其他科学计算库和数据分析库的基础,如SciPy(Scientfic Python)、Pandas和Matplotlib(绘图库)。

事情是这样的,为了存放qq机器人的用户数据,昨天我下载了PostgreSQL的docker镜像,当时docker运行一切正常。然后今天下午3点过,服务器商那边发了个邮件提醒服务器存在恶意文件,一连发了三条: