基因组组装程序linux,基因组组装----SPAdes(一)

前面介绍了SOAPdenovo2的使用,但是由于结果整体不理想,尝试使用另外一个软件SPAdes。

该软件目前的版本支持paired-end reads, mate-pairs及unpaired reads。SPAdes一般用于小基因组组装,不适合大型基因组组装(例:哺乳动物)。官方文档可知第一步和第二步耗内存(cpu),第三步耗磁盘空间(实际是缓存,属于高I/O操作)。

file

SPAdes包含几个单独的模块:

(1) BayesHammer:Illumina reads的read纠错。在单细胞和标准数据集上效果也很好。

(2) IonHammer:IonTorrent(半导体测序,通过半导体芯片直接把化学信号转为数字信号)数据的read纠错。

(3) SPAdes: 迭代short reads基因组组装模块。K的值是根据read长度和数据集类型自动选择的,也可以自己选择。

(4) MismatchCorrector:一种工具,可改善所产生的contig和scaffold的错配和较短的插入缺失。默认是关的,建议打开(对于小型基因组而言)。

运行SPAdes时建议运行BayesHammer或 IonHammer以获得高质量的组装(默认打开),如果你使用别的read纠错工具,该模块可以关闭。

1.组装前准备

(1)文件夹组织形式:

file

c

前面介绍了SOAPdenovo2的使用,但是由于结果整体不理想,尝试使用另外一个软件SPAdes。 该软件目前的版本支持paired-end reads, mate-pairs及unpaired reads。SPAdes一般用于小基因组组装,不适合大型基因组组装(例:哺乳动物)。官方文档可知第一步和第二步耗内存(cpu),第三步耗磁盘空间(实际是缓存,属于高I/O操作)。 file SPAdes包含几个单独的模块: (1) BayesHammer:Illumina reads的read纠错。在单细胞和标准数据集上效果也很好。 (2) IonHammer:IonTorrent(半导体测序,通过半导体芯片直接把化学信号转为数字信号)数据的read纠错。 (3) SPAdes: 迭代short reads基因组组装模块。K的值是根据read长度和数据集类型自动选择的,也可以自己选择。 (4) MismatchCorrector:一种工具,可改善所产生的contig和scaffold的错配和较短的插入缺失。默认是关的,建议打开(对于小型基因组而言)。 运行SPAdes时建议运行BayesHammer或 IonHammer以获得高质量的组装(默认打开),如果你使用别的read纠错工具,该模块可以关闭。 1.组装前准备 (1)文件夹组织形式: file c
经验分享 程序员 微信小程序 职场和发展