RepBaseRepeatMaskerEdition下载 | RepeatMasker

开源的生物信息世界居然有这么个需要注册才能下载的工具,开源世界不是怎么方便怎么来吗?

这个注册真的麻烦,这里上传了一个可以使用的版本。

想转成fasta可以用如下命令:

awk -f awk.sh RMRBSeqs.embl > raw.fasta
cat raw.fasta | cut -f1-9 -d | sed -e s/ID   //g | sed -e s/repeatmasker;//g| sed -e s/ //g > RepBase.fasta
awk -f awk.sh RMRBSeqs.embl > raw.fasta cat raw.fasta | cut -f1-9 -d | sed -e s/ID //g | sed -e s/repeatmasker;//g| sed -e s/ //g > RepBase.fasta

其中awk.sh文件内容为:

/^ID/   {printf(">%s;",$0); next;}
/^(PT|PA)/  {printf(" %s;",$0); next;}
/^/// {printf("
"); next;}
/^    / {printf("
%s",substr($0,5)); next;}
    {
    /* ignore default */
    }
END   {
    printf("
");
    }
/^ID/ {printf(">%s;",$0); next;} /^(PT|PA)/ {printf(" %s;",$0); next;} /^/// {printf(" "); next;} /^ / {printf(" %s",substr($0,5)); next;} { /* ignore default */ } END { printf(" "); }
开源的生物信息世界居然有这么个需要注册才能下载的工具,开源世界不是怎么方便怎么来吗? 这个注册真的麻烦,这里上传了一个可以使用的版本。 想转成fasta可以用如下命令: awk -f awk.sh RMRBSeqs.embl > raw.fasta cat raw.fasta | cut -f1-9 -d | sed -e s/ID //g | sed -e s/repeatmasker;//g| sed -e s/ //g > RepBase.fasta 其中awk.sh文件内容为: /^ID/ {printf(">%s;",$0); next;} /^(PT|PA)/ {printf(" %s;",$0); next;} /^/// {printf(" "); next;} /^ / {printf(" %s",substr($0,5)); next;} { /* ignore default */ } END { printf(" "); }
经验分享 程序员 微信小程序 职场和发展