perl对应的gff文件格式是什么

perl对应的gff文件格式是什么

本文小编为大家详细介绍“perl对应的gff文件格式是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“perl对应的gff文件格式是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

对应的gff文件是下面的格式:

perl对应的gff文件格式是什么

1araport11gene36315899.+.ID=gene:AT1G01010;Name=NAC001;biotype=protein_coding1araport11mRNA36315899.+.ID=transcript:AT1G01010.1;Parent=gene:AT1G010101araport11five_prime_UTR36313759.+.Parent=transcript:AT1G01010.11araport11exon36313913.+.Parent=transcript:AT1G01010.1;Name=AT1G01010.1.exon1;constitutive=11araport11CDS37603913.+0ID=CDS:AT1G01010.1;Parent=transcript:AT1G01010.1;protein_id=AT1G01010.11araport11exon39964276.+.Parent=transcript:AT1G01010.1;Name=AT1G01010.1.exon2;constitutive=11araport11CDS39964276.+2ID=CDS:AT1G01010.1;Parent=transcript:AT1G01010.1;protein_id=AT1G01010.11araport11exon44864605.+.Parent=transcript:AT1G01010.1;Name=AT1G01010.1.exon3;constitutive=11araport11gene67889130.-.ID=gene:AT1G01020;Name=ARV1;biotype=protein_coding1araport11mRNA67888737.-.ID=transcript:AT1G01020.6;Parent=gene:AT1G01020;biotype=protein_coding1araport11exon67887069.-.Parent=transcript:AT1G01020.6;Name=AT1G01020.2.exon8;constitutive=01araport11three_prime_UTR67887069.-.Parent=transcript:AT1G01020.61araport11three_prime_UTR71577314.-.Parent=transcript:AT1G01020.61araport11exon71577450.-.Parent=transcript:AT1G01020.6;Name=AT1G01020.2.exon7;constitutive=01araport11CDS73157450.-1ID=CDS:AT1G01020.6;Parent=transcript:AT1G01020.6;protein_id=AT1G01020.61araport11exon75647649.-.Parent=transcript:AT1G01020.6;Name=AT1G01020.1.exon6;constitutive=1

脚本在遇到gff文件第三列为gene时,匹配gene_id,但是不同的平台和软件gene_id对应的前缀也不一样,如上图所示前缀是ID=gene:,所以脚本匹配时是:

$a[8]=~m/ID=gene:([^;]*);/;

如果你的gff文件第八列gene_id对应的前缀也不一样,例如如下所示:

1araport11gene1164913714.-.ID=AT1G01030;Name=NGA3;biotype=protein_coding

你就需要修改一下脚本,将匹配内容改为如下所示:

$a[8]=~m/ID=([^;]*);/;

这样脚本才能正确匹配,提取信息。

读到这里,这篇“perl对应的gff文件格式是什么”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注恰卡编程网行业资讯频道。

发布于 2022-03-18 22:46:52
收藏
分享
海报
0 条评论
29
上一篇:怎么对TCGA数据进行多因素生存分析 下一篇:css3的过渡属性有哪些
目录

    0 条评论

    本站已关闭游客评论,请登录或者注册后再评论吧~

    忘记密码?

    图形验证码