这篇文章将为大家详细讲解有关怎么从GTF中提取lncRNA的编号和名称,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
从GTF文件中提取lncRNA对应的ID和名称
从TCGA数据中提取lncRNA的表达量时,需要知道lncRNA的编号和对应的名称。这些信息可以从GTF文件中提取。提取的话,可以采用如下的代码实现。
#!/usr/bin/perl-wusestrict;my$biotype_file=shift@ARGV;my$gtf=shift@ARGV;my$biotype=shift@ARGV;my%biotype_list;openmy$fh2,$biotype_fileordie;while(<$fh2>){chomp;my@array=split/\t/,$_;if($array[2]eq$biotype){$biotype_list{$array[0]}=1;}}close$fh2;openmy$out,">${biotype}_info.txt"ordie;print$out"Gene_id\tGene_id_info\tgene_name\tbiotype\n";openmy$fh3,$gtfordie;while(<$fh3>){chomp;nextif/^#/;my@array=split/\t/,$_;nextunless($array[2]eq"gene");$array[8]=~/gene_id\s+"(\S+?)";.*gene_type\s+"(\S+?)";.*gene_name\s+"(\S+?)";/;my$geneid=$1;my$genebiotype=$2;my$genename=$3;my$gene_id_norm=(split("\\.",$geneid))[0];if($biotype_list{$genebiotype}){print$out"$gene_id_norm\t$geneid\t$genename\t$genebiotype\n";}}close$fh3;
关于“怎么从GTF中提取lncRNA的编号和名称”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
怎么下载TCGA中指定Primary Site的样本数据
怎么下载TCGA中指定PrimarySite的样本数据这篇文章主...
如何下载TCGA临床信息中的用药信息
如何下载TCGA临床信息中的用药信息这篇文章主要介绍了如何下载TC...
怎么从TCGA数据库中下载指定类型样本的数据
怎么从TCGA数据库中下载指定类型样本的数据今天小编给大家分享一下...
TCGA数据下载的示例分析
TCGA数据下载的示例分析这篇文章主要介绍了TCGA数据下载的示例...
如何采用TCGAbiolinks 去下载TCGA临床数据
如何采用TCGAbiolinks去下载TCGA临床数据小编给大家...
怎么对TCGA数据进行多因素生存分析
怎么对TCGA数据进行多因素生存分析这篇“怎么对TCGA数据进行多...
怎么对TCGA数据单因素cox生存分析
怎么对TCGA数据单因素cox生存分析这篇文章主要介绍“怎么对TC...
用户名
密码
记住登录状态 忘记密码?
邮箱
确认密码
我已阅读并同意 用户协议