怎么下载TCGA中指定Primary Site的样本数据
这篇文章主要介绍“怎么下载TCGA中指定Primary Site的样本数据”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“怎么下载TCGA中指定Primary Site的样本数据”文章能帮助大家解决问题。
代码:
#筛选primary_site对应的癌症样本library(GenomicDataCommons)resp=cases()%>%filter(~project.project_id=='TCGA-HNSC'&primary_site=='Larynx')%>%GenomicDataCommons::select(c(default_fields(cases()),'samples.sample_type'))%>%response_all()resp%>%count()case_name<-resp$results$submitter_id#之后对下载的samplesDown进行过滤,获得需要下载的sample_downloaddownload_name=substr(samplesDown,1,12)sample_download<-samplesDown[download_name%in%case_name]
有了sample_download ,就可以采用TCGAbiolinks进行下载了。
把要下载的数据筛选出来之后重新得到query,添加barcode选项指定下载想要的数据:
query<-GDCquery(project=project,data.category=data_category,data.type=data_type,workflow.type=workflow_type,barcode=sample_download,#sample.type=sample_type,legacy=legacy)
关于“怎么下载TCGA中指定Primary Site的样本数据”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注恰卡编程网行业资讯频道,小编每天都会为大家更新不同的知识点。