如何采用TCGAbiolinks 去下载TCGA临床数据
小编给大家分享一下如何采用TCGAbiolinks 去下载TCGA临床数据,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
采用TCGAbiolinks 去下载TCGA临床数据,并对数据进行整合
下载和处理TCGA的临床信息非常的麻烦,不同的癌症,格式还不一样,处理起来不容易。
采用TCGAbiolinks 包去下载和处理临床信息就非常的方便。
那么我们以下载胃癌病人的临床数据的为例,看看如何下载数据。
#加载需要的包library(SummarizedExperiment)library(TCGAbiolinks)############################################################GDC:https://portal.gdc.cancer.gov/############################################################设置程序参数work_dir<-"/Users/zhangqiuxue/Documents/Train/TCGA/lab/Download_Data/Clinical"#设置需要下载癌症对应的project和数据类型project<-"TCGA-STAD"data_category<-"Clinical"data_type<-"ClinicalSupplement"legacy<-FALSE#设置工作目录setwd(work_dir)#下载临床数据的结果DataDirectory<-paste0(work_dir,"/GDC/",gsub("-","_",project))#查询可以下载的数据query<-GDCquery(project=project,data.category=data_category,data.type=data_type,legacy=legacy)#该癌症总样品数量samplesDown<-getResults(query,cols=c("cases"))cat("TotalClinicalsampletodown:",length(samplesDown))#下载数据GDCdownload(query=query,directory=DataDirectory,files.per.chunk=6,method='client')#用专门的函数去整合下载好的数据clinical<-GDCprepare_clinic(query,clinical.info="patient",directory=DataDirectory)#将数据保存到文件,方便后面的进一步分析clinical_file<-paste0(DataDirectory,"_","clinical",".txt")write.csv(clinical,file=clinical_file,row.names=F,quote=F)
以上是“如何采用TCGAbiolinks 去下载TCGA临床数据”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注恰卡编程网行业资讯频道!