方法1:
https://portal.gdc.cancer.gov/https://portal.gdc.cancer.gov/
选择RNA-Seq
找TSV格式open的文件加入购物车
进入到购物车点download --cart
打开下载后的tsv格式文件
方法2:
(9条消息) 基于TCGA数据库的差异基因分析实现_学习的派大星的博客-CSDN博客_tcga差异基因分析https://blog.csdn.net/qq_38567599/article/details/120901851
方法3:
(9条消息) tcga数据下载_TCGA数据下载与ID转换_weixin_39783633的博客-CSDN博客https://blog.csdn.net/weixin_39783633/article/details/109907234XenaUCSC Xenahttp://xena.ucsc.edu/ 参考:使用ensembl探索人类基因组 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/267057190
下载后的数据如下图所示,横轴表示585个LUAD病例,纵轴表示基因60000+,
内容表示基因表达量:
ensembl数据库:
Ensembl genome browser 106http://asia.ensembl.org/index.html
【工具和数据库】2分钟快速学会基因id的转换——Ensemble数据库使用技巧_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1t34y1o7FE?spm_id_from=333.788.header_right.fav_list.click
基因ID转换:
样本命名解读:
01:Sample, 这两个数字可以说是最关键、最被大家注意的,其中编号01~09表示肿瘤,10~19表示正常对照
方法4:
GEPIA 2 (cancer-pku.cn)http://gepia2.cancer-pku.cn/#index
方法5:
ualcan.path.uab.edu/homehttp://ualcan.path.uab.edu/index.html
UALCAN:是一个综合的、用户友好的、交互式的web资源,用于分析癌症组学数据。UALCAN的设计目的是:
-
提供对公开的癌症组学数据TCGA的方便访问
-
允许用户识别生物标记物或对潜在的感兴趣基因进行电子验证
-
提供基于基因表达的描述基因表达和患者生存信息的图表
-
通过启动子甲基化评估基因表达的表观遗传调控
方法6:
TCGA在线数据库系列。
介绍的数据库是LinkedOmic
LinkedOmics :: Loginhttp://www.linkedomics.org/login.php
R和Rstudio安装:
VSCODE下载R语言包:(10条消息) 2022最新教程 | windows系统中vscode配置R语言_育种数据分析之放飞自我的博客-CSDN博客_vscode安装r语言https://blog.csdn.net/yijiaobani/article/details/124009210?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165053061416782184665451%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=165053061416782184665451&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-124009210.142%5Ev9%5Econtrol,157%5Ev4%5Econtrol&utm_term=vscode%E9%85%8D%E7%BD%AEr%E8%AF%AD%E8%A8%80&spm=1018.2226.3001.4187(9条消息) 如何在 VSCODE 中高效使用 R 语言 (图文详解)_白墨石的博客-CSDN博客_r语言 vscodehttps://blog.csdn.net/u011262253/article/details/113837720
Rstudio:
参考:
R与RStudio的安装教程 - 简书 (jianshu.com)https://www.jianshu.com/p/5539af1f0da6
RStudio | Open source & professional software for data science teams - RStudiohttps://www.rstudio.com/
生物信息学分析:
Bioconductor - Homehttp://www.bioconductor.org/
方法7:
cBioPortal for Cancer Genomicshttp://www.cbioportal.org/使用cBioportal(http:\/\/www.cBioportal.org\/index.do)下载H&E图像SNP数据,癌症基因组学门户提供了分析癌症基因数据的可视化工具。cBioPort用于进行遗传学、表观遗传学、基因表达和蛋白质组学研究的分子和细胞学研究。
H&E图像肺癌患者的临床数据从国际癌症基因组协作组(ICGC)下载(https:\/\/dcc.ICGC.org\/)。