导读:
通过将用户提供的基因表达定量数据,化合物定量数据映射并渲染到相关的KEGG通路图上,能够帮助我们直观且系统地研究基因、酶、化合物间的关系。
KEGG通路图简介
KEGG PATHWAY数据库是一系列手动绘制的图形图谱的集合,称为KEGG通路图,涵盖了代谢通路、信号通路、各种细胞过程和生物系统相关的通路,以及与人类疾病相关的扰动通路。通路图标识符为:物种缩写+5位的数字编号。例如hsa04064,表示“NF-kappa B signaling pathway - Homo sapiens (human)”,而mmu04064则表示“NF-kappa B signaling pathway - Mus musculus (house mouse)”。
通路图上各个元素所代表的意义
1,打开作图URL
微生信-Pathview在线渲染KEGG pathway map
2,示例数据
点击图片上方的示例数据,下载,并使用excel打开。
输入数据包括两列:
第一列是该pathway中包含的基因/化合物ID。其中基因ID使用的是NCBI的entrez gene id,纯数字,例如3553为基因IL1B; interleukin 1 beta;化合物ID使用的是KEGG的compound ID,以C开头,例如C01245为“D-myo-肌醇 1,4,5-三磷酸盐”,药物ID使用的是KEGG的Drug ID,以D开头,例如D08877为“Briobacept (USAN)”。
第二列是每个基因/化合物对应的数值,可以是倍数变化(log2FC),或者其他任意有意义的数值。
其中首行首列为KEGG的Pathway ID,该ID可以在KEGG官网查询。例如这里的hsa04064为“NF-kappa B signaling pathway - Homo sapiens (human)”。必需指定物种,不能是map04064。
这些信息都可以在KEGG官网进行查询获得,例如KEGG PATHWAY: hsa04064
3,输入检查
示例数据:点击输入框下面的“示例”按钮,将载入示例数据。
真实数据:数据放在excel中,调整好后,Ctrl+A选中数据,Ctrl+C拷贝,Ctrl+V粘贴数据到输入框中。
然后使用输入框下面的“输入检查”按钮先对输入数据进行检查。若检查不通过,请根据检查提示重复【修改-输入检查】步骤,直到检查通过(如下图所示),然后可以继续选择参数。
注:输入检查是新加功能,它会根据不同模块的输入要求,逐行逐列检查输入数据,并给出提示,确保数据符合模块要求。
4,选择参数
基因colorbar颜色:
提供了低颜色,中颜色和高颜色
基因colorbar数值范围
例如若基因的数值范围为[-2.5,3.5],若最小值和最大值都留空,则colorbar的范围就是[-4,4],即[负的绝对值最大的数向下取整,正的绝对值最大值向上取整]
若设定最小值和最大值,则根据所设定的值(默认取整)设置colorbar对应的数值范围。
化合物colorbar颜色
提供了低颜色,中颜色和高颜色
化合物colorbar数值范围
例如若化合物的数值范围为[-2.5,3.5],若最小值和最大值都留空,则colorbar的范围就是[-4,4],即[负的绝对值最大的数向下取整,正的绝对值最大值向上取整]
若设定最小值和最大值,则根据所设定的值(默认取整)设置colorbar对应的数值范围。
图例colorbar的位置
左上、左下、右上、右下
5,提交出图
检查通过,并且参数选好后,点击“提交”按钮,约15s后(后台需要从KEGG官网下载数据),会在页面上显示pathway map预览图。由于该图是在KEGG Pathway Map的基础上,对图片进行上色后获得的图,因此,仅提供了300 dpi png格式图片供下载。
在这张KEGG Pathway Map中,红色表示基因表达上调,绿色表示基因表达下调。黄色表示化合物/药物信号上调,蓝色表示化合物/药物信号下调。
当然,也可以只绘制表达数据(左图)或者只绘制化合物/代谢数据(右图)。
pathview官方在线版(Pathview),功能更多。
pathview R包代码版
微生信助力高分文章,用户220000+,谷歌学术4400+