上期回顾:通过黄芪-丹参-茯苓治疗慢性心力衰竭(CHF)案例,我们获得117个关键交集靶点(药物-疾病共同靶点)-第一期链接
在网络药理学里,把冗长的基因列表炼成一张看得懂、讲得清、够精美的网络图,是从“堆砌数据”到“逻辑自洽”的关键一步。
本期将聚焦“黄芪-丹参-茯苓配伍治疗慢性心力衰竭”这一案例,系统演示如何利用 STRING 构建蛋白互作网络(PPI),并在 Cytoscape 中完成网络拓扑分析与高质量可视化,让数据不仅“说得清”,更“看得懂”。
PPI 网络 = 放大镜
直接把交集靶点丢进 STRING,几秒钟即可看见哪些蛋白在系统层面“扎堆”——潜在核心靶点往往就藏在这些高连通节点里。
Cytoscape = 美工+统计二合一
它既是网络可视化的软件,也自带一键拓扑分析功能;掌握他的应用,为你的可视化网络构建更增光彩。
本次使用软件:
STRING:https://string-db.org
Cytoscape:https://cytoscape.org/
0 复习:我们手上已有 3 份“原料”
①TCMSP收集了黄芪、丹参、茯苓药物靶点,汇总去重得到277个药物靶点
②在GeneCards数据库中,初步得到CHF作用靶点12255个,利用Excel将Score值从大到小排列,以大于Score值的中位数为筛选标准;重复上述操作三次进行二次筛选,最终筛选出1532个靶点。
③导入Venny 得到了117个重叠基因。每行一个 Gene Symbol,复制到excel表格里。
小贴士:建议OMIM / DisGeNET / TTD 等多数据库联合收集靶点,本次作为方法示例仅加入了Genecard和TCMSP网站靶点,关于中药靶点和药物靶点的收集方法可参考上篇网药文章。
STEP 1 把交集靶点扔进 STRING
1. 登录 https://string-db.org → 点击Multiple proteins。
2. 粘贴117 条 Gene Symbol → Organism 选 Homo sapiens。
3. 点击 Search ➜ Continue.
4.调整参数
Confidence (score):一般会选择0.70(High)或 0.90(Highest),勾选 “Hide disconnected nodes”(可选)(隐藏孤点,图更干净)。可自行调整,完成后点击“update”
5. Export > PNG 或 Export > TSV——保存到本地。STRING 也直接在网页端输出漂亮的PNG\TSV文件用于Cytoscape进一步处理,Cytoscape 更灵活,且方便后续富集分析。
STEP 2 导入 Cytoscape
1、安装Cytoscape 3.10.2。官网即可下载安装,需要同步下载安装JAVA(https://cytoscape.org/)。
2、安装完成后打开软件,打开文件夹File > Import > Network > File 选择刚才的TSV文件。
3、网络识别对话框 → 弹窗保持默认 → OK,几秒后网络加载完,PPI 网络就呈现在面板中。
STEP 3 网络拓扑分析 & 高颜值可视化
1、可通过Node调整节点的参数,修改形状、颜色、大小等;Edge可对边的参数进行修改。单个节点的移动,鼠标单击拖动即可;多个节点按Ctrl选中后可移动;撤回可按Ctrl+Z。
2、一键计算中心性
分析各节点degree值,Tools > Analyze Network → Analyze.按各节点degree值修改节点颜色,degree值越高,颜色越深。
3、修改节点形状。并按节点degree值,修改节点大小。
4、按照节点degree值调整排版分布。
例如可以按节点大小以矩形分布(Layout→Attribute Grid Layout),或圆形分布(Layout→Attribute Circle Layout)。
Layout 菜单:
Attribute Grid(矩阵) |
5、圆形分布可调整成同心圆。
用左下角Layout Tools,整体调整所选中节点大小。
同心圆“靶点靶心”排版:高 → 中 → 低,一眼抓重点
小技巧:
Ø “靶心布局”:把 degree 最高的 10 % 节点拉进最内圈,一眼抓重点。
Ø 图太复杂?先做子网络:Select → Top 30 by degree → File → Export → Network,轻装上阵。
6、Edge可调整边参数
Style → Edge
重要关系可加粗或改色强调,线条太粗影响而美观可修改
例如,设置Edge Width 2.0为1.0。
7、导出为图片,通常选择JPG格式进行保存。
8、如果后续着重选择对排名靠前基因进行后续分析,也可选择以下方式:
①以随机分布形式
②通过degree值,调整选择靠前的基因。
可选择将排名靠前基因用不同颜色标出
也可选择将这些基因单处拉出,以展现这些基因的互作情况
③展现形式示例
写在最后:让网络图成为“能讲故事的数据”
图像逻辑先行:想清楚要讲的故事,再决定配色和布局。
双向验证:拓扑结果别盲信 degree,结合文献和实验数据二次筛选。
下期预告(第 3 期)
Ø 关键靶点GO/KEGG富集方法及气泡图制作技巧
Ø “药物-成分-靶点”cytoscape多维网络构建