蛋白质结构建模在肾脏病学研究中的发展与应用 NEPHROLOGY · STRUCTURAL MODELING

蛋白质结构建模在肾脏病学研究中的发展与应用


2026年7月2日   索梓铭   汪嘉承   夏润

Wu et al., Nature Reviews Nephrology, 2026

文章背景与作者介绍

Sean Wu
第一作者
Sean Wu

Division of Nephrology, David Geffen School of Medicine at UCLA
Keck Data Science Institute, Pepperdine University
Department of Engineering Science, University of Oxford

研究方向
  • 医学人工智能
  • 大语言模型可靠性与不确定性
  • AI for Science
  • 医学影像与临床预测模型
代表作
  • NEJM AI, 2024:肾脏病学大语言模型能力评测
  • Am. J. Ophthalmol., 2024:结构影像预测青光眼视野进展
  • UAI, 2026:语言模型语义不确定性与自蒸馏
Ira B. Kurtz
通讯作者
Ira B. Kurtz

Division of Nephrology, David Geffen School of Medicine at UCLA
California NanoSystems Institute, UCLA
Brain Research Institute, UCLA

研究方向
  • 肾脏酸碱平衡
  • SLC4 家族膜转运蛋白
  • 离子和碳酸氢盐转运
  • 肾小管酸碱紊乱
  • Cryo-EM 与膜蛋白结构—功能研究
代表作
  • Compr. Physiol., 2014:尿液酸化的分子机制
  • Commun. Biol., 2022:AE1 内向与外向多构象结构
  • Nat. Commun., 2025:NBCn1 结构、转运与计算建模
Chapter 1 · Protein machines in nephrology

肾脏不是“管道”,而是多类蛋白质机器协同运行的器官系统

结构建模首先要明确对象:滤过屏障、转运系统、环境感知、代谢处理和损伤应答共同决定肾脏稳态。

肾脏蛋白质机器系统:滤过屏障、水溶质酸碱稳态、环境感知、代谢和免疫损伤应答
Genetic information → molecular function

序列提供信息,结构把信息转化为可解释的分子功能

蛋白质结构与构象集合决定稳定性、分子间相互作用和状态转换,是从变异到肾脏功能异常之间的关键中间层。

序列决定结构、结构决定功能:从 DNA、RNA、氨基酸序列到蛋白质结构和分子功能
Perturbation → mechanism → phenotype

结构异常把分子扰动连接到病理改变和疾病发生

错义突变、PTM 失调和环境损伤会通过折叠、界面、定位、门控与配体识别等结构层面改变,最终表现为肾脏疾病表型。

结构异常造成分子损伤、病理改变与肾脏疾病发生的机制链条
Experimental structure biology · databases

实验结构生物学把物理信号反演为可验证的三维模型

X-ray、cryo-EM 和 NMR 不是互相替代的单一路线;它们分别适配不同尺度、状态和样品条件,并共同构成 PDB 与相关结构数据库的基础。

蛋白质结构解析方法与公开结构数据库概览:X-ray、cryo-EM、NMR、PDB、SAbDab、OAS 和 AlphaFold DB
Experimental structure biology · X-ray crystallography

X 射线晶体学:从衍射图样重建原子结构

晶体将大量相同分子的微弱散射信号有序放大,使蛋白质的孔道、活性位点、相互作用界面和配体结合方式成为可解析的原子结构。

AQP2 PDB 4NEF 四聚体 ribbon 结构 H₂O NDI
AQP2|PDB 4NEF Collecting-duct water channel

水通道孔径 · 四聚体装配 · NDI 相关变异

AQP2 PDB 4NEF 单体跨膜水通道结构
单体跨膜孔道与膜平面
Electron-density mesh 局部密度包裹侧链,模型由衍射数据重建。
原子结构把疾病变异从线性序列位置转化为可解释的三维结构环境。
优势|What X-ray reveals 高分辨率原子模型孔道与活性位点蛋白-配体复合物成熟精修与验证体系
局限|What crystallization selects 样品需高纯度且均一膜蛋白与柔性区域困难动态区域可能缺乏密度晶体堆积稳定代表构象

“X 射线晶体学提供高可信度的原子结构证据,但晶体中的平均结构并不等同于蛋白质在生理环境中的完整动态状态。”

Experimental structural biology

NMR:从原子级频谱重建溶液结构与动态

NMR不是直接“看见”结构,而是从原子级频谱中提取约束,重建溶液中的结构与动态。

VDAC1 PDB 2K4T 19股β桶膜通道结构束
VDAC1|PDB 2K4T 19股β桶膜通道|线粒体外膜|溶液NMR
β桶孔道 结构束 膜环境

优势|What NMR reveals

溶液状态 柔性区域 弱互作 构象交换

局限|What spectra constrain

小蛋白更适合 谱峰重叠 样品标记 结构束≠真实系综

STRUCTURAL METHODS · CRYO-ELECTRON MICROSCOPY

冷冻电子显微学:从二维电子信号到三维结构

冷冻电子显微学在玻璃化状态下采集电子图像或衍射信号,并通过不同计算路径重建纯化分子、原位组织或微晶结构。

共同起点
样品快速玻璃化 低剂量电子束 二维图像或电子衍射
A

Single-particle cryo-EM

大量纯化的随机取向颗粒 → 2D projection → 3D average structure

B

Cryo-ET

同一细胞或组织区域连续倾转 → tilt series → in situ tomogram

C

MicroED

三维微晶或纳米晶体 → electron diffraction → crystal structure

本综述重点讨论 单颗粒分析 cryo-ET MicroED 作为冷冻电子显微学分支保留在方法图谱中。

STRUCTURAL METHODS · SINGLE-PARTICLE CRYO-EM

单颗粒cryo-EM:大量随机投影重建三维平均结构

数十万至数百万个低信噪比颗粒投影经过挑选、分类、取向估计和平均,最终重建一个或多个结构类别。

Workflow
单颗粒 cryo-EM 从原始照片到颗粒挑选和三维重构的工作流图
raw micrograph particle picking 2D classification orientation estimation 3D classification 3D density atomic model
Main renal channel case

PC2 / PKD2

PDB 5T4D EMDB EMD-8354 3.0 Å
PC2 PKD2 PDB 5T4D 四聚体 cryo-EM 结构

四聚体通道结构揭示孔区、装配界面与ADPKD变异的三维环境。

Auxiliary transporter case

NBCe1 / SLC4A4

PDB 6CAA EMDB EMD-7441 3.9 Å
NBCe1 SLC4A4 PDB 6CAA 二聚体 cryo-EM 结构
ion accessibility pathway

二聚体膜结构揭示离子可及通路与配位区域。

优势 No crystallization Large complexes Membrane proteins Conformational classification
局限 Low SNR Air-water interface Preferred orientation Small proteins

STRUCTURAL METHODS · CELLULAR CRYO-ET

cryo-ET:在细胞与组织中重建原位分子架构

对同一个玻璃化区域进行多角度低剂量成像,可以保留膜、细胞骨架和蛋白复合物的天然空间上下文。

足细胞裂孔膜 fishnet-like network 的 cellular cryo-ET 研究图
Podocyte slit diaphragm cellular cryo-ET 在天然肾小球中观察裂孔膜连接单元及其空间网络。
Missing wedge Dose-limited SNR Specimen thickness cryo-FIB
Structure gap · method choice

为什么结构仍然稀缺,尤其是在肾脏病学中?

实验结构测量无法追上序列数据增长;算法预测结构成为连接“已知序列”和“可解释机制”的必要路径。

结构数据远少于序列数据

截至 2023 年,PDB 中实验解析的蛋白质分子结构不到 20 万;同一时期,蛋白质序列库已积累数十亿条已知序列。

肾脏蛋白对象决定方法选择

肾脏研究常面对膜蛋白、多结构域受体、柔性复合物和原位超分子网络;重要性高,但结构长期难以获得。

01

样品瓶颈

难表达、难纯化;膜蛋白依赖脂质环境,大型复合物易解离,IDR 难以形成单一稳定构象。

02

方法适配瓶颈

X-ray、NMR、cryo-EM、cryo-ET 与 XL-MS 各有适配边界,没有一种技术覆盖所有目标。

03

动态与环境瓶颈

真实功能受膜脂、pH、离子、PTM、互作伙伴、渗透压和细胞状态共同影响。

04

规模瓶颈

实验结构仍常是“一个蛋白、一个长期项目”,复杂结构需要长期实践与攻克。

结论:肾脏结构医学必须在实验解析、方法选择与算法预测之间建立互补闭环。
AlphaFold · problem definition

定义结构预测问题:从序列到三维构象

蛋白质序列携带折叠信息;AI 结构预测要学习的是“序列条件 → 结构模型”的映射关系,而不是替代实验环境本身。

定义结构预测问题与 Anfinsen Dogma 的原 PPT 参考图
From physics to end-to-end learning

结构预测方法的历史路径

从物理模拟、同源建模到共进化和深度学习,核心变化是信息来源与几何表示能力不断增强。

蛋白质结构预测方法从1990年代到AlphaFold2的发展路径总览图
Protein structure prediction · hard problem

半个世纪的难题:高通量结构预测如何被评价

实验解析高准确但低通量;计算预测高通量但必须通过 CASP 这类盲测体系检验准确度。

原 PPT 第12页:蛋白质结构预测半个世纪的难题与 CASP 评价流程
CASP · AlphaFold series

AF 系列在 CASP 中形成范式跃迁

CASP13 到 CASP14 显示深度学习结构预测从“接触/距离预测”进入端到端高精度结构建模阶段。

原 PPT 第16页:CASP 中的关键提升与 AlphaFold1、AlphaFold2 对比
CASP free-modelling accuracy 条形图
AlphaFold2 计算预测与实验结果结构叠合示例
关键跃迁:MSA + Transformer / 几何深度学习 + 端到端坐标生成AF2 一骑绝尘
源PPT第18页:AF2 整体架构
源PPT第19页:AF2 五大精彩之处
源PPT第20页:MSA 共进化启发
源PPT第21页:MSA 质量与数据库
源PPT第22页:MSA 数据库检索
源PPT第23页:AF2 用 MSA 做什么
Visual attention · saliency map

人类视觉系统会主动分配有限注意力

在进入 Attention 机制之前,先用一张视觉显著性图说明“关注什么”本身就是信息处理的核心问题。

人类观看图像时的视觉注意力热区示意图
源PPT第24页:Attention 机制
源PPT第25页:Evoformer 弹性
源PPT第26页:Evoformer 机制
源PPT第27页:Column-wise Attention
源PPT第28页:Row-wise Attention
源PPT第29页:Outer Product Mean
源PPT第30页:Triangle Update
源PPT第31页:结构模块概览
源PPT第32页:OpenMM 与 3D 坐标
源PPT第33页:Recycling 机制
源PPT第34页:Recycling 生物学理解
源PPT第35页:多输出与置信度
源PPT第36页:AF1 得失
源PPT第37页:AF-Multimer 单体到多聚体
源PPT第38页:AF-Multimer 案例
源PPT第39页:AF3 复合系统

四类应用 × 肾脏蛋白 AI 结构图谱

综述按研究对象分类;本次汇报进一步压缩为三个价值层级:看见结构、理解机制、设计干预。

4.1 四类应用

Protein mutations

比较野生型与变异结构,判断局部替换是否改变功能。

  • 螺旋堆积
  • 稳定性
  • 门控/转运
  • 互作界面
Protein-protein interactions

预测复合物并标出结合伙伴,识别关键界面。

  • 相互作用表面
  • 界面残基
  • 复合物稳定性
  • 装配调控
Protein-viral interactions

从病毒-宿主扩展到外源分子与肾脏蛋白互作。

  • 病毒变异
  • 受体多态性
  • 抗体/可溶性受体
  • 毒物结合
Structure-based drug discovery

利用预测结构定位口袋、构象与配体结合模式。

  • 可成药口袋
  • 变构位点
  • 疾病构象
  • 虚拟筛选

4.2 肾脏蛋白 AI 结构图谱

A. 离子与溶质转运

SLC25A48 · AE1 · ATP6V0A4 · NCC · ROMK · OAT1 · SGLT2 · CTNS · LRP2 · APOL1

变异定位 · 转运状态 · 门控机制 · 药物结合
B. 多囊肾与纤毛

PKD1 · PKD2 · PKD2L1 · ALG5 · IFT-A complex

通道装配 · 孔区变异 · 纤毛运输 · 复合物结构
C. 信号、转录与肾癌网络

FOXD2 · PAX8 · VHL-TCEB1 · RCC driver PPI · NRBP1-TSC22D4-WNK1

DNA 结合 · PPI 网络 · 上游信号 · 潜在靶点
D. 肾小球、基底膜与足细胞

COL4A3/4/5 · nephrin · NEPH1 · podocin · CD2AP · TRPC6 · MYH9

三股螺旋 · 裂孔膜装配 · 动态互作 · 滤过屏障
E. 免疫、补体与尿路防御

CFH · PLA2R · UMOD

补体界面 · 自身抗原结构 · 细菌黏附 · 错误折叠
F. 损伤、毒物、病毒与干预

KIM1 · ACE2-spike · SMIT1/2 · MIOX · ATP6V0A4-F351

损伤靶向 · 外源分子结合 · 毒性靶点 · 候选优化
看见结构 理解机制 设计干预

AI-assisted renal structural modeling

肾单位各段结构建模与疾病机制示例

Figure 3 · Nephron map

肾单位各段结构建模及肾脏疾病机制示例总图
VHL 与 TCEB1 互作结构示例
VHL
ASB1 与 TCEB1 互作结构示例
ASB1
PRAME1 与 TCEB1 互作结构示例
PRAME1
ELOA 与 TCEB1 互作结构示例
ELOA
图 1 作为主视觉,呈现肾单位结构建模全景。 图 2-5 作为 TCEB1 互作结构示例。

CASE 1 · Cryo-ET + AF2

裂孔膜呈鱼网状:从原位密度到 nephrin-Neph1 分子架构

Cryo-ET 在接近天然状态下观察裂孔膜周期性鱼网结构,AF2 候选模型帮助把原位密度解释为 nephrin-Neph1 异源二聚体交叉组装。

裂孔膜原位 cryo-ET 揭示 nephrin-Neph1 交叉组装的分子架构参考图
Birtasu et al., Kidney Int. 2025 · 原位 cryo-ET + AF2 rigid/flexible fitting

Case 2 · Binding-Proteomics

一个肾毒物 × 整个结构蛋白质组

AlphaFold2 的关键贡献不是直接判定毒性靶点,而是把整个蛋白质组转化为可以被批量对接的三维受体库。

Hayama et al. · J. Toxicol. Sci. 2025 · Binding-Proteomics

Fig. 1 Binding-Proteomics Pipeline
Fig. 1 · Binding-Proteomics Pipeline
AlphaFold DB 结构蛋白质组Open Babel 预处理Fpocket 口袋探测Vina-GPU 全蛋白质组对接STRING 功能富集
Human structures23,391
Mouse structures21,615
Docking speed4.4 min/ 100 proteins
High-affinity threshold≤ -8kcal/mol
Traditional virtual screeningKnown target × many compounds
Binding-ProteomicsOne toxicant × the structural proteome

Case 2 · Target convergence

从全蛋白质组排名到肌醇稳态机制假说

跨人鼠筛选将候选靶点收敛到肌醇转运与代谢蛋白;精细对接进一步提出 puberulic acid 干扰肾脏肌醇稳态的可能机制。

Hayama et al. · J. Toxicol. Sci. 2025 · Binding-Proteomics

跨人鼠候选收敛

Human
top hits
Mouse
top hits
INOSITOL AXISMIOX
SLC5A11 / SMIT2
ENTPD6GIMD1GTPBP4ATL2
Mouse top enrichment · Inositol transporters
Fig. 5 SMIT2 binding-mode analysis
myo-inositol 与 puberulic acid 结构对比
Fig. 5 · SMIT2 binding-mode analysis
1. Structural resemblancePuberulic acid resembles myo-inositol
2. Predicted bindingMIOX · SMIT2 · SMIT1
3. Possible disruptionMyo-inositol transport and renal osmoregulation

Induced-fit docking 提示 puberulic acid 具有有利结合评分;CovDock 进一步提出其羰基可能与口袋内 Lys 形成可逆亚胺键。

Evidence boundary

Candidate targets, not a confirmed MIE

  • 全流程为 in silico 研究
  • Docking score ≠ experimental affinity
  • 每个蛋白只选择最高分口袋,可能遗漏变构位点
  • 宽而开放的口袋可能发生系统性排序失败
SPR / ITCTransporter assaySite-directed mutagenesisGenetic perturbationIn vivo validation

AF2 结构蛋白质组将未知肾毒性从表型问题,转化为可实验检验的 MIOX-SMIT1/2 机制假说。

CASE 3 · Structure-guided targeting

Case 3|KIM1–TKP-4:从损伤靶点到AI筛选肾脏靶向肽

从 KIM1 损伤靶点出发,结合结构信息、AI 筛选与功能验证,形成 TKP-4 肾脏靶向递送的结构指导筛选链。

KIM1-TKP-4 技术路线图
KIM1–TKP-4 技术路线:损伤靶点识别 → AI 候选肽筛选 → 靶向递送设计
KIM1-TKP-4 主要结果图
主要结果:KIM1 介导的肾损伤靶向富集与功能验证

未来与总结

AI 结构建模扩展了肾脏蛋白质结构的可获得性,使我们能够以全新视角看待结构(原本不可得或难以赋予分子身份)、理解机制(解释突变、界面、构象和结合口袋如何改变功能)并设计干预手段(靶点挖掘、虚拟筛选与分子设计)。

[1]WU Y, KURTZ I B, et al. How AI structural modelling is reshaping nephrology[J]. Nature Reviews Nephrology, 2026.

[2]JUMPER J, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583-589.

[3]ABRAMSON J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3[J]. Nature, 2024, 630(8016): 493-500.

[4]UNWIN N. Resolution of the structure of the slit diaphragm by cryo-electron tomography[J]. Journal of the American Society of Nephrology, 2024.

[5]HAYAMA T, et al. Binding-proteomics analysis of puberulic acid-induced nephrotoxicity[J]. Journal of Toxicological Sciences, 2025, 50: 1-15.

[6]施一公. 生物物理学[M]. 北京: 高等教育出版社, 2022.

AI 没有替代结构生物学。它把结构从稀缺的研究终点,变成可快速提出、实验约束和迭代验证的研究起点。

预留:动态分子机制收束图
未来肾脏结构医学的核心:在真实生理环境中建立可验证、可解释、可干预的动态分子机制。

Thanks!