Generating 3D models of complex carbohydrates with GLYCAM-Web

碳水化合物的结构复杂性——其特征在于高度的分支、化学修饰和构象可塑性——长期以来使糖组学在自动化结构生物学领域落后于蛋白质组学和基因组学。与蛋白质相对线性且可预测的折叠不同,聚糖和多糖为三维(3D)建模带来了巨大挑战。在《Nature Methods》发表的一项重要进展中,研究人员详细介绍了 GLYCAM-Web (www.glycam.org) 的最新演进,这是一个旨在使复杂碳水化合物 3D 结构预测普及化的综合在线平台。
GLYCAM-Web 的核心是 GLYCAM 分子建模库 (GMML2),这是一个开源的 C++ 框架,可将初级聚糖序列转化为能量最小化的 3D 模型。该平台采用专门的“GLYCAM Condensed”命名法,该命名法编码了关键的结构参数,包括单糖环类型(吡喃糖或呋喃糖)、对映异构体(D 或 L)、异头构型和糖苷键位置。该系统已扩展到支持几乎无限的天然和工程糖材料,包括糖胺聚糖和糖蛋白,以及硫酸盐化、乙酰化和甲基化等化学修饰。
该平台的主要创新之一是其“点选式”界面,该界面利用聚糖符号命名法 (SNFG) 降低了非专家的使用门槛。用户可以从还原端或非还原端构建复杂的分支结构,或从广泛的常见哺乳动物聚糖库中进行选择。为了确保结构的合理性,系统采用“贪婪”算法,通过在实验定义的范围内调整糖苷键二面角来解决空间重叠问题。生成的结构随后使用 GLYCAM 力场进行能量最小化,平台会自动生成在 AMBER 软件套件中进行分子动力学 (MD) 模拟所需的所有输入文件。
为了验证这些预测模型的准确性,研究人员将该平台与蛋白质数据库 (PDB) 中超过 14,000 个含糖结构进行了大规模对比。分析显示,来自 GLYCAM-Web 的能量最小化结构与实验数据高度吻合,糖苷键二面角(φ 和 ψ)表现出高度的一致性(常见 β1-4 糖苷键的 z 分数在 0.00 到 0.52 之间)。值得注意的是,该研究还强调了该平台在质量控制方面的效用,因为它识别出了现有 PDB 条目中数百个生物学上不一致的糖苷键。
GLYCAM-Web 的科学影响已经显现,仅在 2024 年就生成了超过 35,000 个结构。其应用范围涵盖了从定义病原蛋白的特异性、辅助糖模拟药物设计,到解释质谱和核磁共振 (NMR) 数据。展望未来,开发人员正在测试在线 MD 服务,以提供标准化的、专家策划的模拟方案,进一步弥合聚糖序列与功能动力学之间的鸿沟。通过提供强大、可重复且易于访问的工具集,GLYCAM-Web 已成为结构糖生物学未来的基石。