定制合成 Custom synthesis
联系方式 Contact Us
各位好!在ACS.Cent.Sci.上今天为你推荐一篇文章:DeepLearningforPredictionandOptimizationofFast-FlowPeptideSynthesis,这篇文章的通讯作者是来自麻省理工的BradleyL.Pentelute和RafaelGomez-Bombarelli,Pentelute教授致力于蛋白质工程与药物传递,而Bombarelli教授是一名计算机辅助的合成方法学研究人员。
固相合成肽是人工合成多肽的重要方法,相对于基因重组表达而言,固相合成肽不受序列和氨基酸种类的限制,因而适用范围更广。但SPPS包含了多个步骤的重复反应,耗时耗力。流式化学技术的发展促进了自动合成仪器化学平台的设计和使用,本文作者的实验室设计了一台可实现高效自动SPPS的快速流式肽合成自动化仪器(AFPS)。但目前合成过程中存在的副反应如聚集等问题尚未解决。为提高收率,作者设想用算法实时优化自动合成。
为此,作者需要该算法能够在合成条件和产率之间建立精确的联系,该目标可以通过深度学习的方法实现。但有效的深度学习需要大量高质量和标准化的数据,这就意味着不能简单地从公开发表的资料中收集数据,因为这些资料标准不同,而且不一定可以重复。利用AFPS,在相同的优化参数下,进行了多步脱保护合成,得到了35427个独立的UV-Vis检测数据,得到了高重复性、统一标准的数据。研究人员用指纹图谱对每个合成反应中的前体序列和所引入的氨基酸进行编码,使之具有条形码的形式,其中包含了所有关键亚结构的信息,如氨基酸的侧链、酰胺键和保护基。研究人员把这些条形码信息和相应的合成参数(包括反应温度、流速、偶联剂等)作为输入,Fmoc去保护的合成UV-Vis迹线的积分、高度和宽度作为输出,这些变量是衡量反应成功与否的重要标准。通过对所收集的数据进行训练,得出深度神经网络模型,并用此模型预测的UV-Vis迹线与实验结果在误差允许的范围内吻合。
应用此模型预测了聚合度和序列的相关性,聚合度是SPPS最重要的副反应之一,但聚合度和肽段序列的相关性还不清楚。本文利用宽高比对该特征进行了量化定义,并利用训练模型准确地判断了加入Ala18后GLP-1的聚集行为,从而确定了GLP-1的聚集特征。为深入研究聚合度与序列之间的关系,作者利用该模型对PDB中8000多个蛋白质的聚合度进行了预测,发现芳基和大侧链氨基酸最易引起聚合度的增加。为了证实这一点,作者对所选择的已合成的多肽进行了单点突变,并用模型来判断所有突变体发生聚集的可能性,然后用实验合成了其中一些多肽,并将其产量与模型预测值相比较,两者吻合。
以该模型的预测结果为指导,对AFPS自动合成过程中的参数进行了优化,从而为除Trp外的其他氨基酸配制提供了新的配制方案。结果表明,在优化条件下,大部分氨基酸的偶联产率均有所提高,但还存在进一步优化的空间,包括Trp。
基于以上分析,作者采用深度学习模型预测了多肽合成的产率,并以此模型指导合成条件的优化。期望未来该模型能在合成过程中实现实时调节,即能根据前一步合成的表征信息,自动给出下一步合成的最佳优化条件。
原创文章如有转载,请注明出处“本文首发于固拓多肽合成生物科技有限公司(www.bluetickco.com)”
本公司的所有产品仅用于科学研究或者工业应用等非医疗目的,不可用 于人类或动物的临床诊断或治疗,非药用,非食用。
- 上一条:活性多肽是控制身体活力的开关
- 下一条:肽库是什么?肽库有什么作用?