全球生物学家喜大普奔,能预测蛋白质结构的人工智能,终于可以免费用了

2021年两大顶级期刊《科学》和《自然》先后发文,分享了两个可以预测蛋白质结构的人工智能源代码,让全球生物学家及医学家喜大普奔。


可能很多不在这一行的朋友无法感知这件事的意义,今天就来跟大家聊一聊蛋白质结构预测的那些事。


图片


01
什么是蛋白质结构预测?难在哪里?


一直以来,通过氨基酸序列就可以预测蛋白质的形状和功能是很多生物科学家的梦想。而且对于人类而言,这也是了解自己、了解生命原理的一大进步。然而理想很丰满,现实很骨感,我们虽然摸索了很多身体内蛋白质的作用原理,但是在蛋白质为什么会成为那样的结构这方面一直没有多大的进步。


蛋白质结构预测是一件十分困难的事情。很多人都知道蛋白质是由很多个氨基酸构成,但是其实它不仅仅只是手牵手连成线的简单排列,只要排排坐就能够预测出它的结构。通俗点就是每个氨基酸除了连成线,还会叠加、折叠,甚至折叠后再抱在一团叠加,而且这些看似毫无章法的变化却遵循着我们至今没有发现的规律


这些五花八门的奇怪姿势造就了不同结构蛋白质不同的功能,失之毫厘谬以千里。这也是生物学界最核心的未知问题之一。


图片


02
人工智能:新的解题思路


我们目前可以通过冷冻电子显微镜、核磁共振或X射线晶体学等实验技术来观察到已有的蛋白质结构,但是科学家们不满足于看到已有的,而是想要知道为什么会这样,甚至想要自己设计更好的。


随着计算机科学的发展,科学家们想到利用计算机,甚至人工智能来协助计算和预测。我们的两位主角:谷歌AI团队的AlphaFold2华盛顿大学等团队的RoseTTAFold就是最近被研发出来的人工智能算法,在蛋白质结构预测领域备受瞩目。甚至AlphaFold2在去年赢得了蛋白质结构预测竞赛的冠军,并因其远胜于第二名的准确率震惊了生物学界。


可以预测蛋白质结构的人工智能开源有何意义?


如果说去年的AlphaFold2获奖让人们感到人工智能在蛋白质结构预测方面的巨大潜力,那么今年的开源就更是鼓舞人心。


所谓开源就是研究团队公开了人工智能系统的源代码、设计框架和训练方法,也就是将其分享给全世界的人们。全球的科学家和研究人员都可以免费使用这个系统来进行研究。这样也会大大激发其他科学家在这一领域的探索,未来生物医学领域的很多研究可能都会因此得到很大的进步。


图片


03
结语


希望随着这两大人工智能系统源代码的公布,能够更进一步推进生物学的发展,让人类在生命的探索中走得更远。


参考文献:

1.Baek,etal.,(2021) Accurate prediction of protein structures and interactionsusing a three-track neural network. Science,https://doi.org/10.1126/science.abj8754.

2.Jumperet al.,(2021).Highly accurate protein structure prediction withAlphaFold.Nature,https://doi.org/10.1038/s41586-021-03819-2.


电话:86-592-2195608 传真:86-592-2195608

邮件:zhoujuan@tio.org.cn