首页 >>  正文

生物和生物圈结构图

来源:baiyundou.net   日期:2024-08-24

智东西

编译 | 周炎

编辑 | 云鹏

智东西3月24日消息,近日,《华尔街日报》在一则报道中,对Meta的ESMFold与DeepMind的AlphaFold两个蛋白质结构预测大模型进行了梳理,详细地介绍了二者的原理以及开发过程。

报道称,此前,DeepMind解决了一个困扰科学家50年的难题,它使用AI代替此前速度较慢、成本较高的实验室技术,来确定蛋白质的三维结构。这些结构对药物和疫苗开发、气候变化研究等都至关重要。

据悉,DeepMind的AlphaFold2首发于2021年7月,已被用于预测几乎所有已知的蛋白质结构。就在AlphaFold2推出的3个月后,Meta研究人员在Nature上发表论文。文章显示,Meta研究人开发了一种蛋白质结构预测模型ESMFold,预测了来自细菌、病毒和其他尚未表征的微生物的约6亿种蛋白质的结构。同时,在较短的氨基酸序列中,相较于AlphaFold2,其预测蛋白质结构的速度快了将近60倍。

一、ESMFold加入战局,14天内预测超6亿种蛋白质结构

从氨基酸序列中预测蛋白质结构是自然科学的重大挑战,从蛋白质的分子结构结构来看,蛋白质的分子结构可划分为四级,所谓的蛋白质的结构预测就是从蛋白质的一级结构预测其折叠和二级、三级、四级结构。根据不同的氨基酸和序列,蛋白质能折叠的构型数量是一个天文数字,使用AI的方法可以加速对蛋白质的解析。

目前在基于进化的算法中,AlphaFold2通过在多序列输入、进化同源物对齐序列和可选结构模板上训练端到端神经网络,在预测蛋白质结构方面取得了一定成果。与AlphaFold2工作原理不同,ESMFold使用ESM-2学习的信息和表示来执行端到端的3D结构预测。

简单来讲,作为大型语言模型,ESMFold的原理与ChatGPT基本相似,只不过,训练它的内容不是自然语言,而是生物基因语言。它基于语言学习模型内部表征,而不是像AlphaFold2一样基于结构和序列匹配算法,这样就消除对显式同源序列作为输入的要求,即ESMFold蛋白质模型只需一个序列作为输入。同时ESMFold是一个完全端到端的序列结构预测器,可以完全在GPU上运行,无需访问任何数据库。

研究人员曾经做过试验,在单个NVDIA V100 GPU上,使用较少参数的ESMFold在14.2秒被对具有384个残基进行预测,可比单个AlphaFold模型能够实现的预测速度快6倍,而在较短的序列上,研究人员甚至看到约60倍的提速。

据悉,ESMFold蛋白质模型背后的团队由Meta AI资深研究科学家Alexander Rives主导,该团队专注于大规模蛋白质序列和结构数据的无监督表示学习模型研究。

2017年,欧洲生物信息研究所发布的显示了AlphaFold模拟人类的蛋白质结构,来源:法国新闻社

Meta AI研究科学家Alexander Rives说:“这些蛋白质极其多样,人类对它们知之甚少,为了数量规模庞大的蛋白质,研究人员需要在预测速度上取得突破。”他还称,使用大型语言模型,ESMFold能够在两周内预测超过6亿种蛋白质。

作为测试案例,Meta AI将ESMFold用于来自环境来源(包括土壤、海水、人类肠道、皮肤和其他微生物栖息地)的批量测序“宏基因组”DNA数据库。绝大多数编码潜在蛋白质的DNA条目来自从未培养过且科学未知的生物体。

自从DeepMind取得突破以来,人们对AI在生物学中的应用产生了巨大的兴趣。AlphaFold是蛋白质结构预测方面取得的一大进步,这也进一步激发了深度学习的浪潮。

二、曾取得CASP最好成绩,AlphaFold将被用于治疗疾病

目前,DeepMind开源了AlphaFold2的代码,让社区可以免费使用,目前约2.4亿的几乎所有已知的蛋白质都可以查到。此前,研究人员花费几个月或几年时间才能预测蛋白质的结构。投资生命科学技术的成长型股票公司Biospring Partners联合创始人詹妮弗卢姆(Jennifer Lum)称,AlphaFold缩短了这个过程,使这些团队能够将他们的时间转移到下游的研究和产品开发上,进入其他增值领域。

2018年,AlphaFold1在两年一度的CASP实验中取得了最好的成绩。团队又花了大量时间跟踪CASP,尝试不同的方法来改进AlphaFold,测试它们是否可以匹配实验蛋白质结构的准确性。

Jumper称,这个团队一直工作到2019年,他才真正相信这个团队能够完成它的使命。传统而言,生物学家使用基于X射线和其他技术的实验室技术来理解单一蛋白质结构,但据Jumper称,这一过程不仅要花费数年时间,还活花费10万美元。

John Jumper领导了机器学习应用蛋白质生物学的新方法开发,来源:DeepMind官网

虽然计算方法在理解蛋白质结构方面取得进展,但是目前这项技术还不够完善。无法取代实验室方法。最初的AlphaFold模型试验AI预测氨基酸对之间的距离,第二步利用这些距离分布来得到蛋白质的预测结构。其中第二步涉及到AlphaFold,它利用这些信息,提出了一个关注蛋白质是什么样子的共识模型,而无需AI。

Jumper称,研究小组正在把注意力转向蛋白质创新的新挑战。研究小组正在寻求了解突变与蛋白质功能变化之间的联系,这可以帮助治疗疾病。

结语:AI赋能药物研发具有巨大潜力

作为蛋白质结构预测大模型,ESMFold在速度上快于AlphaFold2约60倍。如果在实际计算中,这一速度优势表现得更加明显。同时推断速度优势使得基于计算有效映射大型宏基因组序列数据库的结构空间成为可能。

ESMFold还可以被用于进行快速准确的结构预测,进一步帮助发现新的蛋白质结构和功能。未来,ESMFold或将超越预测蛋白质的静态结构,进一步研究蛋白质的动态结构。当这两个领域的研究都完成后,通过AI赋能新药设计就具备了基础,而从长远看,这具有巨大的潜力。

来源:《华尔街日报》

","gnid":"9fc93daeaa3da0267","img_data":[{"flag":2,"img":[{"desc":"","height":"340","title":"","url":"https://p0.ssl.img.360kuai.com/t01c4bd6588006e35a9.jpg","width":"800"},{"desc":"","height":"639","title":"","url":"https://p0.ssl.img.360kuai.com/t0155b7d6250bea02cb.jpg","width":"639"},{"desc":"","height":"639","title":"","url":"https://p0.ssl.img.360kuai.com/t01b7387e2701c5a903.jpg","width":"639"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"hbase","pub_time":1679662980000,"pure":"","rawurl":"http://zm.news.so.com/fa4316cc1a9714c647f3c942e42f0211","redirect":0,"rptid":"19c8b13fa9853ac1","rss_ext":[],"s":"t","src":"智东西","tag":[{"clk":"kscience_1:蛋白质","k":"蛋白质","u":""}],"title":"蛋白质结构预测速度提升60倍!Meta做出“生物界的ChatGPT”

应供虎1274生物圈的范围分哪三部?各部分由什么组成? -
翟彪寇15848998828 ______ 1.大气圈的底部:大气圈位于生物圈的最顶部,是由多种气体组成的:有氮气、氧气、二氧化碳等等.在大气圈中生活的生物,主要是能够飞翔的鸟类和昆虫,还有细菌等微小生物. 2.水圈的大部:水圈主要包括地球上的全部海洋和江河湖泊.几乎到处都有生物,但是大多数生物生活在距海平面150米以内的水层中. 3.岩石圈的表面:岩石圈是地球表层的固体部分.它的表面大多覆盖着土壤 ,是一切陆生生物的“立足点,生物种类十分丰富.例如,多姿多彩的花草树木,形形色色的各类昆虫,种类繁多的飞禽走兽,形态各异的水生生物,无处不在的细菌、真菌,等等.岩石圈也是人类的“立足点”,人类的活动可以到达生物圈的各个圈层.

应供虎1274生物圈的组成, -
翟彪寇15848998828 ______ 生物圈主要由生命物质、生物生成性物质和生物惰性物质三部分组成.

应供虎1274生物圈 水圈 土壤圈 大气圈 岩石圈是怎样相互作用的 -
翟彪寇15848998828 ______ 在整个地球的表面分布着三个圈层:大气圈、水圈和起伏不平的岩石圈.在大气圈的底部,水圈的大部和岩石圈的上部,是各种生物的生存场所.像这样,由各种生物和它们的生活环境所组成的、环绕地球表面的这一薄层叫做生物圈.换句话说...

应供虎1274什么是生物圈
翟彪寇15848998828 ______ 生物圈(也叫生态圈),它是由大气圈下层、水圈、土壤岩石圈以及活动于其中的生物组成的地球表面最大的生态系统.地球在长期演化过程中,形成了大气圈、水圈、土壤岩石圈等不同的圈层,这三个圈层相互重迭,互相渗透,相互作用,...

应供虎1274构成生物圈的是哪三样 -
翟彪寇15848998828 ______ 它包括大气圈的底部、水圈的全部、岩石圈的上部(土壤圈). 大气圈,水圈,岩石圈

应供虎1274生命系统的8个结构层次:细胞___、___、___、___、___、___、生物圈. -
翟彪寇15848998828 ______[答案] 生命系统的结构层次由小到大依次是细胞、组织、器官、系统、个体、种群、群落、生态系统和生物圈.细胞是最基本的结构层次,生物圈是最大的结构层次. 故答案为: 组织、器官、系统、个体、种群、群落

应供虎1274生物圈的组成?
翟彪寇15848998828 ______ 生物圈,实际上是一个巨大的生态系统,可以称之为全球生态系统.既然是生态系统,它的组成应该包括生物及其环境.对于生物圈来说,岩石、大气和水都是环境的组成部分.从组成物质形式来说,生物圈由有机物质和无机物质组成:生物体为有机物质,作为环境的岩石、大气和水则是无机物质

应供虎1274生物圈由地球表层生物和什么构成的
翟彪寇15848998828 ______ 生物圈包括海平面以上约10000米至海平面以下10000米处,包括大气圈的下层,岩石圈的上层,整个土壤圈和水圈.但是,大部分生物都集中在地表以上100米到水下100米的大气圈、水圈、岩石圈、土壤圈等圈层的交界处,这里是生物圈的核心.

应供虎1274什么是生物圈?各个圈层都有哪些类型的生物?请各举出五个例子 -
翟彪寇15848998828 ______ 生物圈1.细胞 除了病毒以外的生物全是由细胞为基本单位 如(草履虫)2.组织,每个细胞群都是由许多形态相同,结构、功能相似的细胞和细胞间质联合在一起构成的,这样的细胞群称做组织.(如肌肉是结缔组织)3.器官 器官是由多种组织构...

应供虎1274生物和生物圈 -
翟彪寇15848998828 ______ 如果脱离了生物圈这个圈层,大气层将不存在,将极度寒冷,所以需要保暖内衣.题设人类可以生活,则植物也可以生存,太阳光照足以维持它们的生命,它们产生有机物与氧气. 它们是生产者,人类是消费者,有它们存在,人类就可以活下去.离开生物圈,将会失去重力作用,所以需要一个力量来前行,太阳可以提供能量,则需太阳能电池. 回答完毕,谢谢采纳.

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024