首页 >>  正文

hla+dr+人类白细胞抗原

来源:baiyundou.net   日期:2024-09-25

AI是生物学未来趋势吗?scGPT预测单细胞中的基因表达

作者:Dong富贵

近两年,AI研究应用已成热门议题,发表在BioRxiv上的一篇最新研究就应用了人工智能来建立一个单细胞基础模型(scGPT)。这个模型使用超过1000万个单细胞数据,可以帮助分析单细胞的多种特征,如细胞类型、基因变化、组学差异等。

通过对超过1000万个细胞进行生成式预训练,首次尝试构建了一个单细胞基础模型,即scGPT。证明了预训练模型在基因和细胞层面捕捉到了有意义的生物学洞见。在零样本学习中,预训练模型能够在未见过的数据集上揭示有意义的细胞簇。通过在少样本学习设置中进行微调,模型在各种下游任务上取得了最先进的性能,包括批次校正、多组学整合、细胞类型注释、基因扰动预测、伪细胞生成和基因网络推断。

文章亮点

预训练基础模型的采用将进一步增进我们对细胞生物学的理解,并为未来的发现奠定基础。

scGPT通过在超过1000万个血液和骨髓细胞的单细胞RNA测序数据上进行自监督学习,同时学习基因和细胞的表示向量。

scGPT采用了与自然语言生成类似的输入输出格式,将每个基因视为一个词汇,将每个细胞视为一个句子,并使用特殊的条件词汇来表示不同的测序批次或模式。

scGPT使用了一个特殊设计的注意力掩码,使得模型可以以自回归的方式预测未知基因或未知细胞的表达值。

scGPT使用了另一个目标函数,即基于细胞表示向量来预测所有基因表达值,从而增强了细胞表示向量的学习。

在多个单细胞数据分析的下游任务上,对scGPT模型进行了评估和比较,展示了其优越的性能和泛化能力。

模型总览

模型介绍

将多个单细胞RNA测序(scRNA-seq)数据进行批次校正的整合

在单细胞测序数据的聚类和可视化中,当存在来自多个数据集或测序批次的批次效应时,面临着重大的挑战。通过采用微调工作流程,scGPT框架有效地解决了这个挑战,通过引入定制的微调目标,成功纠正了批次效应,同时保留了数据中固有的真实生物学信号。scGPT在批次校正后保持集成数据的生物差异方面取得了最先进的性能。作者在PBMC上对scGPT与多种流行的集成方法scVI、Seurat、Harmony等进行了基准测试。如下图

细胞类型注释

细胞类型注释是在聚类之后的单细胞分析中至关重要的一步,它解决了测序组织中的异质性问题,并为进一步研究细胞和基因功能提供了基础,以获得生物学和病理学的见解。scGPT的Transformer模型可以直接以无偏的方式接受基因表达数据作为输入,并对整个高变基因集进行全面的分析。这种方法提供了更高的可靠性和改进的细胞类型分类准确性。针对细胞类型注释任务,作者使用交叉熵损失对预训练的scGPT模型进行了微调,以便根据新的参考数据集的真实标签进行训练。

干扰预测

本文使用了两个扰动数据集来评估scGPT在这个任务上的表现:Pertub-seq和Norman Perturb-Seq。Pertub-seq包含了87种单基因扰动下K562白血病细胞系的单细胞RNA测序数据,Norman Perturb-Seq包含了131种双基因扰动和105种单基因扰动下人类胚胎肾细胞(HEK293T)的单细胞RNA测序数据。本文将scGPT与两个最先进的扰动推断方法进行了比较:LIONESS和MAGPIE。结果显示,scGPT在预测其他基因表达值的变化方面表现最好,其平均绝对误差(MAE)分别为0.106和0.089,分别低于其他方法10%到20%。scGPT能够准确地捕捉到基因扰动对其他基因的影响,以及不同扰动之间的相互作用。

scGPT极大促进了多组学整合和多模态表示学习

单细胞多组学(scMultiomic)数据一次性提供了多个遗传调控视图,包括表观遗传学、转录组学和翻译活性。它为增强特征和细胞表示学习提供了丰富的机会,超越了基因表达。然而,挑战在于如何可靠地聚合来自多个视图的细胞表示,同时保留生物信号。scGPT框架可以轻松扩展到集成多个测序数据模态。scMulti-omic数据中的每种组学类型(例如基因表达、染色质可及性和蛋白质丰度)类似于NLG中的不同语言。类比地,scGPT支持从不同测序模态联合优化多组学标记。该框架还允许通过扩展"词汇表"无缝添加新的测序模态到现有的预训练网络中。在基准实验中,与现有的最先进方法相比,scGPT在细胞表示学习和多组学批次集成任务中展现出出色的性能。

基因特征用于基因调控网络推断

转录因子、辅因子和靶基因之间的相互作用构成了基因调控网络(Gene Regulatory Network, GRN),介导着重要的生物过程。现有的GRN推断方法通常依赖于静态基因表达的相关性或伪时间估计作为因果图的替代。通过基因标记的生成式训练,scGPT隐式地编码了这些关系在其基因特征中。因此,可以应用基scGPT展示了从其基因特征网络中分组功能相关基因并区分功能不同基因的能力。

在图A中,作者展示了经过预训练的基因特征网络中人类白细胞抗原(Human Leukocyte Antigens, HLA)抗原的相似性网络。在零样本设置下,scGPT模型突出显示了两个与两个经过充分研究的触发不同免疫反应的HLA类别对应的聚类,即HLA类I和HLA类II。HLA类I抗原HLA-A、C和E被CD8+ T细胞识别以介导细胞杀伤,而HLA类II抗原HLA-DR、DP和DQ被CD4+ T细胞识别以触发更广泛的辅助功能。对于在免疫人类数据集上进行微调的scGPT模型,作者探索了与该数据集中存在的免疫细胞类型特定的CD抗原网络(见图B)。

To be continued...

BoWang Lab团队将继续研究scGPT。虽然该模型的原始版本可用于分析骨髓和免疫细胞,但该团队最近发布了scGPT的更新版本,该版本对3300万个细胞进行了训练,包括脑、血液、胰腺、肺、心脏、肾脏、癌症和肠道细胞。

BoWang Lab的工具也不是唯一,最近,其他类似于scGPT的基础模型已经被发布,这使得AI在生物学研究中的运用只是时间问题。

原文链接:https://www.biorxiv.org/content/10.1101/2023.04.30.538439v2.full

scGPT公开代码库获得:https://github.com/bowang-lab/scGPT

","gnid":"97eb5562a0d419954","img_data":[{"flag":2,"img":[{"desc":"","height":"350","title":"","url":"https://p0.ssl.img.360kuai.com/t018909de6da89e0e6c.png","width":"741"},{"desc":"","height":787,"title":"","url":"https://p0.ssl.img.360kuai.com/t014ad308790c2f716d.jpg","width":1035},{"desc":"","height":"928","title":"","url":"https://p0.ssl.img.360kuai.com/t0151f67f59bb9544c2.jpg","width":"939"},{"desc":"","height":600,"title":"","url":"https://p0.ssl.img.360kuai.com/t01de6e4a2cefc0245b.jpg","width":831},{"desc":"","height":690,"title":"","url":"https://p0.ssl.img.360kuai.com/t015487fe32dc7cf434.jpg","width":1280},{"desc":"","height":"800","title":"","url":"https://p0.ssl.img.360kuai.com/t0113060caea7ac1ad4.png","width":"1235"}]}],"original":0,"pat":"art_src_0,fts0,sts0","powerby":"pika","pub_time":1700722276000,"pure":"","rawurl":"http://zm.news.so.com/a3f4a0a445dad06acab3826b9ba38568","redirect":0,"rptid":"643e1fbbb77a68fb","rss_ext":[],"s":"t","src":"集思慧远医学","tag":[{"clk":"kscience_1:细胞","k":"细胞","u":""}],"title":"AI是生物学未来趋势吗?scGPT预测单细胞中的基因表达

曾眨诸2823白血病(血癌)匹配型骨髓(造血干细胞)中国人与外国人配型可否?有无先例? -
项张闵14736564987 ______ 常规的骨髓移植前,只需HLA-A、B、DR(人类白细胞抗原)相同即可.由于HLA-AB的多样性最明显,一般对志愿者先做HLA-AB分型,待检索后供、受者HLA-AB相配后,再对供者作HLA-DR分型检测,看是否相配.如果供、受者的HLA完全...

曾眨诸2823组织相容抗体HLA是什么? -
项张闵14736564987 ______ HLA是一种组织相容性抗原,受控于类主要组2113织相容性复合体的5261基因簇,定位于第6染色体短臂上.HLA与有保卫功能4102的免疫防御系统密切相1653关.在进行移植手术时人类白细胞抗原决定版组织相容性.贡献者和接受者的人类白细胞抗原越相似,排异反应就权越小.

曾眨诸2823怎样预防和治疗白血病? -
项张闵14736564987 ______ 白血病最有效的治疗方法是骨髓移植: 骨髓移植的过程 常规的骨髓移植前,只需HLA-A、B、DR(人类白细胞抗原)相同即可.由于HLA-AB的多样性最明显,一般对志愿者先做HLA-AB分型,待检索后供、受者HLA-AB相配后,再对供者作...

曾眨诸2823移植后会有什么反应 -
项张闵14736564987 ______ 1.移植后腹痛 轻度腹痛,有时像针扎一样,部位不定,时间不定---这种情况一般不要紧 .不孕患者易过多关注腹部这一亩二分地,大多与精神紧张有关.但如不适的症状逐渐加重,应去医院就诊.山东省立医院生殖医学中心高芹 突然发生的剧...

曾眨诸2823HLA指什么 -
项张闵14736564987 ______ 人类白细胞抗原

曾眨诸2823HLA是人类特有的吗? -
项张闵14736564987 ______ HLA(人类白细胞分化抗原)这个名称是人类特有的,其他动物相同作用的分子叫做MHC(主要组织相容性抗原).

曾眨诸2823人类白细胞抗原(HLA)系统基因与风湿性疾病有何关系?
项张闵14736564987 ______ 免疫球蛋白(Ig)、T细胞受体(TCR)和主要组织相容性复合体(MHC)是参与机... 人类的MHC又称人类白细胞抗原(HLA)系统基因.WHO命名委员会1975年正式命名...

曾眨诸2823HLA - B27 结果 + - 是什么意思 -
项张闵14736564987 ______ HLA是3个英语单词的头字大写、H表示人(Human),L表示白细胞(Leuc ocyte),A表示抗原(Antigen),是人类白细胞抗原简写为HLA,是组织细胞上受遗传控制的体内特异性抗原,最早是在白细胞和血小板上发现的,后来发现此抗原广泛分布于皮肤、肾、脾、肺、肠和心等组织器官有核细胞的细胞膜上. HLA-B 位点有42个,B27为其中之一.HLA-B27阳性者比HLA-B27阴性者发生强直性脊柱炎的机会要大得多. 这+- 是弱阳性的意思.

曾眨诸2823肾脏移植手术之前,患者和捐献者各需要做什么检查? -
项张闵14736564987 ______ 来源: 新特药房药讯 作者:百济 浏览:241 发布时间:2005-2-16 11:17:00肾移植是一个非常复杂的手术,而且肾移植之前的患者大多非常虚弱,术中要经受外科手术的创...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024