您当前位置：今日中国 > 金融 > 正文

新语言模型学会读取“另类文本”

2024-04-09 03:05 来源：网络余梓阳

最新发表在《自然·机器智能》上的一篇论文中，美国普林斯顿大学研究人员详细介绍了一种语言模型，该模型可追踪部分基因组序列并优化这些序列，利用其语义表示能力来设计更有效的信使RNA(mRNA)疫苗。

新模型的代码包含所有生命功能的指令。基因组中每个序列都遵循复杂的语法和句法，这些结构产生了意义。正如改变几个单词可从根本上改变句子含义，生物序列的微小变化也可使序列编码产生巨大差异。

科学家将遗传信息的流动总结为“生物学中心法则”:信息从DNA转移到RNA再到蛋白质，蛋白质创造活细胞的结构和功能。mRNA在最后一步将信息转化为蛋白质。mRNA只有一部分包含蛋白质代码，其余部分不进行翻译，但控制翻译过程的重要方面。

控制蛋白质生产效率是mRNA疫苗发挥作用的关键机制。在对少数物种进行模型训练后，研究人员生成了数百个新的优化序列，并通过实验验证了这些结果。最佳序列的性能优于疫苗开发的多个领先基准，其中蛋白质生产的整体效率提高了33%。

研究团队使用经过训练的模型创建了包含211个新序列的库，每个都针对所需功能进行了优化，提高了翻译效率。这些蛋白质，如新冠疫苗靶向的刺突蛋白，可驱动针对传染病的免疫反应。

新模型是第一个专注于mRNA非翻译区域的语言模型。研究人员表示，即使是少量提高蛋白质生产效率，也会对新兴疗法产生重大推动作用。经过对来自少数物种的mRNA的训练，它能解码核苷酸序列并揭示有关基因调控的新知识。而基因调控是生命最基本的功能之一，是找到疾病和紊乱根源的关键。

我们喜欢问语言模型一大堆奇奇怪怪问题，把它当成生活和工作的助手。然而，语言模型还能在制造疫苗中大显身手。因为，在生物世界，同样有信息流动，同样有语言和语法。mRNA被称为信使RNA，指导蛋白质合成。不过，它只有一部分包含蛋白质代码，还有一部分则不翻译。语言模型就瞄准了这些未翻译的部分，经过训练，提高了蛋白质生产的效率，有助于研发更好的mRNA疫苗。机器智能与生物智能结合，创造出了更有意思的产品。

上一篇：人类神经元研究新模型面世下一篇：返回列表

标签：

分享到：

今日中国·版权声明

本网站所收集的部分公开资料来源于互联网，转载的目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品，请与我们取得联系，我们会及时修改或删除。

本网站所提供的信息，只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误，对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内，本网站在此声明，不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。

【特别提醒】：如您不希望作品出现在本站，可联系我们要求撤下您的作品。邮箱znx177@sina.com