欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

机器学习在分子生物学领域大显身手

科普小知识2021-11-28 07:06:58
...

在一个人工智能控制的探针中,由一家生物技术初创公司Zymergen生产更多的化学物质,机器人手指正准备选择微生物菌群。

资料来源:齐梅根/艾伯特·劳摄影

如果这是未来的生物实验室,那么它看起来和今天的实验室没有什么不同。穿着白大褂的科学家走过装满冷冻玻璃管的盒子。架子上的化学物质——纯酒精瓶、糖罐、蛋白质和盐——是培养和调节微生物的标准物品。如果不是因为你耳朵听到的机械声音,你可能根本不会注意到这里的机器人:它们像蟋蟀一样在风扇的低噪音中互相嗡嗡叫。

这些机器人为生物技术公司Zymergen工作,该公司于2014年迁至旧金山、美国和加拿大东海岸的一家前电子工厂。这些机器人整天都在进行微生物实验,寻找增加有用化学物质产量的方法。这是一个叫做“回声”的机器人:它位于一堆设备的中间。一只机械臂抓住一个有数百个小孔的塑料模块,里面装着液体。一束激光扫描了模块旁边的条形码,并将其“反射”到托盘上。下一步非常微妙,难以用肉眼观察。

"这不是人们用移液器吸取液体的复制品."该公司的联合创始人之一、分子生物学家、运营和工程副总裁杰德·迪恩(Jed Dean)说,“这是一种完全不同的方式。”机器人不需要移液管来吸收和注射几毫升液体到每个孔中(细胞水平的液体量的波动),并且不接触它。相反,声波脉冲会以每秒500次的频率使液体本身产生波纹,形成的液滴比人类能够转移的液体量小1000倍。

事实上,这些并不是真正的未来主义部分。机器人和条形码已经在大型生物实验室使用多年。甚至被称为“声滴喷射”的液体去除技术也已经存在了几十年。当迪恩被问及机器人在做什么时,他透露了一点真相。事实上,这是计算机程序的输出。

“我想说明的是,在这个过程中,人类科学家正在理解结果和现实,并对它们进行检验。”Zymergen的首席执行官约书亚·霍夫曼解释道。他说解释数据、产生推论和计划实验的最终目标是“摆脱人类主观的直觉思维”。

Zymergen是几个有着相同目标的公司之一:使用人工智能来增加或取代人类在科学过程中的角色。人们用“人工智能驱动的生物技术”来描述这一过程,但齐梅尔根的联合创始人对此表示担忧。"“人工智能”听起来像机器人下棋."该公司的首席技术官艾伦·金博尔说,“我认为‘移动电话’更舒服。”霍夫曼说,人工智能指的是机器学习,这是计算科学的一个分支,可以解释几乎所有最近人工智能的进步。“这正是我们正在做的。”

自动发现

科学是一个序列。日常的实验室工作与工厂工作大不相同。论文来了,它激发新的实验,然后产生新的发现,最后产生新的论文。这个循环。各种公司和研究机构正在扩展机器人和基于人工智能的工具,以增强甚至取代人类在这一过程中的每一步角色。

Zymergen实际上控制了可用于生物质燃料、塑料或药物的工业微生物。为了增加产量,一些公司把他们的菌株送到了齐默根。那里的机器人随后探索并修复每种微生物的基因组,从而设计出一个菌株版本,使其合成产品更加高效。

霍夫曼说,问题在于,送往Zymergen的微生物已经“高度优化”经过几年的研究和繁殖,这些细胞非常擅长发挥它们的功能。因此,“挤出”更多的效率需要深入探索其基因组,进行实验,跟踪相关数据和进行科学研究。

齐默根正试图加快这一科学进程。霍夫曼说,在传统生物学中,“需要一个人站在办公桌前测试有限的假设。每月有可能测试10个假设。”机器人可以以更快的速度完成这个过程。齐默根的机器人每周可以进行多达1000次实验。但是机器人只能遵循指令:给它们正确的指令才是真正的瓶颈。

当被问及这个公式是如何设计实验的时,金博尔提到了一个简单的前提。“例如,你有大约5000个原始微生物的基因,你有10种方法来改变每个基因,这意味着你必须做50000个实验。”他说,实验的“活动”始于1000个菌株的生产,每个菌株都有特定的突变。“每种菌株都生活在一个液滴中。你喂它糖,让它煮一会儿,然后测量它得到多少产品。”可能有25个菌株产生更多的目标化学物质。这些菌株将成为下一轮实验的改良品种,而其余的将进入冷冻室。

机器人定位

通往这一发现的道路绝非平坦。金博尔说,找到正确的突变组合需要漫长而艰难的基因“地形”探索之旅。如果我们只是盲目地走向效率的顶峰,我们可能永远也达不到顶峰。这是因为如果所有产生微小提升的突变都结合成一种微生物,它们可能不会累积成大的收获。他说,相反,微生物会“生病”,它们的表现会比原始菌株更差。因此,选择正确的路径,包括绕道进入更多潜在的山谷,也需要一张地图来显示所有的突然影响。这张地图不是三维的,而是成千上万的。因此,需要机器学习来确定方向。

这是关键的区别:当机器人最终发现可以提高化学物质产量的基因变化时,他们不知道其影响背后的生化线索。

那么,如果机器人实验不能加深人们对生物工作的理解,那它真的是一门科学吗?对金博尔来说,这样的哲学界限可能无关紧要。"我们从它的工作中受益,而不是从理解原因中受益。"

霍夫曼说,到目前为止,齐默根的机器人实验室已经将产生化学物质的微生物的效率提高了10%以上。这种增长听起来可能很小,但在一个依靠微生物发酵达到每年1600亿美元的化学工业中,增长的一小部分可以转化为更多的资金,甚至超过美国国家科学基金会每年70亿美元的预算。

机器人发现的高级基因变异代表了真正的发现。这些可能是人类科学家没有发现的变异。大多数增加产量的基因与所需化学物质的合成没有直接关系,例如,其中一半没有已知的功能。"我在几种不同的微生物中发现了这种模式."迪恩说。在没有机器学习的情况下找到正确的基因变异就像试图打开一个标有数千个数字的保险箱。"人类的直觉很容易被这种复杂性淹没."他说。

电脑作者?

如果机器真的准备好代替人类完成一些科学任务,许多科学家会欣然接受。与工厂工人或出租车司机不同,大多数实验科学家欢迎自动化他们的一些工作。在分子和细胞生物学领域尤其如此,因为诸如喷洒液体、电镀细胞、计数菌落等手工劳动。非常复杂而且昂贵。研究生最微小的错误或不准确都会浪费几周甚至几个月的时间。

然而,一些生物学家也指出了支持人工智能解释数据和设计实验的一些缺点。"我们发现目前的机器学习方法不能胜任这项任务."加州斯坦福大学的计算生物化学家Rhiju Das说,他研究了分子如何折叠来设计新药。"与拥有相同数据的人类相比,他们在核糖核酸设计上严重落后于人类."虽然他不知道这是为什么,但带有“设计”的任务似乎需要人类的直觉。也许齐默根碰巧遇到了实验的生物学部分,这非常适合计算机控制。

即使人工智能控制研究可以工作,人类会理解计算机已经发现了什么吗?结果背后的计算仍然是一个“黑箱”。“一个令人困惑的可能性是,我们正在接近一个‘可以理解的’科学时代。”宾夕法尼亚州匹兹堡卡内基梅隆大学的计算生物学家阿德里安·特赖尔说,他和分子生物学家一起工作。研究人员可能不仅依赖计算机进行科学研究,还会解释科学:一些生物学理论证据非常复杂,接受它需要对计算机有信心。

在这种情况下,科学家应该共同创作他们的计算机吗?“我不会那么做。”将人工智能应用于科学发现的波士顿公司Nutonian的首席执行官迈克尔·施密特说。但他后来说:“当计算机能够阅读和理解论文的含义时,它们自己就能成为作者。”(晋南编)

阅读更多

科学相关报道