DNA编码分子库为药物发明提供便利
照片来源:KTSDESIGN
随着DNA编码分子文库的不断扩展和未知生物领域新筛选方法的不断发展,DNA编码分子文库将成为制药行业开发新药的支柱之一。
在马萨诸塞州沃尔瑟姆的一栋混凝土建筑的二楼,一个普通实验室冰箱的塑料盒里放着一个透明的试管,里面装有天文天平的混合物。这个分子库被伦敦制药公司葛兰素史克(GlaxoSmithKline)的大量化合物所冻结,其中含有1万亿个独特的DNA标记分子,是银河系恒星数量的10倍。
这种分子文库有助于制药公司和生物技术公司快速识别能“缠绕”疾病的蛋白质,尤其是那些难以靶向的候选药物。与传统方法相比,它们使筛选工作更加快速和便宜。科学家也可以用它们来探索基本的生物学问题,研究酶、受体和细胞途径。
药物发现通常始于研究人员聚集大量的化学分子,然后针对目标测试它们的功效。这些化合物被单独添加到含有目标蛋白质的“孔”中,观察它们是否影响它们的活性。这种被称为高通量筛选(HTS)的方法是自动化的,可以使用自动化设备测试数百万种化学物质,但它仍然费力、昂贵,而且不总是成功的。
在过去的几年里,药物化学家试图用类似条形码的DNA片段来标记化合物,以增加发现潜在有用化合物的机会。这些DNA编码分子文库使传统的小分子文库相形见绌,为药物发现提供了所有便利。首先,研究人员不是单独测试每一种化合物,而是将所有标记了DNA的小分子放入单一混合物中,然后加入目标蛋白质。借助于DNA条形码,任何与目标蛋白质结合的化合物都可以很容易地被识别出来。
美是伟大的。
目前,葛兰素史克拥有世界上最大的DNA编码分子库:比拥有200万个化合物的HTS分子库大50万倍。
有几种方法可以建立一个编码分子库:像葛兰素史克这样最大的分子库是用一种叫做“DNA记录”的方法建立的。氨基酸、胺和羧酸等基本化学成分被合成,然后通过化学反应用独特的DNA条形码标记。第二种基本成分被添加到混合物中,形成一个新的小分子,然后DNA条形码被扩展。通过添加四种成分,化学家可以创造出像药物一样的分子。因为它们可以使用成千上万种基本成分,所以潜在的组合数量是巨大的。
与传统的高温超导分子库(化学家必须分别测试每种化合物)相比,DNA编码分子库更易于维护和使用。它可以储存在一个单独的试管中,而高温超导分子库需要的设备是全自动装置,并且足够大以分别储存每种化合物。
然而,在沃尔瑟姆工作的葛兰素史克经理克里斯·阿里科·穆恩德尔(Chris Arico-Muendel)表示,DNA编码分子库的真正美妙之处在于它能够合成数量惊人的化学结构。对于难以找到的新蛋白质靶标,该公司的药物研发团队使用DNA编码分子文库的频率与HTS分子文库的频率一样高,甚至更高。迄今为止,从公司的DNA编码分子库中获得的最先进的化合物是GSK2256294。它可以阻断一种参与分解脂类的酶——环氧酶。该候选药物来自葛兰素史克公司与普瑞斯公司的合作,并已完成其首次人体安全性研究。这些研究可为进一步评价其在糖尿病、伤口愈合或作为慢性阻塞性肺疾病治疗中的应用提供支持。"我们对葛兰素史克公司DNA编码分子文库的进展非常满意."阿里科-穆恩德尔说。
特制的
其他生物技术公司增加了一些更有趣的内容。他们不仅使用DNA标记来识别化合物,还用它们作为模板来制造化合物。哈佛大学化学家刘中达和他的学生发明了这种“基于DNA的模板”方法,并用它建立了一个名为大环化合物的环状分子库。这些更稳定的大环分子在多个位点与靶蛋白相互作用,从而提高结合反应的特异性。
刘首先创建了一个单链DNA模板作为指导。它们包括几个与化学基本成分上的DNA标记互补的区域。随后,他将标记有DNA的基本成分依次加入到反应容器中,并依靠DNA碱基配对将标记成分聚集到足够近的位置,使它们相互结合。随后,最终的反应将链状的基本成分转化成环,从而产生每个都对应于一个独特的DNA条形码的环状大分子。
建立一个基于DNA的分子库需要大量的工作,因为研究人员必须为每个分子设计一个模板,并用DNA标记成千上万的基本成分。因此,以脱氧核糖核酸为模板的分子文库比用脱氧核糖核酸记录法产生的分子文库小,但在规模上,它们仍优于高温超导分子文库,并具有其他优势。因为科学家从一开始就知道产生了什么化合物,所以他们能够纯化基于DNA的分子文库,从而去除那些标记不准确的化合物。相比之下,由DNA记录产生的巨大分子库可能仍然含有被错误标记的化合物,这可能导致研究人员在药物筛选上浪费精力。
刘强大的分子库包含了14000个分子,并取得了一定的成绩。2014年,他的团队声称已经发现了能够阻断与二型糖尿病相关的胰岛素降解酶(IDE)的特定且稳定的小分子,从而解决了研究人员几十年来一直试图解决的问题。刘和其他人已经开始阐明IDE在健康和疾病中的作用,并且正在讨论将其开发成药物。
甜蜜的筛选
一旦分子文库建立起来,识别哪些分子可以与目标蛋白质结合的乐趣就开始了。大多数研究人员依靠“亲和筛选”来寻找这些化合物。为了实现这一点,他们将修饰目标蛋白,使其包含一个纯化的标签。然后,他们使用纯化的标签提取组合对。最后一步是使用DNA测序仪来读取与小分子相关的DNA标签。
即使目标蛋白质的数量很少,这种方法仍然可以产生一些结果。Arico-Muendel回忆说,在一个项目中,学术合作伙伴希望筛选出一种只能少量生产的不稳定蛋白质。“他们连夜飞行,用干冰把它运到这里。我们立即将它们全部筛选出来。”他说,“事实上,这已经产生了一些非常好的候选药物。”对高温超导来说,这样的测试是不可能的,因为目标蛋白质必须足够稳定和丰富,能够在测试开始前添加到数百万个“孔”中。
然而,“亲和筛选”也有一个短板。重的DNA标签有时会阻碍与靶蛋白的反应,一些潜在的候选药物可能会丢失。然而,由于大量的DNA编码分子,筛选人员通常不太关心这些损失。一个更大的问题是小分子和它们的标记会结合到纯化柱上,产生假阳性候选药物。纯化的标签也会影响目标蛋白质的结构,导致数据混乱。
一些团队提出了解决这个问题的方法。维普根是一家生物技术企业,通过DNA模板法建立了5000万个分子的分子文库。该公司寄希望于“粘合剂陷阱集中”战略。
该公司首席执行官尼尔斯·汉森(Nils Hansen)说,“想象一下,你将蛋白质分子库的混合物冷冻,然后切成超小的冰块。”如果冰足够小,每个冰只能包含一个目标。在这种规模上,即使不采用纯化策略,与目标结合的小分子的比例也会继续增加。Vipergen通过筛选水和油乳化剂达到了同样的效果。其中,微小的水滴已经取代了冰块。“很酷。”汉森说。
据专家介绍,随着DNA编码分子库的不断扩大和未知生物领域新筛选方法的不断发展,DNA编码分子库将成为制药行业开发新药的支柱之一。(宗华)
《中国科学报》(国际版,第3版,2016年4月5日)
阅读更多
《自然》杂志的相关报道