科学家通过多种方法探究长链非编码RNA
直到今天,一个简明合理的低核转录因子基因分类系统还远未实现。
长链非编码核糖核酸来源的概念模型
2013年,一组研究人员决定深入研究一种叫做H1的人类胚胎干细胞系,并得到了一些惊喜。H1是最著名的干细胞系之一,但是该团队已经成功地发现了2000多个以前无法解释的核糖核酸片段。更重要的是,其中146种是人类胚胎干细胞所独有的,因此为研究多能性提供了有吸引力的线索,多能性是指在体内成为任何细胞类型的能力。
然而,这些转录并没有受到太多的关注,因为它们包含重复的编码片段,这些片段经常被序列分析仪过滤掉。
这是一个巨大的盲点。其他实验室已经发现了富含重复编码的核糖核酸存在的初步证据,这在人类干细胞中非常重要。当主要来自加州斯坦福大学的研究人员分析结果时,他们意识到他们刚刚发现了这样的核糖核酸。团队成员维托里奥·塞巴斯蒂安诺说,在146个核糖核酸序列中,最丰富的三个——命名为HPAT2、HPAT3和HPAT 5——似乎是建立能够发育人类胚胎的多能细胞所必需的。
这些核糖核酸片段是长链非编码核糖核酸(长度至少为200个碱基且不编码蛋白质的序列)的例子。LncRNA存在于许多不同种类的组织中,通常在细胞内的特定位置发现。然而,大多数lncRNA缺乏明确的功能,直到最近,它被认为只是转录噪音。
随着更多的数据涌入,这种观点开始改变。数据显示,在进化过程中,低分子量核糖核酸的转录基因组区域比以前认为的更加保守,这意味着它们有一些功能。然而,直到今天,一个简明合理的低核转录因子基因分类系统仍远未实现。
功能优先
由于lncRNA的列表如此之长,关键的一步是决定哪些是研究的重点。大约15年前,约翰·林恩在研究生水平上发现了lncRNA,他建议从与疾病相关的基因组区域的lncRNA开始。目前,瑞恩在麻省理工学院和哈佛大学建立的布罗德研究所管理着一个专门从事分子研究的实验室。
另一个想法是研究lncRNA的位置——例如,在转录起点附近发现lncRNA,这意味着它参与了附近基因的调节。目前,研究人员可以相对容易地追踪分子在细胞中的位置。瑞恩和其他来自布罗德研究所和宾夕法尼亚大学的研究人员使用一种称为单分子荧光原位杂交的技术,成功地鉴定了位于皮肤、肺和颈部肿瘤细胞中的61个lncRNA分子。
今天,科学家们还可以使用CRISPR-Cas9和其他基因编辑技术来干扰低分子量核糖核酸的转录DNA序列或指导其转录的启动子,从而测试低分子量核糖核酸的功能。一些技术使实验室能够快速筛选大量的低分子量核糖核酸。当CRISPR-Cas9用于研究蛋白质编码基因的功能时,逻辑是相同的:单个碱基的缺失或替换被引入到DNA中,并且观察到转录改变的效果。
斯坦福大学医学院的癌症生物学家霍华德·张(Howard Chang)表示,唯一的问题是,由于比蛋白质更小的变化,lncRNA不太可能丧失其功能,而且序列变化通常更剧烈。
这就是为什么核糖核酸研究人员自己制造CRISPR-Cas9。他们扩展了CRISPR工具箱,加入了阻断或启动特定基因转录的方法。然而,瑞恩和他的团队开发了另一种方法:一种叫做CRISPR-Display的工具。瑞恩将它比作一架无人驾驶飞行器,能够在细胞内的任何地方运输货物,在这个例子中是特定的LNC核糖核酸。如果怀疑有基因激活的任务,可以通过将基因转移到不同的基因组区域并在新的位点观察基因激活来进行测试。
核糖核酸相互作用组
一个完全不同的方法是找到与lncRNA相互作用的物体。“人们仍然认为,尽管lncRNA非常重要,但如果没有辅助因素,它最终将无法发挥作用。”林纳疗法的联合创始人、麻省总医院的分子生物学家珍妮·李说,这些辅助因素几乎总是蛋白质。
Lee和其他人已经开始使用一种叫做Xist的lncRNA来揭示他们的相互作用。研究发现,在雌性哺乳动物细胞中,Xist有必要使两条X染色体中的一条失活,从而防止雌性拥有两倍于雄性的X染色体基因产物。结合到Xist的蛋白质通过各种机制沉默基因表达。然而,去年科学家们终于确定了这些“伙伴”现在,研究发现这些蛋白质不仅能吸引其他抑制转录的分子,还能排斥一些启动转录的分子。
有许多技术可用于探索一个低分子量核糖核酸的蛋白质“伴侣”组:广义地说,研究人员使用甲醛或紫外线等技术将核糖核酸和蛋白质连接在一起,然后使用质谱分析谁与谁结合,并提出“相互作用组”的概念。通常,这些分析有许多步骤,所以科学家需要做出许多战略选择。核糖核酸和蛋白质应该如何联系?如何区分相互作用的真实信号和虚假信号?笼罩在所有这些研究之上的问题是,核糖核酸在试管中的表现通常不同于在细胞中。
这就是为什么科学家们致力于研究现有的相互作用,专注于各种技术,这些技术能够识别与活细胞中的蛋白质结合的核糖核酸。最近质谱分析灵敏度的提高正在帮助研究人员。去年,常的团队将使用甲醛作为连接物的实验与最新的质谱分析相结合,发现Xist可以在试管中结合81种蛋白质。
结构中的秘密
第三种方法是研究它们的结构。虽然这种方法不能像预测蛋白质的功能那样直接预测基因的功能,但是更多的关于核糖核酸成弓形和折叠的知识可以提供一些信息。"这是一个完全开放的领域,需要做很多工作。"新墨西哥州洛斯阿拉莫斯国家实验室的结构生物学家卡丽莎·桑邦马苏说。
建立lncRNA二级结构的方法包括化学检测,例如称为SHAPE的方法。它包括将乙酰基连接到核糖核酸上,并只在柔性区域修饰其“骨架”。该修饰位点阻断了“读取”核糖核酸的酶,从而产生互补的脱氧核糖核酸序列,这样就产生了短的脱氧核糖核酸片段,而不是长链。随后,这些片段可以在凝胶上测序或按大小分类。
2012年,三邦马苏团队首次描述了人类低核受体的二级结构:类固醇受体核糖核酸激活剂,十多年来一直被认为与雌激素受体有关。
然而,这种结构方法必须解决核糖核酸在试管和细胞中表现不同的问题。像联合研究一样,最新技术是在试管中进行的。2012年,包括常在内的一个团队描述了一个在活细胞中工作的SHAPE版本,并从那时起对其进行了改进,以同时描述数千个核糖核酸的结构。
像其他方法一样,结构研究需要大量的时间投入,所以在关注最有可能具有功能的lncRNA时,必须进行仔细的选择。Sanbonmatsu说,幸运的是,研究人员在这一分类方面越来越好。她建议,在判断功能重要性的可能性时,科学家应该首先从已知表型的lncRNA开始,然后通过化学方法探索它们以获得二级结构,并检查它们在其他物种中的保存程度。(宗华)
中国科学新闻(2016-02-03第三版国际版)
阅读更多
《自然》杂志的相关报道