人类基因组计划
人类基因组计划(humangenomeproject,HGP)是由美国科学家于1985年率先提出,旨在阐明人类基因组30亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。于1990年正式启动的。美国、英国、法兰西*、德意志联邦*、日本和我国科学家共同参与了这一价值达30亿美元的人类基因组计划。这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。
中文名:人类基因组计划
英文名:Humangenomeproject
简称:HGP
提出时间:1985年
提出国家:美国
启动时间:1990年
参与国家:美国、英国、德国、日本、法国、中国
工程总投资:27亿美元
工程期限:1990年-2003年
1、人类基因组
人类基因组是指人的所有遗传信息的总和。人体细胞都源于同一个细胞——受精卵。受精卵是由精子与卵子相结合而形成的。精子与卵子一旦结合,就开始了细胞分裂。它们一个变两个,两个变四个,四个变八个……不断地分裂,到足月时,一个新的生命就来到了人世间。新的生命降生后,细胞仍然在继续分裂,一直分裂到人体发育成熟,成熟的个体,细胞要进行新陈代谢,不断更新,每一个细胞平均以200天为一个周期更新。支配细胞分裂的就是人的基因。
人类染色体和基因
人类基因组大约含有6万到10万个基因,主要分布在细胞核的染色体中。人类基因组就是指人体细胞中的24个不同的染色体,即1—22号常染色体、X和Y染色体所带有的遗传信息的总和。每个染色体为一个脱氧核糖核酸,即DNA分子所组成,所以人的基因主要包含在这24个不同的DNA分子上,这些DNA分子,含有30亿个组成成分,即组成DNA的A、T、C、G四种核苷酸,如将这四种核昔酸比作基本化学“字母”的话,人类基因组蕴藏的生、老、病、死的遗传信息,均由一系列3个“字母”的核苷酸所组成。DNA上带有承袭父母的遗传信息,指示人体蛋白质的合成,而RNA(核糖核酸)则接受DNA的信息实际执行蛋白质的合成。
人体主要由蛋白质所构成,如人体的皮肤、头发、肌肉、脏器,包括各种各样进行新陈代谢的酶等,都由蛋白质构成的。人类基因组计划是要读出这30亿个化学字母。也就是测出所有染色体上的30亿个碱基的排列顺序,2000年6月26日公布的工作草图中包括人体90%以上碱基的位置信息,这足以帮助科学家掌握人类生命密码的主要框架结构。
2、发展历史
美国人类基因组计划的形成
1985年5月,美国能源部提出"人类基因组计划"草案;经过一番讨论后于1986年3月宣布实施这个草案;1986年3月7日,DulbeccoR在Science上发表了一篇有关开展人类基因组计划的短文,引起了全世界的强烈反响,不仅推动了美国,也推动了全世界的人类基因组计划的发展;1987年初,美国能源部和国家健康研究院为"人类基因组计划"下拨了启动经费550万美元,全年1.66亿美元;1988年2月,国家科学研究委员会的专家成立了"国家人类基因组研究中心",由沃森任第一任主任;尽管有了以上这些工作,美国国会正式批准的"人类基因组计划"到1990年10月1日才正式启动,其规模在世界上是最大的,计划在15年内投入30亿美元以上的资金进行人类基因组的分析。
其他国家的情况
在Dulbecco短文的影响下,整个欧洲都行动起来了,并各具特色。1987年,意大利;1989年,英国;1990年,法国;1995年,德国,开始启动各自的基因组计划;1990年6月,欧共体通过"欧洲人类基因组计划"。此外,丹麦,日本,韩国,俄罗斯和澳大利亚也加入行动行列。
中国
中国的HGP始于1994年,是在吴旻,强伯勤,陈竺,杨焕明等人的倡导下启动的。最初由国家自然科学基金委员会和"863"高科技计划的支持下,先后启动了"中华民族基因组中若干位点基因结构的研究"和"重大基因相关基因的定位、克隆、结构与功能研究"。1998年3月由陈竺院士挂帅成立上海中心,10月改名为中国南方基因中心。
中国对人类基因组计划做出重大贡献
现在,我国已建立起一整套较完整的基因组研究体系,在基因多样性领域,建立了多民族人群的DNA样品库,对中国南、北30个民族或人群的遗传关系进行了研究,并与世界其他人群进行了比较。疾病基因的研究也取得了可喜的进展,克隆了遗传性高频耳聋的致病基因,定位了若干单基因疾病的染色体位点。在白血病和某些实体肿瘤相关基因的结构,功能研究方面也取得重大突破,已获得EST(表达序列标签)10多万条,克隆了1000条以上新基因的全长cDNA,在模式生物体基因组的全测序方面我国也做了出色的工作,开展了中国生物数据库的建设。
企业的争夺
此外,除了早期的*介入之外,世界上几乎所有的医药公司都卷入了这场所谓的HGP,无形中形成了一场"抢基因"大战。
3、研究内容
HGP的主要任务是人类的DNA测序,可用4张图谱来概括,即遗传图谱,物理图谱,序列图谱和基因图谱。此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。
世界首个女性遗传图谱绘制完成
1、遗传图谱(geneticmap)
又称连锁图谱(linkagemap),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。2、物理图谱(physicalmap)
物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法——标记片段的部分酶解法,来说明图谱制作原理。3、序列图谱
随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。4、基因图谱
基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。基因图谱的意义:在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。4、人类基因组计划大事记
对人类基因组的研究在70年代已具有一定的雏形,在80年代在许多国家已形成一定规模。
1984年在Utah州的Alta,WhiteRandMendelsonhnM受美国能源部(DOE)的委托主持召开了一个小型专业会议讨论测定人类整个基因组的DNA序列的意义和前景(CookDeeganRM,1989)
1985年5月在加州SantaCruz由美国DOE的SinsheimerRL主持的会议上提出了测定人类基因组全序列的动议,形成了美国能源部的“人类基因组计划”草案。
1986年3月,在新墨西哥州的SantaFe讨论了这一计划的可行性,随后DOE宣布实施这一计划。
1986年遗传学家McKusickV提出从整个基因组的层次研究遗传的科学称为“基因组学”
1987年初,美国能源部和国立卫生研究院为HGP下拨了启动经费约550万美元(全年1.66亿美元)
1988年,美国成立了“国家人类基因组研究中心”由WatsonJ出任第一任主任
1990年10月1日,经美国国会批准美国HGP正式启动,总体计划在15年内投入至少30亿美元进行人类全基因组的分析。
1987年,意大利*国家研究委员会开始HGP研究,其特点是技术多样(YAC,杂种细胞,cDNA等)、区域集中(基本上限于Xq24-qter区域)
1989年2月英国开始HGP,特点是:帝国癌症研究基金会与国家医学研究委员会(ICRP-MRC)共同负责全国协调与资金调控,剑桥附近的Sanger中心注重首先在线虫基因组上积累经验,改进大规模DNA测序技术;同时建立了YAC库的筛选与克隆、特异细胞系、DNA探针、基因组DNA、cDNA文库、比较生物基因组DNA序列、信息分析等的“英国人类基因组资源中心”。可谓“资源集中、全国协调”。
1990年6月法兰西*的HGP启动。科学研究部委托国家医学科学院制定HGP,主要特点是注重整体基因组、cDNA和自动化。建立了人类多态性研究中心(CEPH),在全基因组YAC重叠群、微卫星标记(遗传图)的构建以及驰名世界的用作基因组研究的经典材料CEPH家系(80个3代多个体家系)方面产生了巨大影响。
1995年德意志联邦*开始HGP,来势迅猛,先后成立了资源中心和基因扫描定位中心,并开始对21号染色体的大规模测序工作。
1990年6月欧共体通过了“欧洲人类基因组研究计划”,主要资助23个实验室重点用于“资源中心”的建立和运转。还有丹麦王国、俄罗斯联邦、日本、大韩民国、澳大利亚等。
人类基因组计划中心负责人合影
1994年,我国HGP在吴旻、强伯勤、陈竺、杨焕明的倡导下启动,最初由国家自然科学基金会和863高科技计划的支持下,先后启动了“中华民族基因组中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构和功能研究”,1998年在国家科技部的领导和牵线下,在上海成立了南方基因中心,1999年在北京成立了北方人类基因组中心,1998年,组建了中科院遗传所。1999年7月在国际人类基因组注册,得到完成人类3号染色体短臂上一个约30Mb区域的测序任务,该区域约占人类整个基因组的1%。
2000年4月末,我国科学家按照国际人类基因组计划的部署,完成了1%人类基因组的工作框架图。
2000年5月8日,由德国和日本等国科学家组成的国际科研小组宣布,他们已经基本完成了人体第21对染色体的测序工作。
2000年6月26日,中、美、日、德、法、英等6国科学家宣布首次绘成人类基因组“工作框架图”。
2001年2月12日,六国科学家联合在学术期刊上发表人类基因组“工作框架图”及初步分析结果。
2001年8月26日,人类基因组“中国卷”的绘制工作宣告完成。
2003年4月14日,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。已完成的序列图覆盖人类基因组所含基因区域的99%,精确率达到99.99%,这一进度比原计划提前两年多。至此,人类基因组计划共耗资27亿美元,比原先预计的30亿美元有明显节省。
5、主要实例
疾病基因
人类基因组研究的一个关键应用是通过位置克隆寻找未知生物化学功能的疾病基因。这个方法包括通过患病家族连锁分析来绘制包含这些基因的染色体区域图,然后检查该区域来寻找基因。位置克隆是很有用的,但是也是非常乏味的。当在1980s早期该方法第一次提出时,希望实现位置克隆的研究者们不得不产生遗传标记来跟踪遗传,进行染色体行走得到覆盖该区域的基因组DNA,通过直接测序或间接基因识别方法分析大约1Mb大小的区域。最早的两个障碍在1990s中期在人类基因组项目的支持下随着人类染色体的遗传和物理图谱的发展而清除。然而,剩余的障碍仍然是艰难的。
寻找预知疾病的基因密码
所有这些将随着人类基因组序列草图的实用性而改变。在公共数据库中的人类基因组序列使得候选基因的计算机快速识别成为可能,随之进行相关候选基因的突变检测,需要在基因结构信息的帮助。对于孟德尔遗传疾病,一个基因的搜索在一个适当大小的研究小组经常在几个月实现。至少30个疾病基因直接依赖公共提供的基因组序列已经定位克隆到。因为大多数人类序列只是在过去的12个月内得到,可能许多类似的发现还没有出版。另外,有许多案例中,基因组序列发挥着支持作用,例如提供候选微卫星标识用于很好的遗传连锁分析。(2001年中国上海和北京科学家发现遗传性乳光牙本质Ⅱ型基因)
基因组序列对于揭示导致许多普通的染色体删除综合症的机制同样有帮助。在几个实例中,再发生的删除被发现,由同源体重组合在大的几乎同一的染色体内复制的不等交叉产生。例子包括在第22条染色体上的DiGeorge/velocardiofacial综合症区和在第7条染色体上的Williams-Beuren综合症的重复删除。
基因组序列的可用性同样允许疾病基因的旁系同源性的快速识别,对于两个理由是有价值的。首先,旁系同源基因的突变可以引起相关遗传疾病。通过基因组序列使用发现的一个很好的例子是色盲(完全色盲)。CNGA3基因,编码视锥体光感受器环GMP门控通道的a亚单位,显示在一些色盲家系中存在突变体。基因组序列的计算机检索揭示了旁系同源基因编码相应的b亚单位,CNGB3(在EST数据库中没有出现)。CNGB3基因被快速认定为是其他家系的色盲的原因。另一个例子是由早衰1和早衰2基因提供的,它们的突变可能导致Alzheimer疾病的的早期发生。第二个理由是旁系同源体可以提供治疗敢于的机会,例子是在镰刀状细胞疾病或β地中海贫血的个体中试图再次激活胚胎表达的血红蛋白基因,它是由于β-球蛋白基因突变引起的。
我们在在线人类孟德尔遗传数据库(OMIM)和SwissProt或TrEMBL蛋白质数据库中进行了971个已知的人类疾病基因的旁系同源体的系统检索。我们识别了286个潜在的旁系同源体(要求是至少50个氨基酸的匹配,在相同的染色体上一致性大于70%但小于90%,在不同的染色体上小于95%)。尽管这种分析也许识别一些假基因,89%的匹配显示在新靶序列一个外显子以上的同源性,意味着许多是有功能的。这种分析显示了在计算机中快速识别疾病基因的潜能。
治疗疾病
在过去的世纪里,制药产业很大程度上依赖于有限的药物靶来开发新的治疗手段。最近的纲要列举了483个药物靶被看作是解决了市场上的所有药物。知道了人类的全部基因和蛋白质将极大的扩展合适药物靶的寻找。虽然,仅仅人类的小部分基因可以作为药物靶,可以预测这个数目将在几千之上,这个前景将导致基因组研究在药物研究和开发中的大规模开展。一些例子可以说明这一点:
⑴神经递质(5-HT)通过化学门控通道介导快速兴奋响应。以前识别的5-HT3A受体基因产生功能受体,但是比在活体内有小得多的电导。交叉杂交实验和EST分析在揭示已知受体的其他同源体上都失败了。然而,通过对人类基因组序列草图的低要求检索,一个推定的同源体被识别,在一个PAC克隆中第11号染色体长臂上。同源体显示在纹状体、尾状核、海马中表达,全长cDNA随后得到。这个编码胺受体地基因,被命名为5-HT3B。当与5-HT3A组合成异二聚体中,它显示负责大电导神经胺通道。假定胺途径在精神疾病和精神分裂症的中心作用,一个主要的新的治疗靶的发现是相当有兴趣的。
⑵半胱氨酰基白三烯的收缩和炎症作用,先前认为是过敏反应的慢反映物质(SRS-A),通过特定的受体介导。第二个类似的受体,CysLT2,使用老鼠EST和人类基因组序列的重组得到识别。这导致了与先前识别的唯一的其它受体有38%氨基酸一致性的基因的克隆。这个新的受体,显示高的亲和力和几个白三烯的结合,映射在与过敏性哮喘有关的第13号染色体区域上。这个基因在气道平滑肌和心脏中表达。作为白三烯途径中抗哮喘药物开发中一个重要的靶,新受体的发现有明显的重要的作用。
⑶Alzheimer疾病在老年斑中有丰富的β-淀粉样物沉积。β-淀粉样物由前体蛋白(APP)蛋白水解生成。有一个酶是β位APP裂开酶,是跨膜天冬氨酸蛋白酶。公共的人类基因组草图序列计算机搜索最近识别了BACE的一个新的同源序列,编码一个蛋白,命名为BACE2,它与BACE有52%的氨基酸序列一致性。包含两个激活蛋白酶位点和象APP一样,映射到第21条染色体的必须Down综合症区域。它提出了问题,BACE2和APP过多的拷贝是否有功于加速Down综合症病人的脑部β-淀粉样物沉积。
给出了这些例子,我们在基因组序列中进行系统的识别传统药靶蛋白质的旁系同源体。使用的靶列表在SwissPrott数据库中识别了603个入口,有唯一的访问码。
基因修复与疾病治疗
生物学
一个例子是:解决了困扰研究者几十年的一个神秘课题:苦味的分子学基础。人类和其他动物对于某一种苦味有不同的响应(响应的多态性)。最近,研究者将这个特征映射到人类和老鼠中,然后检索了G蛋白偶合受体的人类基因组序列草图上的相关区域。这些研究很快导致了该类蛋白的新家族的发现,证明了它们几乎都在味蕾表达,实验证实了在培养细胞中的受体响应特定的苦基质。
人体基因组图谱是全人类的财产,这一研究成果理应为全人类所分享、造福全人类,这是参与人类基因组工程计划的各国科学家的共识。值得关注的是,目前在人类基因组研究领域,出现了一些私营公司争相为其成果申请专利的现象。美国塞莱拉基因公司曾表示,想把一部分研究成果申请专利,有偿提供给制药公司。
找到了一批主宰人体疾病的重要基因
如:肥胖基因、支气管哮喘基因。这类基因的新发现每年都有新报道。这些基因的发现,增进了人们对许多重要疾病机理的理解,并且推动整个医学思想更快的从重治疗转向重预防。例如:湖南医科大学夏家辉教授组于1998.5.28发表克隆了人类神经性高频性耳聋的致病基因(GJB3),这是第一次在中国克隆的基因。
在人类基因组计划的推动下,涌现了几门崭新的学科。如:基因组学(genomics)和生物信息学(bioinformatics)
生物技术的产业化。一批世界级的大公司纷纷把它们的重心转向生命科学研究和生物技术产品。这种趋势或潮流也不能不说和人类基因组计划密切相关。
6、HGP对人类的重要意义
1、HGP对人类疾病基因研究的贡献
人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。健康相关研究是HGP的重要组成部分,1997年相继提出:“肿瘤基因组解剖计划”“环境基因组学计划”。2、HGP对医学的贡献
基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。
人类基因组计划
3、HGP对生物技术的贡献
(1)基因工程药物:分泌蛋白(多肽激素,生长因子,趋化因子,凝血和抗凝血因子等)及其受体。(2)诊断和研究试剂产业:基因和抗体试剂盒、诊断和研究用生物芯片、疾病和筛药模型。(3)对细胞、胚胎、组织工程的推动:胚胎和成年期干细胞、克隆技术、器官再造。4、HGP对制药工业的贡献
筛选药物的靶点:与组合化学和天然化合物分离技术结合,建立高通量的受体、酶结合试验以知识为基础的药物设计:基因蛋白产物的高级结构分析、预测、模拟—药物作用“口袋”。个体化的药物治疗:药物基因组学。5、HGP对社会经济的重要影响
生物产业与信息产业是一个国家的两大经济支柱;发现新功能基因的社会和经济效益;转基因食品;转基因药物(如减肥药,增高药)6、HGP对生物进化研究的影响
生物的进化史,都刻写在各基因组的“天书”上;草履虫是人的亲戚——13亿年;人是由300~400万年前的一种猴子进化来的;人类第一次“走出非洲”——200万年的古猿;人类的“夏娃”来自于非洲,距今20万年——第二次“走出非洲”?7、HGP带来的负面作用
侏罗纪公园不只是科幻故事;种族选择性灭绝性生物武器;基因专利战;基因资源的掠夺战;基因与个人隐私。7、相关研究
生命科学工业的形成
由于基因组研究与制药、生物技术、农业、食品、化学、化妆品、环境、能源和计算机等工业部门密切相关,更重要的是基因组的研究可以转化为巨大的生产力,国际上一批大型制药公司和化学工业公司大规模纷纷投巨资进军基因组研究领域,形成了一个新的产业部门,即生命科学工业。
世界上一些大的制药集团纷纷投资建立基因组研究所。Ciba-Geigy和Ssandoz合资组建了Novartis公司,并斥资2.5亿美元建立研究所,开展基因组研究工作。SmithKline公司花1.25亿美元加快测序的进度,将药物开发项目的25%建立在基因组学之上。Glaxo-Wellcome在基因组研究领域投入4,700万美元,将研究人员增加了一倍。
大型化学工业公司向生命科学工业转轨。孟山都公司早在1985年就开始转向生命科学工业。至1997年,该公司向生物技术和基因组研究的投入已高达66亿美元。1998年4月,杜邦公司宣布改组成三个实业单位,由生命科学领头。1998年5月,该公司又宣布放弃能源公司Conaco,将其改造成一家生命科学公司。Dow化学公司用9亿美元购入EliLilly公司40%的股票,从事谷物和食品研究,后又成立了生命科学公司。Hoechst公司则卖了它的基本化学品部门,转项投资生物技术和制药。
传统的农业和食品部门也出现了向生物技术和制药合并的趋势。GenzymeTransgenics公司培养出的基因工程羊能以较高的产量生产抗凝血酶III,一群羊的酶产量相当于投资1.15亿美元工厂的产量。据估计,转基因动物生产的药物成本是大规模细胞培养法的十分之一。一些公司还在研究生产能抗骨质疏松的谷物,以及大规模生产和加工基因工程食品。
能源、采矿和环境工业也已在分子水平上向基因组研究汇合。例如,用产甲烷菌Methanobacterium作为一种新能源。用抗辐射的细菌Deinococcusradiodurans清除放射性物质的污染,并在转入tod基因后,在高辐射环境下清除多种有害化学物质的污染。
基因组破译程序图
功能基因组学
人类基因组计划当前的整体发展趋势是什么?一方面,在顺利实现遗传图和物理图的制作后,结构基因组学正在向完成染色体的完整核酸序列图的目标奋进。另一方面,功能基因组学已提上议事日程。人类基因组计划已开始进入由结构基因组学向功能基因组学过渡、转化的过程。在功能基因组学研究中,可能的核心问题有:基因组的表达及其调控、基因组的多样性、模式生物体基因组研究等。
(1)基因组的表达及其调控
1)基因转录表达谱及其调控的研究
一个细胞的基因转录表达水平能够精确而特异地反映其类型、发育阶段以及反应状态,是功能基因组学的主要内容之一。为了能够全面地评价全部基因的表达,需要建立全新的工具系统,其定量敏感性水平应达到小于1个拷贝/细胞,定性敏感性应能够区分剪接方式,还须达到检测单细胞的能力。近年来发展的DNA微阵列技术,如DNA芯片,已有可能达到这一目标。
2)蛋白质组学研究
蛋白质组学研究是要从整体水平上研究蛋白质的水平和修饰状态。目前正在发展标准化和自动化的二维蛋白质凝胶电泳的工作体系。首先用一个自动系统来提取人类细胞的蛋白质,继而用色谱仪进行部分分离,将每区段中的蛋白质裂解,再用质谱仪分析,并在蛋白质数据库中通过特征分析来认识产生的多肽。蛋白质组研究的另一个重要内容是建立蛋白质相互关系的目录。
3)生物信息学的应用
目前,生物信息学已大量应用于基因的发现和预测。然而,利用生物信息学去发现基因的蛋白质产物的功能更为重要。模式生物体中越来越多的蛋白质构建编码单位被识别,无疑为基因和蛋白质同源关系的搜寻和家族的分类提供了极其宝贵的信息。同时,生物信息学的算法、程序也在不断改善,使得不仅能够从一级结构,也能从估计结构上发现同源关系。但是,利用计算机模拟所获得的理论数据,还需要经过实验经过的验证和修正。
(2)基因组多样性的研究
人类是一个具有多态性的群体。不同群体和个体在生物学性状以及在对疾病的易感性与抗性上的差别,反映了进化过程中基因组与内、外部环境相互作用的结果。开展人类基因组多样性的系统研究,无论对于了解人类的起源和进化,还是对于生物医学均会产生重大的影响。认识不同生物中基因序列的保守性,将能够使我们有效地认识约束基因及其产物的功能性的因素。对序列差异性的研究则有助于认识产生大自然多样性的基础。在不同生物体之间建立序列变异与基因表达的时空差异之间的相关性,将有助于揭示基因的网络结构。
(3)开展对模式生物体的研究
随着线虫和果蝇基因组测序的完成,将来也可能开展对这两种生物的类似性研究。一些突变株系和技术体系建立后,不仅能够成为研究单基因功能的有效手段,而且为研究基因冗余性和基因间的相互作用等深层次问题奠定了基础。小鼠作为哺乳动物中的代表性模式生物,在功能基因组学的研究中展有特殊的地位。同源重组技术可以破坏小鼠的任何一个基因,这种方法的缺点是费用高。利用点突变、缺失突变和插入突变造成的随机突变是另一中可能的途径。对于人体细胞而言,建立反义寡核苷酸和核酶瞬间阻断基因表达的体系可能更加合适。蛋白质水平的剔除术也许是说明基因功能最有力的手段。利用组合化学方法有望生产出化学剔除试剂,用于激活或失活各种蛋白质。
总之,模式生物体的基因组计划为人类基因组的研究提供了大量的信息。今后,模式生物体的研究方向是将人类基因组8~10万个编码基因的大部分转化为已知生化功能的多成分核心机制。而要获得酶一种人类进化保守性核心机制的精细途径,以及它们的紊乱导致疾病的各种途径的知识,将只能来自对人类自身的研究。通过功能基因组学的研究,人类最终将将能够了解哪些进化机制已经确实发生,并考虑进化过程还能够有哪些新的潜能。一种新的解答发育问题的方法可能是,将蛋白质功能域和调控顺序进行重新的组合,建立新的基因网络和形态发生通路。也就是说,未来的生物科学不仅能够认识生物体是如何构成和进化的,而且更为诱人的是产生构建新的生物体的可能潜力。该计划在人类科学史上又竖起了一座新的里程碑!这是一项改变世界,影响人类生活的壮举,随着时间的推移,它的伟大意义将愈显昭彰。
人类基因组计划的发展
人类基因组计划之塞雷拉人类基因组计划
在国际人类基因组计划(以下简称“国际计划”)启动八年后的1998年,美国科学家克莱格·凡特创办了一家名为塞雷拉基因组(CeleraGenomics)的小私立公司,开展自己的人类基因组计划。与国际人类基因组计划相比,公司希望能以更快的速度和更少的投资(3亿美元,仅为国际计划的十分之一)来完成。塞雷拉基因组的另起计划被认为对人类基因组计划是一件好事,因为塞雷拉基因组的竞争促使国际人类基因组计划不得不改进其策略,进一步加速其工作进程,使得人类基因组计划得以提前完成。
塞雷拉采用了更快速同时更具风险的技术全基因组霰弹枪测序法。霰弹枪测序法的思想是将基因组打断为数百万个DNA片断,然后用一定的算法将片断的序列信息重新整合在一起,从而得到整个基因组序列。为了提高这一方法的效率,1980年代,测序和片断信息整合达到了自动化。这一方法虽然已被用于序列长达6百万个碱基对的细菌基因组测序,但对于人类基因组中3千万个碱基对的序列测定,这一技术能否成功在当时还未有定论。
基因的智慧财产权之争
塞雷拉基因组一开始宣称只寻求对200至300个基因的专利权保护,但随后又修改为寻求对“完全鉴定的重要结构”的总共100至300个靶基因进行知识产权保护。1999年,塞雷拉申请对6500个完整的或部分的人类基因进行初步专利保护;批评者认为这一举动将阻碍遗传学研究。此外,塞雷拉建立之初,同意与国际计划分享数据,但这一协定很快就因为塞雷拉拒绝将自己的测序数据存入可以*访问的公共数据库而破裂。虽然塞雷拉承诺根据1996年百慕达协定每季度发表他们的最新进展(国际计划则为每天),但不同于国际计划的是,他们不允许他人*发布或无偿使用他们的数据。
2000年,美国总统克林顿宣布所有人类基因组数据不允许专利保护,且必须对所有研究者公开,塞雷拉不得不决定将数据公开。这一事件也导致塞雷拉的股票价格一路下挫,并使倚重生物技术股的纳斯达克受到重挫;两天内,生物技术板块的市值损失了约500亿美元。
后人类基因组计划
后基因组计划就是人类完成人类基因组计划(结构基因组学)以后的若干领域,实际上是指完成顺序后的进一步计划,其实质内容就是生物信息学与功能基因组学。其核心问题是研究基因组多样性,遗传疾病产生的原因,基因表示调控的协调作用,以及蛋白质产物的功能。
人类基因组研究的目的不只是为了读出全部的DNA序列,更重要的是读懂每个基因的功能,每个基因与某种疾病的种种关系,真正对生命进行系统地科学解码,从此达到从根本上了解认识生命的起源、种间、个体间的差异的原因,疾病产生的得机制以及长寿、衰老等困扰着人类的最基本的生命现象目的。