|
第一讲:人类基因组计划 第二节 人类基因组研究的主要内容
遗传图谱(genetic map),又称连锁图(linkage map),是指基因或DNA标志在染色体上的相对位置与遗传距离。遗传距离通常由基因或DNA片断在染色体交换过程中分离的频率厘摩(cM )来表示。1厘摩表示每次减数分裂的重组频率为1%。厘摩值越高表明两点之间距离越远,厘摩值越低表示两点间距离越近。 通过遗传图谱,我们可以大致了解各个基因或DNA片断之间的相对距离与方向,如哪个基因更靠近着丝粒,那个更靠近端粒等。遗传距离是通过遗传连锁分析获得的,实用的DN厘摩A标志越多,越密集,所得到的遗传连锁图的分辨率就越高。遗传图谱不仅是现阶段定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段。 遗传图谱的绘制需要应用多态性标志。最早应用的标志是限制性酶切片段长厘摩多态性(RFLP)进行遗传图谱的绘制. 80年代后期,人们开始应用短串联重复序列(short tandem repeat, STR), 又称微卫星(microsatellite, MS)标志绘制图谱。1994年底,美、法完成了以RFLP及微卫星DNA为标志的遗传图谱. 图谱包含了5826位点,覆盖4000cM ,分辨率高达0.7cM.1996年法国报道了完全以微卫星DNA标志构建的遗传连锁图,包含2335位点,分辩率为1.6cM。 MS的出现不但使遗传图的精度得到了进一步提高,同时也成为物理图谱上的标志,从而促进了遗传图谱与物理图谱的整合。近年来,第三代的多态性标志,即单个核苷酸的多态性(singlenucleotide polymorphism, SNP)标志又被大量使用,其意义已超出了遗传作图的范围,而成为研究基因组多样性和识别、定位疾病相关基因的一种新手段。 最近发表的遗传图谱有GENETHON图和CEPH图,前者包括了5264个微卫星标志,后者含有7950个微卫星标志。这些大量地分布与人类整个基因组的遗传图谱使得个别实验室的研究者可以把他们自己的研究成果整合入全球范围的数据库中。 两个物理位置相距很近的基因或DNA片段可能具有较大的遗传距离 物理图谱(physical map)是指DNA序列上两点的实际距离,通常由DNA的限制酶片段或克隆的DNA片段有序排列而成。物理图谱反应的是DNA序列上两点之间的实际距离,而遗传图谱则反应这两点之间的连锁关系。在DNA交换频繁的区域,两个物理位置相距很近的基因或DNA片段可能具有较大的遗传距离, 而两个物理位置相距很远的基因或DNA片段则可能因该部位在遗传过程中很少发生交换而具有很近的遗传距离。
物理图谱是进行DNA分析和基因组织结构研究的基础。限制酶物理图还是基因组结构的重要特征,例如,每个基因都有特定的限制酶谱,每一条染色体,每一个个体的基因组都具有其特异的限制酶物理图。 根据物理图谱的原定目标,首先要获得分布于整个基因组的3万个序列标签位点(sequence tagged site, STS)。标签位点是指染色体定位明确,并且可用PCR扩增的单拷贝序列,每隔100kb距离就有一个标志。然后,在此基础上构建能够覆盖每条染色体的大片段DNA连续克隆系。 到1995年为止,已经完成了几张基因组水平的人类STS图,即由Genethon制作的包含5264个遗传标志的图谱、由Genethon和剑桥大学制作的含有850个STS的RH(radiation hybrid)图和麻省理工学院与Genethon制作的有15086个STS的整合YAC-RH图。另外,由法国人类多态性研究中心(CHPH)制作的225个YAC连续克隆群已可覆盖整个人类基因组的75%,该图上有2061个STS。这些图谱为进一步定位其它基因座位提供了详细的框架。 人类基因组计划最终将测定出人类基因组的全部序列。这种序列测定不同于以往那种只对某一个特定的感兴趣的区域进行DNA序列分析的工作。它要求一种更高效的规模测序,并将测出的每一个DNA片段按其染色体位置进行准确的排列, 从而得到人类基因组DNA序列碱基排列的全貌。这是一个很艰巨的任务,目前的DNA序列分析技术还不能完全满足这一任务的需要,有必要开发更新的序列分析技术和计算机信息处理系统。这些新技术和新系统的开发与研制也将成为人类基因组计划的一个重要组成部分。
确定每一个基因,研究它的结构、特性和功能是人类基因组计划的又一个重要内容。 通过对人类基因组全部DNA序列的测定, 可以利用计算机找出分布在DNA两条互补链上所有可能编码蛋白质的基因。其中有一部分是人类已了解的基因,但更多的是我们尚不完全了解的“基因框架”,我们称这些结构为可译框(ORF)。在DNA结构特征上ORF含有翻译的起始密码子、外显子及内含子的剪接信号、翻译终止信号和3'poly(A)加尾信号。根据中心法则,人们可以预测某种ORF编码的蛋白质的氨基酸序列,甚至这个蛋白质的空间结构及功能。应该指出的是,人类要真正破译所有的ORF的功能及其生物学意义还需要相当长的时间。目前的人类基因组研究只是为实现这一最终目标提供最基本的素材----DNA 序列以及基因的结构特征。 科学界早已在思索人类基因组序列和结构清楚后的下一步工作。 有人提出了“后基因组计划”(post-genome project)的构想。“后基因组计划”的研究内容就是对基因组的功能进行探索。还有人提出了“蛋白质组”(proteome)计划、“环境基因组学”(environmental genomics)、“癌肿基因组解剖学计划”(Cancer Genome Anatomy Project, CGAP)。总之,人类基因组计划的内涵和外延将不断地扩展。
|