第一讲:人类基因组计划

第三节 人类基因组研究的策略

   一、人类基因组研究的基本思路

   1、“Tackle all the chromosome at once”

   2、大片段外源DNA克隆体系

   3.构建重叠度最低的连续克隆系

   二、确定特定的基因

   1、通过DNA全序列分析确定基因

   2、功能克隆

   3、定位克隆

   4、鉴定基因

   三、利用染色体特征研究人类基因组

   1、杂交细胞系与染色缺失谱

   2、染色体核型

   3、染色体显微切割

   4、染色体荧光原位杂交

 

 一、人类基因组研究的基本思路

 1、“Tackle all the chromosome at once”

  (1)建立插入人类基因组片段的酵母人工染色体(yeast artificial chromosome, YAC)克隆群。

  (2)利用高频分布,易于检索的DNA标志或者DNA指纹图谱建立克隆之间的联系,组成有序排列的连续克隆系,最常使用的DNA标志有专一序列位点(sequence ragged site,STS)和表达的序列标签(expressed sequence tag,EST)。

  (3)将克隆群定位于染色体的不同区域,构成完全基因组物理图谱。

  (4)进行次级克隆,序列分析。

  2、大片段外源DNA克隆体系

  (1)酵母人工染色体克隆体系(YAC)

  这种克隆体系是八十年代末发展起来的,并于1990年底渐趋完善的大片段外源DNA克隆体系。插入YAC载体的外源DNA片段可达200-1 000kb甚至更多,并能稳定复制。现在YAC已成为构建复杂基因组的有力手段。

  (2)粘粒克隆,P1噬菌体和细菌人工染色体

  粘粒克隆的出现早于YAC,其主要特点是插入的外源片段比λ噬菌体克隆大一倍。因此在筛选基因文库是可以减少一半工作量。P1噬菌体的溶源状态奇特,不整合到宿主的染色体上,像质粒一样作为一个自主复制单位游离于宿主染色体以外。可以用于克隆75�110kb的外源DNA片段。电穿孔技术的发展为提高大质粒的转化效率创造了条件,已经可以构建和转化几十到几百kb的细菌人工染色体克隆(BAC)。

  3.构建重叠度最低的连续克隆系

  构建能覆盖每条人类染色体而重叠度又最小的连续克隆系,是进行 大规模基因组DNA 测序的基本条件。由于这一做法很花时间,当测序中心将大规模测序计划上升至每年75Mb 或更多时,连续克隆系的构建速度可能跟不上测序产出的速度。1996年,有人提议对高覆盖率的 BAC文库的克隆进行末端测序,形成顺序标签接头(sequence tagged connector, STC),利用STC与克隆间的对应关系,可以在计算机上快速地发现局部连续克隆系。目前,这一工作方案已开始实施。

  二、确定特定的基因

    1、通过DNA全序列分析确定基因

  人类基因组分析的一个重要内容是确定所有的单基因,通过研究单基因的结构、特性和功能,达到了解这些基因同人类健康、疾病和发育的内在关系。

  当人们完成了全部DNA测序工作后, 可以利用计算机分析,找出分布在DNA两条互补链上的所有可能的可译框 (ORF)。例如, 对酵母第3号染色体DNA全序列分析发现了182ORF,其中31个是已知存在于该染色体的基因, 29个与数据库中已知基因同源,然而发现了120多个ORF是“孤儿基因”。“孤儿基因”是指根据已有知识,还未了解其功能和生物学意义的基因。只有通过对基因组全序列的测定,才能真正准确地定位每一个基因。

  那么,如何来判定“孤儿基因”的功能呢?可以通过以下几个途径:

  (1)将“孤儿基因”的DNA序列与body map 中的数据进行比较,了解其是否表达以及表达的时空特异性,并根据这些提示去研究它的功能。

  (2)根据该基因编码蛋白质的氨基酸序列,分析其功能结构域及可能的空间结构, 再结合染色体定位,研究与同样定位在该染色体区带上的遗传性状或疾病的联系,确定其功能。

  (3)在实验动物中寻找它的同源基因,进行基因“敲除”,观察实验动物的生物学改变,以了解该基因的功能。

  2、功能克隆

  功能克隆是人类第一个基因克隆的策略。事实上不可能等到人类基因组DNA全部序列都测出之后,再去逐一了解每个基因的结构和功能,在实际研究中人们认识了一个基因,知道了它的功能之后,才去分离并测定其结构的。进行这一工作的步骤是:

  (1)根据已知的生化缺陷特征确认与该功能有关的蛋白;

  (2)分离纯化这一蛋白并测定出部分氨基酸顺序;

  (3)根据遗传密码推测其可能的mRNA 序列;

  (4)设计相应的核苷酸探针,杂交筛选cDNA或基因组DNA 文库,最终获得整个编码区乃至全基因序列。

  3、定位克隆

  由于许多基因遗传病的基因位点已经有了精确的染色体定位和相应的DNA标记,所以可以用定位克隆的策略分离这些基因。杜兴肌营养不良、慢性肉芽肿、亨廷顿氏舞蹈症等几十个基因的克隆分离就依靠此种方法。

  (1)通过染色体缺失或平衡易位以及连锁分析,确定该基因在染色体上的位置,并将这个位置精确到2 000kb左右的范围内。

  (2)利用距离该基因最近的DNA标志,筛选YAC库,采用染色体步移技术获得覆盖这个基因位点的一组连续的YAC 克隆。

  (3)在这个DNA区域内巡找基因,可采用筛选cDNA文库、外显子捕获(exon trapping)、物理捕获(physical trapping)等方法确定该区域内表达序列的手段和寻找保守序列,寻找基因。

  4、鉴定基因

  首先通过对某个基因编码蛋白质的氨基酸序列分析,确定它属于哪一类的蛋白, 可能具有哪些功能。如果是一个遗传病基因, 应分析患者群体中该基因是否存在DNA突变,以及这些突变是否存在规律性。DNA突变包括:无义突变、移码突变及剪接信号位点上的改变等。对于由点突变导致的氨基酸改变,应该验证这一突变是否也存在于其它病例中,以及同一家族或同一地区的正常人群中是否也存在相同的改变。 还可以进行突变体体外功能实验和基因敲除动物检验来鉴定这个基因。如果经过一系列的检验, 证实这个基因并非是你所要克隆的基因,那么一切工作又要从头开始。 所以,要达到鉴定一个基因的目的,常常需要许多科学家的协同攻关。比如,亨廷顿舞蹈病基因的克隆,就是在一个由国际上多个高水平研究小组组成的团体的共同努力下完成的。

  目前许多人体新基因及其功能被发现和研究,如:与智力发育相关的IGF2R基因;12号染色体上的TBX5 基因,其变异可导致携带者患候特氏症,这是一种罕见的发育缺陷症,可导致心脏和上肢畸形.美国科学家通过对8个有青光眼病史家族中百名患者的基因分析,确定引发青光眼的直接原因是TIGR基因发生了变异.迄今分离出的人体新基因还有结节状硬化症基因TSC1、新生儿癫痫病基因KCNQ2、胆固醇病基因NPC1、秃发基因、耳聋基因及与溃疡病有关的基因、反应迟缓基因等.与白血病、艾滋病及克雅氏症有关的基因也在进一步研究中.人体新基因的研究将了解各种遗传病、癌症、心血管病及神经和精神病的发病机制,提供诊断和防治途径,有助于从人类基因组中去除有害基因,从根本上治疗这些疾病。

  三、利用染色体特征研究人类基因组

  染色体的结构和功能特征,如核型、特殊带型、着丝点、复制起点、端粒序列、CpG岛、重复序列等对基因组作图、基因定位和克隆基因都是非常有用的。人们常常是结合染色体的结构和功能特征,采用不同的手段进行人类基因组研究。

  1、杂交细胞系与染色缺失谱

  杂交细胞系(somatic cell hybrid mapping panel, SCH)是由分别含有一条人1~22号和X、Y染色体的人、鼠杂交细胞株系构成的杂交细胞谱。将cDNA或DNA片段与SCH谱DNA杂交,即可将基因进行染色体定位。由同一染色体不同缺失与重排的杂交细胞株构成的染色体缺失谱还可对基因进行染色体区域定位。

  由于自然发生的染色体缺失与重排数量有限,近来又建立了RH谱(radiation hybrid map),或称IFGT(irradiation fusion gene transfer hybrids). 分析时,首先用大剂量r射线照射含单条人染色体的杂交细胞株,使染色体断裂成数百kb左右的片段, 然后与鼠的细胞融合,筛选出一系列含人某一条染色体不同片段的杂交细胞,最后经过筛选、排序就可以将该染色体精细划分,用RH谱进行基因的精细定位。

    2、染色体核型

      经研究发现,人染色体核型的R带GC含量高,复制早,与之结合的组蛋白乙酰化程度高,R带上基因密度高,CpG岛数目多,短基因间重复系列多,在肿瘤的X射线照射时,基因交换的频率高。而G带的AT含量高,复制早,与之结合的组蛋白乙酰化程度低,G带上基因密度低, CpG岛少, 长的基因间重复系列多, 基因交换频率低。

  3、染色体显微切割

      在显微镜下切割特定的染色体区带, 经PCR扩增, 重组,制备染色体区带特异的探针。这些探针用于筛选、分离染色体区带特异的粘粒或酵母人工染色体克隆, 建立连续克隆系与高分辨物理图谱。还可以用这些探针筛选cDNA文库,分离与该染色体区有关的表达基因的系列。

    4、染色体荧光原位杂交

      染色体荧光原位杂交(fluorescence in situ hybridization, FISH)可以用于cDNA或DNA片段的定位,以及研究几个DNA片段或基因之间的相对位置与方向。由FISH发展而来的DNA荧光原位杂交是采用不同颜色荧光标记的探针与散成长环状的DNA杂交,形似日晕,称为halos。这种技术可以区分和定向相距5kb的两个DNA片段。