10年努力只为回答: |
基因是如何被调节的? |
图片来源:基因型—组织表达项目
15项研究讲述了科学家10年的努力。
这个名为基因型—组织表达(GTEx)的项目,致力于解释大规模遗传研究中发现的DNA变异如何影响性状和疾病。研究人员用长达10年的时间,将人类2万个编码蛋白质的基因的活性水平与数百万条调控DNA序列的变异联系起来。
瑞士日内瓦大学遗传学家、项目团队成员Emmanouil Dermitzakis说,这项耗资1.5亿美元的项目研究了数百名最近去世的人的50多种组织,在近日发表在《科学》《科学进展》《细胞》等期刊的论文中,GTEx项目研究人员介绍了对这些数据的最终分析。
这些论文构成了迄今为止影响基因表达变异的最全目录。它们还强调了用于理解基因是人类组织调控因素的细胞类型的重要性,并为连接基因变异与人类特征和疾病之间的功能点提供了丰富的资源。
德国海德堡欧洲分子生物学实验室(EMBL)人类遗传学家Jan Korbel说,对于任何对特定疾病感兴趣或研究组织及细胞类型的人来说,“这些资源是无价的”。
900名捐赠者 50种组织
大约20年前,当人类基因组被测序时,许多研究人员相信,他们能够迅速找到导致糖尿病或精神分裂症等复杂疾病的基因。但很快,他们就止步不前了,部分原因是忽视了控制基因在体内表达位置和方式的系统。例如,正是这种调控使肿瘤有别于健康组织。
基于此,美国国立卫生研究院于2010年启动了GTEx项目,用于识别和绘制数量性状位点(QTLs),即基因组特定位置的遗传变异与多种组织内基因表达之间的关联。
《中国科学报》从博德研究所获悉,研究人员已经将绝大多数通过全基因组关联研究发现的遗传变异映射到基因组的非编码DNA区域。全基因组关联研究旨在扫描基因组,以确定其与特征或疾病有关的变异。研究结果显示,这些变异是通过影响基因的表达起作用的,而不是通过改变它们所编码的蛋白质。
为阐明这些关系,研究人员提取了约900名承诺捐献器官或组织的死者的50多种组织样本,以便识别尽可能多的基因QTLs ,并确定它们的作用是否在多种组织或细胞类型之间共享。
研究人员对每个样本进行了描述,然后对所有组织进行成像和冷冻,以备将来分析。他们破译基因组并量化RNA,以测量样本基因活性。除了比较个人的组织外,他们还比较不同个体的相同组织。
这些组织让研究人员确信,肌肉和胰腺之间的基因表达差异是真实且有意义的。GTEx成员、西北大学遗传学家Barbara Stranger说,“这是我们第一次有了这种同质样本集合,以便获得组织之间的生物学差异。”
“GTEx项目试图在尽可能多的个体中绘制基因调控的基础,即基因变化可能如何影响基因表达或蛋白质产生的方式。”该项目成员、博德研究所Kristin Ardlie说。
刊登于《科学》的旗舰论文详细介绍了GTEx项目的结果,这些工作帮助揭示了基因表达的巨大复杂性。
博德研究所计算生物学家 Fran?觭ois Aguet、Ardlie及同事,对涉及23000多个基因表达的QTLs进行了编目,其中包括直接影响基因表达(eQTLs)或基因内剪接(sQTLs)的变异。Ardlie说,如今在分析了近2万份样本后,GTEx项目“让我们可以获得更清晰的见解”。
一对多 有关联
数据证实,几乎每一个人类基因都受到至少一个eQTLs的调控,其中许多eQTLs以多个基因为靶点,可能影响多种性状。研究人员还揭示了QTLs效应在性别和群体间的差异。这些发现表明,QTLs可能经常影响细胞转录因子如何在启动子或增强子上与基因组结合,进而影响基因的表达。
“从某种意义上说,QTLs就像一个调节表情的拨号盘,可以上下调节。一个QTL可能会增加表达,但另一个QTL可能会稍微降低表达。这一切都增加了变异调节基因表达的复杂性。”Aguet告诉记者。
Stranger团队发现了另一个重要结果:几乎每一个组织,包括皮肤和心脏,在男性和女性之间的基因表达都有差异。“绝大多数的生理特征是男性和女性共有的。”Stranger说,但是这种表达上的差异可能有助于解释为什么男女有不同的疾病模式或药物反应。
“在更大的样品量下,我们看到每个基因不止有一种调控作用,而且这些不同不仅是组织,而且是细胞类型。我们可以开始绘制高分辨率的变异。”Ardlie告诉《中国科学报》,“我们可以将全基因组关联研究(GWAS)信号与QTLs联系起来,看看那些看起来是随机的GWAS点是否实际上属于影响基因调节、复杂特征和疾病表型的功能元素。”
而加州大学圣迭戈分校的Kelly Frazer已经着手进行了这类分析。在GWAS中,大量的团体检查了数千名患有某种疾病或特征的患者的基因组,并注意到数百个细微的基因变化。但是,研究人员通常不知道这些疑点中哪一个引发了这种疾病。
例如,Frazer想知道一种被称为NKX2-5的心脏特异性转录因子是如何影响这些特性的。她的团队已经识别出数千种可能影响NKX2-5活性从而改变心律的DNA变异。
Frazer实验室的Paola Benaglio分析并比较了这些DNA变异、GWAS数据和GTEx数据,以确定到底是哪些DNA变异调控了NKX2-5的活性。她首先将候选QTLs缩小到55个,然后缩小到9个,最后,利用GWAS的心脏节律数据和其他工具锁定了目标。接着,她使用基因组编辑器CRISPR阻断了那个DNA碱基,并证实它改变了NKX2-5的结合。
“不是轻而易举的事”
每个月有16000人访问GTEx门户网站,2018年,有900篇论文引用了该项目。
“GTEx项目是一项雄心勃勃、复杂的事业,从个体身上获取这种广度的组织仍然非常困难。从这个意义上说,GTEx项目是独一无二的,它为像人类细胞图谱这样的研究铺平了道路。”项目成员、纽约基因组中心的Tuuli Lappalainen告诉记者,“但我们也需要像ENCODE这样的大规模资源,以便收集互补信息,从而获得驱动生物学的分子机制的更完整图像。”
但也有研究人员警告说,eQLTs和基因之间可能会出现虚假的关联。通过GTEx锁定致病变异“不是轻而易举的事”。
休斯敦大学进化生物学家Dan Graur也认为,这些论文“是在打官腔”,公布的结果很难解读。和其他批评人士一样,他也指出,这个85%捐赠者是白人的项目严重缺乏多样性,因此会忽略其他群体的基因变异。
GTEx目前还不能确定导致心脏病和肾衰竭等疾病的基因序列,也不能追踪基因调控层是如何协同工作的。“我们不能说基因表达问题已经全部解决了。”EMBL副主任、基因组学家Ewan Birney说。
“QTL分析仅提供了一个透镜,通过它来观察遗传变异的功能含义;一个补充表观基因组、蛋白质组和其他形式的基因组和转录分析的工具。”Ardlie说。