评论

补齐最后一块基因拼图,人类Y染色体的完整序列首次公布

Y染色体是男人真正的根儿,因为它携带决定男性特征和用于生产精子的基因。

Y

性染色体

长57Mb,含66个编码基因。

性染色体Y是男性特有的染色体,常用于人类迁移路线分析、DNA-Y家系的犯罪排查。

性染色体Y长度只有性染色体X的38%,而研究表明性染色体Y正在逐渐缩小,但性染色体Y独特的“回文结构”能在一定程度上自我修复。科学家在Y染色体上发现了決定男性性状的SRY基因和多个与男性不育相关的基因。

由于Y染色体个头小,所携带基因量很少,而且充满了反向、重复的 DNA 片段,这使得测序工作十分困难,所以Y染色体一直是基因组学界面临的众所周知的挑战。现在,这个棘手的基因组区域终于被完全测序了

这一突破性成果最终带来了端到端的人类染色体序列,并为人类参考基因组增添了3000万个新碱基,其中大部分来自难以测序的卫星DNA。这些碱基揭示了41个额外的蛋白质编码基因,并为研究与生殖、进化和种群变化等有关问题提供了重要见解。

01

Y很奇怪

Y染色体决定男性性别,因为它携带一种名为SRY的基因,该基因指导胚胎内细胞脊发育成睾丸。胚胎睾丸会产生雄性激素,进而引导男婴男性特征的发育。

Y染色体为什么如此独特?故事要从进化讲起。

大量证据表明,1.5亿年前,X和Y只是一对普通染色体 (鸟类和鸭嘴兽仍然如此),彼此并无差异,父母各提供一条——就像常染色体那样。

后来,这对染色体上的SRY基因进化,定义了一种新的原始Y染色体 (proto-Y)。根据定义,这种原始Y染色体被永远限制于睾丸内,并且因大量细胞分裂和极少修复而发生一系列突变。

原始Y染色体迅速衰退,每百万年失去约10个活跃基因,数量从原来的1000个减少到目前的区区27个。它一端的一个“伪常染色体 (pseudoautosomal)”小区域保留了最初形式,与X染色体相同。关于这种衰退会否持续,学界仍有很大争论。

02

技术升级推动测序突破

人类基因组的第一份草图于1999年完成。自那以后,科学家们成功对所有常染色体以及X染色体进行了测序 (只留下少数缺漏)。

他们使用短读长测序 (short-read sequencing) 技术来实现目标,具体操作包括将DNA切割成大约一百个碱基的小片段,然后像拼图一样重新组装它们。

当然直到最近,新技术才有能力沿单个长DNA分子进行碱基测序,得到数千个碱基的长读片段。这些较长读段更容易区分,故而更容易组装。因此,科学家得以解析Y染色体上那些令人困惑的重复和环状结构。

03

完成Y染色体的测序

Y染色体的结构一直具有挑战性,因为一些DNA是以回文形式排列的 (即正向和反向序列相同),跨度长达100多万个碱基对。此外,Y染色体中有很大一部分是卫星DNA,这也是之前版本的Y染色体参考序列所缺少的。在Y染色体上,两段卫星DNA相互连接,进一步加大了测序的难度。

研究人员能够实现Y染色体的无间隙读取,主要得益于长读长测序技术的进步以及创新的计算组装方法,这些方法能够处理重复序列,并将测序的原始数据转化为可用的资源。这些新方法让研究团队能够解决Y染色体组装上的一些重大难题,比如精确地界定回文序列中反转发生的位置。

美国国家人类基因组研究所的科学家Arang Rhie谈到:“在之前的参考基因组中,Y染色体缺少的序列最多。每当我们试图开展任何分析时,总会发现我们遗漏了一半的Y染色体,这真是令人恼火。我很高兴我们能够整理出第一个完整的Y,看看我们究竟遗漏了什么,以及我们现在可以做什么。”他也是这篇论文的共同第一作者。

2018年,Miga及其同事发布了首个人类Y染色体着丝粒的完整图谱。2022年,T2T联盟又发布了首个完整测序的人类基因组 (包括所有常染色体和X染色体)。如今,在此基础上,他们又增加了3000万个碱基对。

04

推动新的科学研究

Y染色体通常出现在男性个体中,但也可能存在于其他人群中,比如双性人。虽然Y染色体上的基因相对较少,但却是复杂和动态的,它们编码了重要的功能,比如精子发生。完整的Y染色体参考序列将帮助科学家更好地研究人类基因组中这一部分的多个特征。

Y染色体结构复杂,其基因家族迅速进化。事实上,Y染色体是变化最快的人类染色体,这意味着两个健康人的Y染色体可能看起来完全不同——例如,一个人可能有40个基因拷贝,而另一个人只有19个拷贝。有了新的参考序列和成熟的Y染色体测序方法,人们如今能够更好地研究这种进化。这也许是未来体外受精或其他不孕不育症研究的重点

对研究人类种群进化和漂移的人来说,端到端的Y染色体序列也是一个很重要的资源。这是因为Y染色体是一组遗传物质代代相传,很少与外界发生重组,而人类常染色体和X染色体上的基因则不同,它们经常重组并彼此共享遗传物质。对Y染色体有了更清晰地了解,就可以更容易地追踪跨代遗传的基因,并了解基因的位置和内容如何随着时间而变化。

如今,在Y染色体参考序列中新增了3000万个碱基后,人们有望研究独特的Y染色体序列模式,比如两个卫星DNA的结构以及基因的位置和拷贝数。即使在Y染色体内,基因也被分成几个区域,这些区域在内容、结构和进化历史上都大不相同。了解Y染色体的变化速率以及如何解释这种变化,也是相当有趣的。

有研究表明,携带Y染色体的人随着年龄增长可能会失去部分或全部遗传物质,但科学家们还没有完全弄清这种情况发生的原因及其可能产生的影响。完整的Y染色体参考序列可能有助于解开这个谜团。研究与Y染色体有关的疾病也将变得更加容易,比如精子产生不足。

05

细菌基因组的污染

这篇论文的一个意外发现是,在过去的研究中,由于细菌DNA中的人类污染未完全去除,Y染色体DNA曾多次被误认为是细菌DNA。这一发现有望改善对细菌基因组的研究。

人类DNA有可能成为细菌样本中的污染物,因为细菌DNA通常是从人类皮肤上提取的。科学家们使用现有的人类基因组参考序列来确定哪些序列来自人类污染,并去除这些序列,只留下细菌DNA用于他们的研究。然而,由于过去的人类参考序列中缺失了Y染色体中的大部分序列,科学家们无法将其识别为人类,因此误认为是他们正在研究的细菌物种中的一部分。

这篇论文发现的证据表明,在一个公共数据库中,大约5000个细菌基因组可能含有与人类Y染色体序列相匹配的污染。研究这些细菌物种的团队可以使用更新的Y参考序列,将所有人类污染从他们的参考基因组中去除,并更清晰地了解细菌基因组。

“这是一件令人惊讶的事情,”Rhie谈道,“人们一直在猜测,但直到现在才能证明这种情况真的在发生。”

06

Y染色体的泛基因组研究

虽然完整的人类Y染色体将为许多新发现打开大门,但研究人员计划将Y染色体纳入未来版本的人类泛基因组,以便进一步改进对该区域的研究。泛基因组是基因组学的一个新参考,它结合了不同祖先背景的多个人的基因组信息,最终有望实现更公平地研究和临床探索,如诊断疾病、预测医疗结果和指导治疗。

研究人员计划与人类泛基因组参考联盟合作,将完整的Y染色体序列整合到个体基因组中。这将有助于科学家了解不同祖先背景的人群的Y染色体是如何变化的,并为了解Y染色体在人类多样性中的作用提供一个更好的参考点。他们还希望与世界各地的科学家合作,让其他人也能完成Y染色体测序。

虽然科学家研究Y染色体在生物学中迈出了重要一步,但是关于染色体的探索仍在继续。

我们大多数人都有23对染色体,包括22对常染色体和1对性染色体。每条染色体都是遗传信息的载体,也都身怀绝技、各显神通。华大基因更是把它们的奇妙物语做成了原创染色体家族扑克牌,寓教于乐,温故知新。点击“阅读原文”,马上购买!

来源:华大医学

点击加入基因俱乐部 成就行业精英

目前已有600+行业精英加入基因俱乐部

已发布各类基因科技行业报告2300多份返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读