非曹参后人本报首席彩世界,Y染色体与姓氏宗族

2019-09-18 18:58栏目:新闻资讯
TAG:

人们的姓氏大多继承自父亲,而Y染色体是严格的父子相传的基因组片段。所以姓氏与Y染色体的遗传应该是平行的,有共同姓氏的男性应有相同或相近的Y染色体类型。然而,多起源、改姓、非亲生、从母姓等社会因素弱化了某些姓氏与Y染色体的关联,此时家谱研究可为厘清父系血缘提供线索。

彩世界 1

Y染色体上稳定的SNP突变可以永远在父系后代中流传,可以构建可靠的父系基因谱系;而其上突变较快的STR位点又可以用以估算时间。因此,Y染色体可用以研究很多姓氏宗族的历史,甚至千百年前的历史疑案。姓氏、家谱和Y染色体的研究必将成为历史人类学研究的重要内容。

复旦大学研究组做出的“曹操的基因”图示。

姓氏与Y染色体的

2009年,河南省安阳市对外宣称发现曹操墓,引起轰动和争议。随后,复旦大学人类遗传学实验室宣布,拟用DNA技术研究曹操家族DNA。

父系遗传

经过两年多研究,复旦课题组已基本确认,曹操家族DNA的Y染色体SNP突变类型为O2*-M268,由此推断出曹操父亲并非过去所流传的夏侯氏的后人,更不是西汉第二任相国曹参的后人,而很可能是当时权倾朝野的宦官之首曹腾在自己家族内部过继的。曹腾为了凸显自己身世,才编造出自己是曹参后人的说法。

姓氏最早在中国产生,其历史可追溯到5000年前,主要来源于远古时代各种图腾和地名,“氏”为“姓”的分支,“姓”以别婚姻,“氏”以分贵贱。秦汉以后,姓氏合一,数量大增。据最新统计,拥有13亿人口的中国目前有4100个姓氏。

一颗牙齿确定曹操身世

尽管根据现代曹姓后人的基因,复旦大学课题组成功反推出曹操家族DNA,但并不能百分之百地确定曹操的身世。直到此次,科学家又将曹操祖辈的DNA与曹操后人DNA进行对比,才100%地确定了曹操的身世。

2011年,复旦大学历史系教授、中国魏晋南北朝史学会副会长韩昇、复旦大学现代人类学教育部重点实验室李辉教授来到曹氏宗族墓所在地—安徽亳州。在当地文物主管部门的积极配合下,课题组专家在库房内找到两颗牙齿—均是上世纪70年代从曹氏宗族墓“元宝坑一号墓”中出土的。

结合曹氏宗族墓考古挖掘领队李灿和现场挖掘人的口述,以及“元宝坑一号墓”墓室内中央位置的墓砖铭文“河间明府”,课题组最终确定两个牙齿均来源于曹操叔祖父河间相曹鼎。曹鼎和曹腾是兄弟关系,这在《后汉书》中有明确记载:“又劾奏河间相曹鼎臧罪千万。鼎者,中常侍腾之弟也。”

课题组带回一颗保存较好的牙齿,回到复旦大学现代人类学教育部重点实验室,课题组严谨提取牙齿中的古DNA,经过一个月一次、反复6次的测试,最终确认该牙齿中的古DNA中Y染色体SNP突变类型就是之前找到的O2*-M268。

2012年底,根据现代基因和古DNA的双重验证,复旦课题组最终100%确定了曹操家族的DNA:家谱记载为曹操直系后代的现代8个独立家族中,有6个家族的Y染色体为少见的O2*-M268,这证明曹操Y染色体是该类型,安徽亳州的曹操祖辈墓葬“元宝坑一号墓”的遗骨也属于此类型,但夏侯氏、曹参后人都不是该类型。

姓氏最早用于遗传研究是在1875年,乔治·达尔文通过分析堂(表)婚得出了英国同姓通婚率和不同阶层的堂(表)近亲通婚率。由于居民出生、结婚和死亡等大量相关数据的易得性,姓氏分布与同姓率被广泛用于研究群体遗传结构、迁徙率等。此外,姓氏还在流行病学方面得到了应用。

4年寻踪曹操家族DNA

人类DNA共有30亿个碱基对组合成23对染色体和线粒体,男性独有的、碱基对较稳定的Y染色体是最合适的检测对象。

要确认曹操的DNA,最重要的是锁定曹操DNA特性。首先,李辉需要可靠的样本制出一幅遗传图谱,看看曹姓来源于多少个祖先。2009年,复旦大学征集曹操后人,在全国采集了79个曹姓家族的280名男性和446个包括夏侯、操等姓氏男性志愿者的静脉血样本,最终样本超过1000例。

与此同时,韩昇对上图馆藏家谱、民间家谱等历史文献搜集分析,对各地258个曹姓家谱做梳理,并与史书和地方志参照,寻找曹氏迁徙的线索。由此,课题组筛选出8个有家谱、经过史料分析具有一定可信性的曹氏族群。

然后,经过复杂的Y染色体DNA全序列检测,课题组最终发现其中6个家族属于O2*-M268的基因类型,这6支样本的祖先交汇点在1800年至2000年前,正是曹操生活的年代。

这些家族的血样中,共同检出了一个非常罕见的染色体类型,比例在全国人口只占到5%左右。假定他们都是仿冒的,那么巧合概率就只有千万分之三。因此,在法医学上就可以认定,他们是真实的曹操后代。

在这次曹操家族DNA的研究中,课题组还用同样方法验证了汉代丞相曹参的家族基因。它与曹操家族的基因没有关系,从而证明曹操是曹参后人的说法有误;其次,民间传说操姓是曹操后代避祸改姓而来,经过基因验证,这两个姓氏之间也没有明确的遗传关系;另外,研究还表明现有的夏侯氏基因与曹操家族基因也不一致,因此曹操从夏侯氏抱养的说法也不准确。

据了解,目前通过DNA鉴定,共找到了9支曹操的后人,分别来自安徽绩溪、安徽舒城、安徽亳州、江苏海门、广东徐闻、江苏盐城、山东乳山、辽宁东港、辽宁铁岭。

虽然姓氏在宏观上被用于分析群体遗传结构,但是姓氏并不完全遵从父系遗传。就中国的社会情况而言,收养、继养、入赘,甚至直接改姓,都会影响姓氏与父系血统的关联程度。另一方面,中国大多数姓氏起源于春秋时期的各个封国,当封国内的百姓都以国为姓的时候,这些同国百姓的血统可能本来就不一致。这就造成了很多比较大的姓氏内部遗传结构不一致。

历史学与人类学结合生成新学科

此次复旦大学课题组对曹操后代的追寻,第一次从基因层面验证了许多同姓人群在千百年前确实是一家。而生命科学和历史学的跨学科合作,也将有助于更多历史谜团的揭开。

在这次研究中,人类学介入到历史文化的研究中,并发挥了举足轻重的作用。韩昇称,“我们可以通过今人的基因情况,往前追溯许多历史名人、历史家族、历史民族。这可以进行中国古代家族史的研究,还可以发现中华民族自古以来的形成过程。这一研究手段甚至还可以用于世界史的"重写"。”

与姓氏不同,人类的Y染色体直接代表着父系遗传,永远是父子相传的,不会受到任何社会文化和自然因素的影响。人体内有23对染色体,其中22对常染色体中,每一对性染色体都有一条来自父系,一条来自母系,两条染色体在传代过程中对应的部分会发生交换,从而造成混血的效应,就是遗传学上说的重组。另一对性染色体包括X染色体和Y染色体。在女性体内,X染色体也是成对的,分别来自父母双方,所以也不能避免混血的影响。而在男性体内,却只有一条来自母亲的X染色体和一条来自父亲的Y染色体。当一名男子有了儿子,他的X染色体不会传给儿子,只有Y染色体会传给儿子。所以人体性染色体的遗传方式决定了Y染色体遵从严格的父系遗传(见图)。

彩世界 2

人类Y染色体DNA大约包含6000万个碱基对,其中染色体两端的5%为拟常染色体区域,在传代过程中与X染色体相应区段会发生重组,而主干部分的95%为非重组区域,不与任何染色体发生重组。所以,Y染色体主干部分的此特性,保证了子代能完整地继承父代的Y染色体主干而不受混血影响,保证了Y染色体主干的严格父系遗传。

所以,当姓氏已经无法作为追寻祖先的可靠标记的时候,以现代的分子生物学技术为基础,研究Y染色体主干的类型分布,是直接追溯群体或者家族的父系起源的最佳方法,是验证祖先与后代的父系关联的唯一手段。实际上,在一段有较可信历史记录的时期内,整个家族的姓氏与父系遗传的关联是可以保证的,所以家族的姓氏往往与固定的Y染色体类型共同传递,紧密关联。

Y染色体在稳定中突变

在一代一代的父子相承的传递过程中,Y染色体也在慢慢地积累着变化。正是因为遗传突变的积累,使得人类父系遗传体系中,距离越远的个体的Y染色体差异也越大。Y染色体上的突变形成的个体差异主要有两大类,单核苷酸多态(SNP)和短串联重复(STR)。DNA分子由四种碱基(A、T、C、G)按照一定的顺序连接而成,SNP是仅仅一个位置上的碱基类型变化。Y染色体上的同一个SNP在人群中一般只有两种类型。STR则是在染色体的特定区段,由几个碱基组成一个单位重复出现,不同的Y染色体上的同一个STR位置往往有不同的重复拷贝数。SNP和STR由于突变性质和突变速度不同,在分析中有着不同用途。

要确立父系遗传体系,最重要的前提是祖先的突变可以稳定地保留在后代的Y染色体上。SNP突变因为突变速率极低,可以做到在后代中永久地保留,后代只能在祖先的突变基础上积累新的突变,而不会丢失祖先的突变特征。通过比较人类与黑猩猩的Y染色体差异,以及大家系中的Y染色体的差异程度,Y染色体上的SNP突变的速率被计算了出来。每出生一个男子,一个染色体位置上发生SNP突变的概率大约为3000万分之一。

实际上由于Y常染区的保守性,以及人类历史上大量男子都没有男性后代保留至今的事实,实际的群体中突变率应该低几个数量级。而我们通常研究的是Y染色体非重组区大约3000万个碱基对的常染色质区,按照每个碱基对3000万分之一的突变率,这个区段内每个男子平均都会有一个新的突变。这个新的突变随机地出现在Y常染区的任意一个点上,如果这个突变了的点上再发生一次突变,那么这个突变就在后代中丢失了,我们就无法通过后代确定祖先的Y染色体突变谱。但是突变点上重复发生一次突变的概率,按照概率计算方法就是3000万分之一的平方,也就是900万亿分之一,相对于人类自古以来的人口,这个概率就近似于零。所以我们可以说,祖先的Y染色体上出现的SNP突变特征在后代中肯定能够找到,而后代只能在祖先Y染色体突变谱的基础上增加新的突变。

由多个SNP突变构成的一种突变谱被称为一种单倍型。单倍型有祖先型和后代型之分。祖先型与所有后代型合称为一个单倍群。一个家族的所有Y染色体理论上都属于一个单倍群,因为其中所有的男性都应该来自同一个祖先。

单倍群的概念可大可小。大而言之,全世界的Y染色体都属于一种单倍群,都来自20多万年前的一个东非晚期智人男子。进而,全世界又可以分为20种主干单倍群,编号从A到T。最古老的A和B单倍群都没有走出非洲,C和D单倍群最早来到了澳洲和亚洲,E单倍群来到了亚洲又回到非洲,F单倍群衍生出G、H、I、J等单倍群在西方形成欧罗巴人种,衍生出K单倍群并形成N、O、P、Q等单倍群在东方形成蒙古人种,其中O单倍群成为了中国人的主流,而Q单倍群成为美洲印第安人的主流。所以Y染色体的谱系构建出了全人类的一部大家谱。

利用Y染色体上稳定遗传的SNP,我们可以构建出个体或家族之间明确的遗传渊源。而且,既然SNP有稳定的突变速率,当我们统计出不同人的Y染色体之间的突变差异数,将差异数除以速率,经过换算就可以估算两条Y染色体之间的分化时间。

但是,由于SNP的突变速率实在太低,个体之间的突变差异散布在Y染色体的各处,只能使用Y染色体全测序来寻找,而目前全测序的成本太高,不可能普遍应用。这一缺点被Y染色体上的另一遗传标记STR弥补了。一些STR位点分布在Y染色体上的固定位置,每一个STR位点内部的重复单位在传代过程中改变着拷贝数,这种改变也是有着固定速率的,STR的突变率高于SNP10万倍。因此STR位点成为了Y染色体上的“时钟”。

姓氏与Y染色体关联的

实践分析

在实际应用中,姓氏与Y染色体是否具有基本相同的和平行的表现还要看姓氏传递是否连续和稳定。多项研究证实各国的姓氏传承是相对稳定的。对于中国的姓氏与Y染色体的相关性,也有许多研究见诸报道。

汉族大姓氏内部的不一致,有很多可能的原因。在理想的情形下,每种姓氏都有一个唯一来源,即该姓氏的奠基者只是一人或是有相同Y染色体单倍型的多人,在姓氏传承过程中没有发生过干扰(改姓、非亲生等),此时一种姓氏可以被一种SNP和STR的单倍型来鉴定。

在中国,姓氏有近5000年的历史,来源复杂,且存在避祸改姓、避讳改姓、过继改姓、皇帝赐姓与贬姓、少数民族用汉姓等等问题。如此,研究中国的姓氏难度极大,但是中国编修家谱的传统对厘清这纷繁复杂的血缘关系有很大帮助。

家谱是一种以表谱形式记载某一同宗共祖以血缘关系为主体的家族世系繁衍兼及其他方面情况的特殊图书体裁。也就是说,入谱者必须是同宗共祖,即使同姓,若不同祖,也不能修入一部家谱之中。在中国的广大农村,人们一直有着同姓聚居的习俗,加上婚姻半径较小,由家谱确定的某一地域内同姓人群,可以认为是有相同或相近Y染色体的父系隔离群体,这也就为分子人类学分析Y染色体DNA多样性提供了极好的研究模型。然而,某些家谱里有假托、借抄的内容,因此对于家谱资料的应用必须审慎。但是在Y染色体检验这种无可辩驳的科学证据面前,任何家谱都可以得到检验和修正。姓氏、家谱和Y染色体的关联研究,必然成为研究中国人起源与演变的重要方式,开创历史人类学研究的新篇章。

(王传超、李辉:复旦大学现代人类学教育部重点实验室。严实:复旦大学现代人类学教育部重点实验室、中科院上海生科院计算生物学所)

《科学时报》 (2010-5-12 A2 要闻)

版权声明:本文由彩世界发布于新闻资讯,转载请注明出处:非曹参后人本报首席彩世界,Y染色体与姓氏宗族