摘要:我国龙胆科植物大多分布于青藏高原,具有重要的药用价值。龙胆科植物基因组长度~kb;常具有蛋白质编码基因67~80个、tRNA基因30个、rRNA基因4个;系统发育树的拓扑结构与传统分类学观点基本一致;叶绿体基因组序列具有属、组间的分辨率。基于目前文献报道的龙胆科5属(龙胆属Gentiana、獐牙菜属Swertia、花锚属Halenia、睡菜属Menyanthes及莕菜属Nymphoides)27个分类群的叶绿体全基因组序列,应用相关软件比较分析其结构特征,以夹竹桃科(Apocynaceae)植物Pentalinonluteum叶绿体全基因组序列为外类群,以贝叶斯法构建系统发育树,深入分析系统发育关系,评价其物种鉴定意义,可为该科物种资源保护、遗传背景分析及中藏药生药学研究等提供参考资料。

龙胆科(Gentianaceae)隶属于双子叶植物纲捩花目(Contortae)[1],约80属种,广泛分布于世界各地。其中第一大属为龙胆属Gentiana(Tourn.)L.,约种;第二大属为獐牙菜属SwertiaL.,约种,两者种数占全科近81%。我国龙胆科植物有22属多种,大多分布于西南高山地区。其中龙胆属约种,隶属于11组(section)23系(series),獐牙菜属约80种,隶属于7组7系[2]。

龙胆科植物具有重要的药用价值,如常用中藏药材秦艽、龙胆、解吉()[3]、邦见()及冈嘎穹()来源于龙胆属;当药、青叶胆、巴莴色保()[4]及桑蒂()等来源于獐牙菜属;还包括来源于扁蕾属GentianopsisMa、花锚属HaleniaBorkh.及肋柱花属LomatogoniumA.Br.等的藏药吉合蒂()[5]等。

我国青藏高原是世界龙胆科植物分布中心之一,深入探讨其各类群的生物学特性、物种形成机制及系统发育关系,可为持续利用有限的高山药用植物资源,进一步整理中藏药材品种,构建快速、准确的物种DNA条形码等具重要的科学意义。当务之急是深入开展种质资源调查、物种遗传多样性分析等基础性工作。

叶绿体是质体的一种,普遍存在于植物中,是细胞内具有自主遗传信息的重要细胞器,以母性遗传为主。自年烟草NicotianatabacumL.[6]和地钱MarchantiapolymorphaL.[7]的叶绿体全基因组序列首次发表以来,叶绿体的基因结构特征及其系统学意义也逐渐被人们熟知。

被子植物叶绿体基因组结构常为双链环状,由4部分组成:大单拷贝区(LSC)、小单拷贝区(SSC)、2个反向重复区(IRa、IRb编码相同,方向相反,是叶绿体基因组进化过程中延展或缩小的区域,也是叶绿体基因组大小差异的主要原因)[8]。叶绿体基因组的大小、结构和基因种类一般较为保守[9-10],基因组长度在~kb[11]。叶绿体基因组共编码~个基因,其中蛋白质编码基因70~88个,tRNA基因30~32个,rRNA基因4个[12-13]。同时,由于叶绿体基因组结构、长度和基因种类的保守性[14-15],其编码区和非编码区进化速率与模式具有物种鉴别意义[16],现已广泛应用于遗传多样性分析,物种DNA分子鉴定,分子系统发育研究及药用植物遗传转化、分子育种等叶绿体基因工程方面[17-18]。

本文基于现有文献中的龙胆科5属(龙胆属、獐牙菜属、花锚属、睡菜属Menyanthes(Tourn.)L.及莕菜属NymphoidesSeguier)27个分类群的叶绿体全基因组序列,比较分析其结构特征,梳理系统发育关系,评价其物种鉴定意义,以期为该科物种资源保护、遗传背景分析及中藏药生药学研究等提供参考资料。

1龙胆科植物叶绿体基因组基本结构

根据目前已报道的龙胆科植物叶绿体全基因组序列,龙胆属包括秦艽组(Sect.Cruciata)、多枝组(Sect.Monopodiae)2组18个分类群,獐牙菜属3种,花锚属1种,睡菜属1种,莕菜属4种,共5属27个分类群。以夹竹桃科(Apocynaceae)植物Pentalinonluteum(L.)B.F.HansenWunderlin叶绿体全基因组序列为外类群,进行叶绿体基因结构的比较分析(表1)。

龙胆科27个分类群的叶绿体基因组均由LSC、SSC、IRa、IRb4个部分组成。对该科叶绿体基因组结构进行初步分析的同时,对该科最大的2个属龙胆属、獐牙菜属植物做进一步GC含量、重复序列和分布位置的分析。

1.1基因组长度

被子植物叶绿体基因组大小一般为~kb,龙胆科植物叶绿体基因组长度在~kb,与被子植物的长度特征相吻合[12]。獐牙菜属3种植物的基因组长度在kb左右,比龙胆属长3~16kb;莕菜属约为kb,花锚属约为kb,睡菜属(单种)为kb,是龙胆科植物目前叶绿体基因组序列最长的物种。龙胆属秦艽组植物叶绿体基因组长度在~bp[9],组内基因组长度差异小,大叶秦艽的序列长度最长,与同组物种存在1kb左右的差异,从叶绿体各区间比较可以看出,这种差异主要出现在LSC区和IR区;多枝组植物叶绿体基因组长度在278~bp,大部分植物比秦艽组植物少约10kb,这主要与多枝组物种存在ndh基因部分序列的缺失有关。特殊序列长度出现在短柄龙胆,短柄龙胆比其他多枝组物种长度大约多10kb,其中LSC区多1~2kb,SSC区差异更为明显,约5kb,IR区有1~2kb的差异。獐牙菜属中轮叶獐牙菜和川西獐牙菜的序列长度存在约1.8kb的差异,毛萼獐牙菜的基因序列最短,导致这个差异的原因出现在LSC区。

1.2叶绿体基因数量

龙胆科植物叶绿体基因组常具有蛋白质编码基因67~80个,tRNA基因30个,rRNA基因4个。

不同类群的基因缺失或假基因情况:龙胆属多枝组物种普遍存在ndh基因缺失,包括ndhA、ndhC、ndhG、ndhH、ndhI、ndhJ、ndhK;莕菜属4个物种全部缺失rpl2基因,獐牙菜属植物中仅毛萼獐牙菜缺失rpl33基因。由于叶绿体基因组边界结构原因,龙胆科物种普遍存在ψrps19、ψycf12个假基因;龙胆属秦艽组和獐牙菜属植物还存在2个假基因ψrps16、ψinfA;多枝组植物存在ψndhB、ψndhD、ψndhE、ψndhF假基因;花锚属植物花锚和獐牙菜属川西獐牙菜中ψaccD是假基因,不参与编码蛋白质的过程。

1.3编码蛋白基因长度差异

对龙胆科叶绿体编码蛋白基因进行分析,结果显示,共有31个基因的序列长度在不同物种中完全一致。其他基因在亲缘关系较近的物种间长度基本一致,但存在属间差异。不同物种间长度变异最大的ycf1基因,该基因长度5bp左右,各物种间最大变异长度为bp。ycf15基因变化范围为(毛萼獐牙菜)~bp(粗茎秦艽),在不同物种中存在明显的长度差异。

从9个含内含子的编码基因来看,大部分基因编码区长度相对稳定,但在不同物种中内含子长度不尽相同,亲缘关系相近的物种间变化较小。rps12、petB、petD、rpl16、ndhB5个基因在部分物种中缺失内含子区间,并且编码区长度相对其他物种亦较短;线叶龙胆在rps12、petB、petD、rpl个基因中内含子全部缺失;ndhB基因在龙胆属多枝组多个物种中为假基因或缺失部分序列,而其他龙胆科植物该基因编码个氨基酸,差异较为明显。

1.4SC与IR边界分析

龙胆科植物基因组LSC、SSC、IRa、IRb4个部分的接口位置,基因类型基本一致。LSC-IRb均为rps19,且长度一致(bp)。但该基因在LSC与IRb的分布比例存在组间或属间差异。IRb-SSC边界区均存在ψycf1假基因,其中龙胆属秦艽组、花锚属、獐牙菜属与龙胆属多枝组短柄龙胆的ndhF基因也位于该边界区。ψycf1假基因的长度具有一定的属或组间区分。SSC-IRa均为ycf1,且大部分ycf1序列位于SSC。IRa-LSC边界均位于ψrps19和trnH-GUG基因的交界位置,偶可见2、6bp或bp的序列间隔。ψrps19基因长度为4~bp,trnH-GUG基因长度为74、75bp,在物种间相对稳定(图1)。

2龙胆属及獐牙菜属叶绿体基因组结构特征

2.1GC含量

用EditSeq7.1.0软件对龙胆属、獐牙菜属植物叶绿体基因组序列的GC含量进行计算,结果显示,獐牙菜属GC含量最高,等于或大于38.14%,龙胆属多枝组居中,在37.93%~38.06%,而龙胆属秦艽组最低,在37.67%~37.73%。

2.2重复序列分析

利用在线分析软件REputer[10](



转载请注明地址:http://www.longdana.com/ldjj/5291.html