色妹妹激情网 多花海棠叶绿体基因组分析
多花海棠(Malus floribunda Siebold.) 从属蔷薇科(Rosaceae)、苹果亚科(Maloideae)、苹果属(Malus)[1-2],多花海棠算作一类伏击的苹果属栽培种,活着界限制内正常栽培色妹妹激情网,因其花多且好意思,具有极高的不雅赏价值。本种叶不分裂,叶缘有锐锯齿;花蕾深紫红色,吐花后神思变浅,经由粉红色后至白色;果为深洋红色[2]。除了其优良的不雅赏特点[3],多花海棠在种质评价和抗性育种中也起到伏击作用[4-6]。研究发现,多花海棠中存在苹果黑星病(由苹果黑星病菌Venturia inaequalis Wint.引起) 抗性基因[7],基于此材料的育种后劲,多国科学家先后将多花海棠抗黑星病特点通过杂交工夫引入到新品种中,为苹果属抗病育种作出重大孝敬[8]。但是,多花海棠系统进化及资源分类等磋磨践诺却不甚了了,因此,开展遗传学、基因组学等研究对其变异检测和种质诈欺尤为必要。
叶绿体基因组研究算作一种技能,为植物种质资源飞动与分类、发祥演化与系统发育、遗传更始与基因工程等提供新的标的[9-10]。当今,部分苹果属植物叶绿体基因组已发布,触及的材料包括山荆子(Malus baccata (L.) Borkh.)、湖北海棠(Malus hupehensis (Pamp.) Rehd.)、楸子(Malus prunifolia (Willd.) Borkh.)、变叶海棠(Malus toringoides (Rehd.) Hughes) 等。对于它们叶绿体基因组的比较分析也已有报谈[11-13],这极地面便捷了苹果属植物的变异检测与种质诈欺。因此,完成叶绿体基因组图谱的构建和比较分析,对于揭示多花海棠的遗传特征和生物学地位等相配关节。
本研究基于全基因组测序数据,对多花海棠叶绿体基因组进行拼装,并初步对其基因组构成、类似序列特征、密码子使用模式、序列雷同性、系统进化相干等伸开分析,为今后苹果属叶绿体比较基因组学研究提供参考。
1 材料与设施 1.1 实验材料所用实验材料为多花海棠(Malus floribunda Siebold.),样品取自国度苹果工程中心青岛苹果砧木研发中心。
麻豆视频 1.2 实验设施 1.2.1 基因组建库及测序诈欺CTAB法索要多花海棠叶片的全基因组DNA,待质地检测后于Illumina平台建库测序,其中DNA测小序库的插入片断大小为350 bp。
1.2.2 叶绿体基因组拼装与注目借助细胞器基因组拼装器具GetOrganelle (https://github.com/Kinggerm/GetOrganelle)[14]获取多花海棠叶绿体基因组,采取从新拼装职责经过,其中参数k值设定为21、45、65、85和125。Bandage ()[15]用于拼装效劳的证据。叶绿体基因组序列的注目在PGA (https://github.com/quxiaojian/PGA)[16]、PGAVAS2 ()[17]中完成,尔后东谈主工查验并修正注目信息。使用OGDRAW软件(https://chlorobox.mpimp-golm. pg.de/OGDraw.html) 进行叶绿体基因组的可视化[18]。多花海棠叶绿体基因组已提交至NCBI (https://www.ncbi.nlm.nih.gov/),获取其登录号为OM115955。
1.2.3 叶绿体基因组特征及比较基因组学分析对于多花海棠叶绿体基因组GC含量、基因分类与内含子漫衍分别诈欺Perl设施平分析,MISA-web (https://webblast.ipk-gatersleben. e/misa/)[19]飞动浅易类似序列(参数保抓默许),REPuter (https://bibiserv.cebitec.uni-bielefeld.de/ eputer)[20]识别叶绿体基因组中的散在类似序列(最小类似单位大小为30 bp)。CodonW ()[21]贪图密码子使用情况。叶绿体基因组雷同性比较诈欺Circoletto () 完成,多序列比对在mVISTA (https://genome.lbl.gov/ ista/mvista/submit.shtml)[22]中进行,叶绿体基因组区域范围比较诈欺IRscope (https://irscope. hinyapps.io/irapp/)[23],使用HomBlocks (https://ithub.com/fenghen360/HomBlocks)[24]和MEGA_X (https://www.megasoftware.net/)[25]对不同物种进行系统进化分析。本文比较基因组学分析所用的叶绿体基因组来自NCBI数据库,具体信息参见表 1。
2 效劳与分析 2.1 多花海棠叶绿体基因组结构经基因组测序并拼装,获取一个好意思满的苹果属多花海棠叶绿体基因组,其总长为160 037 bp。字据序列与结构特征色妹妹激情网,多花海棠叶绿体基因组共分为4个区域,分别为大单拷贝区(large single-copy region, LSC, 1–88 142 bp),反向类似区B (inverted repeat B, IRB, 88 143– 114 495 bp),小单拷贝区(small single-copy region, SSC, 114 496–133 684 bp) 与反向类似区A (inverted repeat A, IRA, 133 685–160 037 bp),效劳见图 1。
2.2 多花海棠叶绿体基因组构成 2.2.1 叶绿体基因组基因特征经统计,多花海棠叶绿体基因组GC含量为36.6%,各区域GC含量组身分别为:LSC (34.2%)、IRB (42.7%)、SSC (30.4%)、IRA (42.7%)。对其序列进行注目发现,多花海棠叶绿体全基因组共129个基因(去重111个),分别为84个卵白编码基因(去重78个)、37个tRNA基因(去重29个) 和8个rRNA基因(去重4个)。大部分基因均为1个拷贝,其中卵白编码基因rpl2、rpl23、ycf2、ndhB、rps12、rps7,tRNA基因trnI-CAU、trnL-CAA、trnV-GAC、trnI-GAU、trnA-UGC、trnR-ACG、trnN-GUU、trnM-CAU,rRNA基因rrn16、rrn23、rrn4.5、rrn5各有2个拷贝。由注目效劳可知,卵白编码基因依据功能可分为4类,包括参与光勾通用的45个基因、用于自我复制的25个基因、其他类的5个基因以及功能未知的3个基因(表 2)。此外,对多花海棠叶绿体基因的内含子进行分析,发现大部分基因不含内含子,其中11个卵白编码基因和8个tRNA基因分别含有1个内含子,另外4个基因rps12 (×2)、ycf3和clpP则各含有2个内含子,详备信息列于表 3。
与其他4种苹果属比较,多花海棠叶绿体基因组大小与三叶海棠(Malus sieboldii) 的(160 040 bp) 为接近,多花海棠、山荆子、湖北海棠和三叶海棠的IR区长度基本一致,均小于变叶海棠的26 362 bp (表 1和表 4)。对于基因数量,多花海棠和山荆子叶绿体基因总和相易,而湖北海棠则多1个;多花海棠和湖北海棠具有相易的叶绿体编码基因数量;另外,5种苹果属植物齐包含4个rRNA。
2.2.2 浅易类似序列和散在类似序列在多花海棠叶绿体全基因组中对浅易类似序列(simple sequence repeats, SSRs) 进行飞动,效劳表露共鸣别73个SSR,包括27个A、4个C、39个T和3个AT类似(图 2A)。其中单核苷酸类似占到最大比重,3个二核苷酸类似分别是位于LSC区的(AT) 单位类似6次的2个SSR和位于SSC区的(AT) 类似6次的1个SSR。比较发现,三叶海棠和变叶海棠中漫衍的SSR数量分别为74和72,与多花海棠相类似(图 2A)。多花海棠叶绿体基因组中,SSR蚁集漫衍于LSC区和SSC区,尤以LSC区的SSR数量为最多(图 2B)。
通过在多花海棠叶绿体基因组中搜索散在类似序列(interspersed nuclear elements, INEs) (图 3A),识别正向类似(forward, F)、反向类似(reverse, R) 和回环序列(palindromic, P),各28、5和24个。比较而言,变叶海棠叶绿体基因组中散在类似序列最多(58个);而三叶海棠中则发现1个互补类型(complement, C) 的INE,其在多花海棠和变叶海棠中均不存在。对INE的序列长度分析发现(图 3B),多花海棠叶绿体基因组中,大部分散在类似蚁集在30–35 bp,尤以30 bp数量为最多(17个)。
2.2.3 密码子使用模式对多花海棠叶绿体基因组中密码子使用情况进行分析,通过贪图相对同义密码子使费用(relative synonymous codon usage, RSCU) 得知,使用概率较高的密码子包括UUA (亮氨酸,Leu)、GCU (丙氨酸,Ala)、AGA (精氨酸,Arg)、UCU (丝氨酸,Ser)、GAU (天冬氨酸,Asp)、GGA (甘氨酸,Gly)、UAU (酪氨酸,Tyr)、ACU (苏氨酸,Thr) 等,它们的RSCU值均大于1.6。编码异亮氨酸(Ile) 的AUU、编码赖氨酸(Lys) 的AAA、编码谷氨酸(Glu) 的GAA出现次数较多,分别为1 104、1 040和1 008次;而密码子UGC (半胱氨酸,Cys) 在统统密码子中数量最少(75个)。由统计效劳知(图 4),编码Leu的密码子(共6种,即UUA、UUG、CUU、CUC、CUA和CUG) 在一谈编码序列中数量最多,揣测2 749个,编码Cys的密码子(UGU和UGC) 数量最少(共298个)。另外,看守到高频密码子(RSCU > 1) 共30种,而其中有29种以碱基A/T收尾,这评释多花海棠叶绿体基因组中密码子具有偏向A/T收尾的使用模式。
2.3 多花海棠叶绿体基因组序列比对 2.3.1 基因组雷同性基于多花海棠和同属叶绿体全基因组序列,通过局部比对研究了它们的同源性和雷同性。由图 5可知,多花海棠与同属的山荆子、湖北海棠、三叶海棠和变叶海棠具有风雅的共线性相干,比对区域基本障翳各基因组。高雷同的序列特征,标明这些苹果属植物叶绿体结构较为厚实。
2.3.2 变异热门为了比较多花海棠和苹果属的其他物种叶绿体基因组的变异热门区域,本文在NCBI数据库中获取了湖北海棠、变叶海棠、西蜀海棠(Malus prattii)、楸子、山荆子、三叶海棠、滇池海棠(Malus yunnanensis) 共7个叶绿体基因组。比对效劳表露(图 6),在叶绿体全基因组限制内,这些物种的序列较为一致,但是仍然存在部分区域互异较大,如rps16-trnK (UUU)、trnR (UCU)-atpA、atpH-atpF、trnT (GGU)-psbD、psbZ-trnG (GCC)、trnT (UGU)-trnL (UAA)、trnV (UAC)-ndhC、trnM (CAU)-atpE、accD-psaI、psaJ-rpl33、rps3-rpl16、rps19-rpl22、ndhF-trnN(GUU)、rpl32-trnL (UAG) 等。进一步示意,苹果属植物叶绿体中这些区域为物种变异提供了基础,因此高度变异区域的比较对于研究物种进化以及飞动具有伏击的兴味。
2.3.3 范围分析叶绿体基因组中4个范围区对于基因组的结构厚实以及基因组大小起到关节作用。对此,基于叶绿体基因组注目数据,文中比较了8个苹果属物种的SC区和IR区的范围彭胀与收缩情况(以单据叶模式植物水稻和双子叶模式植物拟南芥作参考)。如图 7所示,固然苹果属叶绿体基因组长度变化从160 024 bp (山荆子) 到160 239 bp (西蜀海棠),但是它们的IR区大小互异较小(26 306–26 362 bp)。基因rps19在8个物种中均漫衍于LSC和IRB,况兼在LSC- IRB范围齐为159 bp (LSC) 和120 bp (IRB) 的组合方法(滇池海棠以外)。在IRB区和SSC区分界处,ycf1基因在不同植物中有所区别,除多花海棠和滇池海棠未注目到ycf1,湖北海棠、西蜀海棠、三叶海棠和变叶海棠的ycf1齐位于IRB一侧,并未最初范围,而山荆子和楸子的均有8 bp落在SSC区域。另外一个值得看守的基因是trnH,固然它在8个苹果属植物中齐位于LSC区,但是它们距离IRA和LSC范围的距离是不同的,分别有32、38、94 bp等。此外,比较分析发现,单据叶植物水稻与双子叶的拟南芥和苹果属植物比较,范围基因在长度和位置上均存在较大互异。与苹果属植物不同,拟南芥JSB集结位点的ndhF基因向IRB区偏移量更大,而水稻ndhF基因则一谈位于SSC区;在拟南芥中,LSC与IRB范围的rps19更偏向IRB侧,而水稻rps19则全齐落入IRB区。
2.4 多花海棠叶绿体基因组系统进化分析多花海棠叶绿体基因组的拼装对其生物学进化地位的阐释有着伏击价值。以山楂属(Crataegus) 湖北山楂(Crataegus hupehensis) 作外类群,将多花海棠和其他7种苹果属植物基于叶绿体基因组构建系统进化树(图 8)。由于贯串树分支上搭救值均大于60%,评释效劳是较为可靠的。图中表露统统物种共聚为两大类,分别是外类的山楂属以及苹果属;苹果属又分3支,其中滇池海棠单独为一支,多花海棠、湖北海棠和变叶海棠构成一支,西蜀海棠、楸子、山荆子和三叶海棠折柳为另一进化支。另外,字据进化距离不错看出,多花海棠在其处所聚类支等分化较早。本文的拓扑结构与先前高源等[9]诈欺叶绿体片断序列进行的苹果属遗传万般性研究效劳较为雷同,同期,李亚楠[11]对苹果属的折柳也在本研究的进化相干中得到搭救。
3 商议与论断多花海棠是天下上汲引较为精深的苹果属栽培种,具有较高的不雅赏和育种价值。本研究通过DNA测序获取了好意思满的多花海棠叶绿体基因组,与此同期,借助生物信息学工夫,对其进行基因注目、序列比对、范围分析等。诈欺二代短读测序数据,从新拼装得到一个长度为160 037 bp具有环状结构的多花海棠叶绿体DNA,序列总长与同属的山荆子(160 024 bp)[26]、湖北海棠(160 065 bp)[27]、楸子(160 041 bp)[28]、变叶海棠(160 093 bp)[13]等比较是较为接近的。而与不同属的漆树科盐肤木属盐肤木(Rhus chinensis Mill., 158 809 bp)[29]、蔷薇科桃属长柄扁桃(Amygdalus pedunculata Pall., 157 851 bp)[30]、蔷薇科栘[木衣] 属长爪[木衣] (Docynia longiunguis Q. Luo & J. L. Liu, 158 914 bp)[31]等叶绿体基因组长度永别较大。
分析获知多花海棠叶绿体基因组包含4个保守的经典区域,分别为大单拷贝区(88 142 bp),反向类似区B (26 353 bp),小单拷贝区(19 189 bp) 与反向类似区A (26 353 bp)。范围分析发现,其与苹果属的其他植物在IR区域长度永别不大,进一步评释反向类似区在保管叶绿体基因组的结构厚实与功能保守等方面推崇积极作用。通过对多花海棠叶绿体基因组注目,共获取78个卵白编码基因,与多脉铁木(79个)[32]、矮牡丹(78个)[33]中的数量是接近的。经对比,苹果属的湖北海棠叶绿体基因组也具有78个编码基因。进一步对多花海棠叶绿体编码基因的密码子使用模式进行贪图,发现密码子具有偏向A/T收尾的特征,况兼使用UAA算作阻隔密码子的概率更高(RSCU=1.71)。类似的效劳在球花石斛[34]、大花正人兰[35]、杜梨[36]中也已报谈。
基于叶绿体DNA比较植物种间万般性和遗传变异,一直以来齐是研究热门问题。当今,在苹果属中进行了精深报谈。高源等借助trnH- psbA、trnS-trnG spacer+intron、trnT-5′trnL和5′trnL-trnF这4个叶绿体基因间区对新疆野苹果[37]、山荆子[38]和楸子[39]等多态性变异位点进行了检测并对不同居群种质的系统演化伸开商酌;李亚楠通过对91个叶绿体基因组构建系统发育树并结合前东谈主分类,漠视将苹果属折柳为2亚属,8组,25种[11]。在本文的研究中,通过叶绿体全基因组比对,发现8个苹果属植物中存在trnV (UAC)-ndhC、trnT (GGU)-psbD和trnR (UCU)-atpA等高度变异区域,此外,系统聚类相干标明多花海棠、湖北海棠和变叶海棠在进化上较为风雅且孤苦。
由比较基因组学分析得知,相较于单据叶模式植物水稻和双子叶模式植物拟南芥,多花海棠与苹果属内其他种序列雷同性更高。同期看守到,不同物种叶绿体基因在陈设规矩和位置上不尽相易,举例禾本科水稻中SSC与IR区范围处ycf1基因发生退化缺失[40],使得SSC区减轻、基因偏移。这一情况与拟南芥和苹果属植物等显然不同,推测可能与物种分化磋磨。因此,在今后的研究中,应多加关怀物种间的序列互异以及变异特点。
本研究基于高通量测序获取了多花海棠叶绿体全基因组序列,对其序列特征、基因功能、全局比平等伸开分析,并借助生物信息学和比较基因组学技能色妹妹激情网,在叶绿体基因组层面比较了不同的苹果属种质的遗传万般性,可为今后深切挖掘分子标记、揭示物种进化提供参考。