月季是世界上重要的观赏植物,具有经济,文化和象征意义。月季在全世界种植,并以花园月季,切花和盆栽植物的形式出售。月季是远亲种,可以有各种倍性。我们的目标是通过对双单倍体进行测序,为月季开发高质量的参考基因组,结合长短reads,并锚定到高密度遗传图上,并研究其主要观赏性状的基因组结构和遗传基础.。我们从Rosa chinensis 'Old Blush'产生了一个双单倍体月季('HapOB')并产生一个月季基因锚定到7个伪染色体(512 Mb,N50为3.4 Mb和564个contig)。512Mb代表估计的月季单倍体基因组大小的90.1-96.1%。在组装中,95%仅包含在196个contigs中。使用高密度二倍体和四倍体遗传图验证挂载率。我们描述了染色体特征,包括周围区域,通过注释转座元件家族和使用荧光原位杂交定位着丝粒重复序列。月季基因组与草莓属基因组显示出广泛的同线性,我们只划定了两个重要的重组。从不同的属种选择七种二倍体和一种四倍体重测序数据分析遗传多样性。结合遗传和基因组的方法,确定了关键装饰性状的潜在遗传调控因子,包括刺的密度和花瓣数量。认为月季APETALA2 / TOE同系物是月季花瓣数量的主要调节者。这个参考序列是研究多倍体化,减数分裂和发育过程的重要资源,正如针对花和刺的发展所展示的。它还将通过开发与性状相关联分子标记以加速育种,识别基因,探索蔷薇科的共线性关系。
结果:
1.高质量的参考基因组
从二倍体杂合品种'Old Blush'中到晚期的单核小孢子发育阶段使用花药培养物开发了单倍体愈伤组织细胞系(HapOB)。该用分布在七个连锁群的10个微卫星标记验证HapOB系的纯合性。 Illumina和PacBio测序技术用来组装双单倍体HapOB基因组序列。 PacBio测序数据用CANU组装,产生551contig(N50为3.4 Mb),总长度为512 Mb。所获得的序列,95%仅包含在196个contig中。K-mer谱分析(K = 25)表明532.7 Mb的基因组大小. 而流式细胞仪分析估计的基因组大小1C = 568±9 Mb。 因此,组装的序列代表96.1%或90.1%。
开发了高密度的雌性和雄性遗传图谱从R. chinensis ‘Old Blush’和Rosa wichurana (OW)杂交中。其中196个contig手动锚定到七个连锁群上,大部分在雌性和雄性遗传图谱上(分别为174和143 contig)。总之,466 Mb因此锚定在遗传图谱上并组装成7条伪染色体,代表90%的组装contig长度(表1)。
在基因组组装中定位着丝粒
使用生物信息学和细胞遗传学方法鉴定着丝粒区域。 发现了一个非常丰富的串联重复的单体(159 bp长),我们称之为OBC226(图2a)。PCR证实了这种重复的串联组织(图2b)。FISH分析明确确认了重复的位置在七条染色体中的四条中(Chr2,Chr5,Chr6和Chr7(图2c)。比对 OBC226的重复序列揭示了所有HapOB伪染色体覆盖率很高除Chr1外,这就解释了为什么没有明显的着丝粒区域检测到(图2d)。在Chr3和Chr4上,OBC226的拷贝数可能也是很低以至于没有被FISH检测到。 此外,核心OBC226着丝粒重复侧翼有其他重复序列,而这些在染色体上分布不均匀,核心着丝粒区域密度较高(图2d)。 这些着丝粒区域也富集Ty3 /Gypsy转座元素。 总之,这些结果证实了这七个伪染色体上的着丝粒区域并揭示当前分配给Chr0的高重复序列含量和低基因含量。