质体是负责真核生物(如植物、藻类和原生生物)光合作用的关键细胞器,它也被当作遗传和操作的重要材料。质体的结构和数目不同于包括线粒体在内的其它细胞器,其表型同时受到遗传学和因子的影响。质体基因组产生数量可观的参与多种生物学过程(如光合作用、呼吸作用和翻译等)的核心蛋白质。不同的质体基因组的基因数目和种类是有差异的,而且,它们还具有不同程度的序列保守性和功能保守性。
我们已经知道存在一些类似子的结构(基因成簇),它们倾向于共同表达,从而提高和翻译的效率,最终在进化上由于选择压力的作用而不容易被拆开。目前存在的质体或者叶绿体相关的数据库主要集中在单个基因组的数据注释方面,而同时考虑多间的比较基因组学和进化生物学方面的研究较为缺乏。中国科学院基因组研究所于军研究员和英国伦敦大学学院肿瘤研究所王大鹏博士构建了以质体基因组结构变异和成对基因保守性为主要内容的数据库Plastid-LCGbase,该研究发表于近期出版的Nucleic Acids Research 。
该数据库共收集470个质体(主要是叶绿体)基因组,将按照界、门、纲、目、科、属进行分类整理。显示基因组水平的宏观基因分布情况以及不同基因组间DNA和编码序列的同源程度。展示不同进化尺度和分类下成对基因的保守模式以及周围基因的插入或删除、重排和易位等基因变异模式。此外,按照方向参数和物理距离参数的原则,将成对基因分成了三种类别“头对头”、“头对尾”和“尾对尾”以及三种模式“分离”、“重叠”和“包含”,同时考察成对基因起始位点间距离的可变性。数据库还通过连接高度保守的基因对,为每个鉴定了潜在的子结构。
该数据库囊括了来自广泛代表性的数据,实现了比较基因组数据的可视化,将在探索质体或叶绿体基因组保守和变异的动态规律方面为广大用户提供一个有力的平台。
原文链接
延伸内容: