位于英国剑桥的欧洲生物信息研究所(以下简称EBI)为全球科研人员提供免费的生物信息,让他们可以随时访问并将其用于科研工作。这家非盈利机构所存储的生物学数据竟然达到了将近50 PB的规模,并分布在三个数据中心当中。无论是高校还是商业机构,都可以访问这些数据,用来进行研究、应用开发或者培训。
根据EBI推算,他们每个月都要应对超过1200万个数据请求。
用户可以将数据下载到本地然后再做处理,也可以使用EBI的IaaS服务,免去了将数据存储到本地的麻烦。“这是一个相对新鲜的方式,这也让生命科学研究人员使用和消费数据的方法得到了改变。这种模式也可以推广到各个领域。”EBI的技术服务团队主管Steven Newhouse说。
EBI的570名员工中有将近20%的人都在从事以调查或协作为主的生命科学研究工作,因此整个机构的数据量几乎每年都会翻一翻。如果以这种速度增长,就意味着五年后的数据量将达到1500 PB,EBI的基础设施将面临严峻。
数据库虚拟化的经济性
为了解决这个问题,EBI决定采用虚拟化技术来对数据库进行精简,并最终选择部署了Delphix的数据即服务(DaaS)。这一技术能够捕获数据库元数据,并将其存储在一个单一的副本上,然后为提出请求的用户提供一个虚拟副本,而免去了数据复制这一步。
EBI预测,通过部署数据库虚拟化技术,使得他们能够减小将近70%的存储空间。Newhouse表示:“随着不断地生成数据,所有的基础设施都必须针对数据库进行调配并不断地扩展存储空间。而在使用Delphix的服务之后,我们的存储需求得到了控制,更关键的是我们不再需要大量的人力来管理这些数据。”
此外,数据库虚拟化还可以减少在企业内网之中流动的数据量,同时创建数据库实例也变得更快、更简单。“许多我们内部的用户都是开发人员,他们使用我们的元数据来开发应用,然后全世界的企业都会用到这些应用。开发人员需要创建一些数据库实例来支撑他们的开发工作,而Delphix所提供的,是快速克隆数据库的能力。” Newhouse说。
数据库虚拟化让IT团队可以加速创建数据库实例,然后把更新提交给开发人员,让他们的工作能够更加高效。
“Delphix使得我们可以看到不同数据库版本之间的区别,这样我们就可以根据不同来进行调整,不用再对整个数据库进行这样的操作,这就大大提升了部署新数据库的速度。IT团队的反馈越来越快,我们数据库更新的频率也得到了提高。这使得全球的科研人员都能够因此获益。” Newhouse说。
试点项目
据了解,EBI大约在一年之前开始了部署Delphix数据即服务的项目,而在此之前,他们已经对数据库虚拟化技术进行了3-4年的测试和试用。
“在过去几年中,我们进行了多次的试点项目,并从中收获了一些经验和信心。从反馈情况来看,用户提供的信息非常积极,因此我们最终决定这就是我们未来几年将要大规模部署的技术。” Newhouse说。
Newhouse表示,最终EBI做出决策的并不是Delphix所提供的服务,而是数据库虚拟化这个技术是正确的方向。“EBI内部的都比较保守,要他们采用新的技术,则需要许多年的时间。在最初提出的时候,不仅有许多人持怀疑态度,而且我们要确保新技术能够发挥它的作用,并在未来几年之内都提供完善的支持。” Newhouse说。
对服务器和数据库基础架构的虚拟化,使得EBI能够对更多的流程进行自动化处理。Newhouse希望利用这个机会来让EBI接受更多敏捷方法,并应用到在未来的app交付领域。
“我们希望未来的整体服务能够支持移动化,同时可以在不同的虚拟架构中进行部署。也就是说我们将打造一个混合云。” Newhouse说。