相比传统备份,CDM(Copy Data Management)的门槛其实更高,在我看来,传统备份的研发难点在于兼容性的支持,各种数据类型、各种生产存储、各种备份介质等等,非常复杂。而CDM,除了对兼容性支持的开发之外,还要增加备份数据使用方面的开发。所以,CDM厂家,如没有比传统备份产品更大的投入,没可能给客户带来实际价值。
在今年已经过去的9个月中,公司一直在处理一家客户的测试数据管理的项目,今天结合该项目中用户提出的需求,聊聊CDM在测试数据管理中的价值。
该客户在测试有1000个左右的源库(脱敏后的数据),库的类型包括Oracle、DB2和Mysql,OS类型包括AIX和Linux。
客户希望每个源库可生成10个副本库,副本库的平均更新频率为1个月,我们先来算算,1000个源库派生出10000个副本库,而这些库平均每个月要更新一次。也就是说 一年要生成12万个数据库。
生成数据库,如果采用传统的备份、恢复方式,需要准备存储空间、生成库、导入数据等等步骤,少算一点,一个库至少要一个人天,( 在实际中,很多用户是一周才能生成一个库)
12万个库就需要12万个人天,那么,就需要配置 12万人天/22/12=454个工程师才能完成这个工作量。
为什么没有企业能有非常敏捷的测试?为什么应用上线后Bug一大堆? 成本是根本原因, 没有企业能负担这个成本。
对安特飞CDM来说,数据服务是我们的专业,我们10年的持续投入中,数据使用是重中之重,通过安特飞,可以将454人缩减到几个人,因为:
1、一份CDM内的数据库数据(源库),可以生成N份副本后,分钟级挂载给服务器,并直接生成数据库
当然,这只是安特飞CDM的基本功能,要完美的满足这个客户在测试数据管理方面的需求,还需要安特飞提供这些功能和服务:
批量的、自动的发起操作,只涉及开发量,不难。巨量的数据库能每次都成功卸载、成功挂载,这才是难点,非常产品的成熟度。
从集成的接口角度看,不难,RestFul API是行业标准,难点在于安特飞系统的CLI是否足够成熟和完善,无需为此客户做研发级别的定制。
光这一个需求,基本等同于,1万个数据库的传统备份项目的方案,1万个数据库的备份项目,呵呵,有几个人做过?或做成功过? 很难吧?
测试对数据库是有性能要求的,一个源库生成10个副本后,如何副本数据库的性能?这对安特飞CDM本身、以及整体方案的设计能力(存储、网络等等)提出了非常高的要求。
以上案例,主要是说明传统备份和CDM有多大的区别,同时也说明,安特飞可以处理多大规模的数据服务的需求
安特飞一直不认为自己是做备份的,我们是做数据服务的,这个案例可以充分说明这一点了。CDM产品功能的重点,和备份恢复有极大区别的。马伊琾