云计算时代数据丢失事故频发的根源
随着云落地,更多用户把目光集中于云应用、云计算、云存储等地方,而渐渐忽略了云环境下的数据保护,甚至有人说既然分布式系统采用了多副本保存,要数据备份做什么用?如出一辙的是早些年几台磁盘阵列之间做镜像,如果依靠多副本保存而弱视数据备份的方法成立,那么备份市场早就应该被淘汰掉。
市场分析公司IDC的数据显示,2013年第一季度,备份专用设备制造商总收入为6.79亿美元,同比增长16.5%。IDC表示,该市场的增长速度明显超过外部磁盘存储系统以及数据保护和恢复市场。至今这个市场依旧蓬勃发展说明,其在数据安全方面依然有着不可取代的地位,“本地备份,异地备份,数据恢复演练”这三套老马车同样适用于云计算时代。
2009年10月微软Sidekick手机服务故障,使得用户无法访问联系人名单、日程表和其他个人信息。这些数据都存储在微软负责的服务器上。而一周以后,由于没有对数据做备份,微软表示可能使用户数据完全丢失,由此引发了业界对于云计算数据安全的反思。
2011年03月,谷歌Gmail邮箱出现故障,随后谷歌确认,这一故障估计导致15万用户邮件、标签和联系人信息丢失。
2012年8月7日由于机房一台物理服务器磁盘发生损坏,导致盛大云主机的客户数据就此丢失。盛大云建议用户,“为了避免您的意外损失,请在盛大云主机之外,也做好数据备份。”
云平台的数据丢失事故层出不穷,一次次的教训告诉我们数据安全不容忽视,尤其是在云应用普及的今天,企业云盘、网盘、数据中心托管等商业服务模式铺天盖地到来。数据中心不仅仅是NAS上几百GB的电影,而更多的是用户核心数据,这些数据损毁、丢失将给云服务提供者带来巨大声誉损失。云服务加速发展的前提依赖于数据,如果数据不安全,那么云计算就真的成了飘渺的的云。
近几年由于云计算、物联网的高速发展,庞大的数据量对传统备份提出很多的挑战,云时代的数据安全面临着前所未有的挑战。
云计算与数据保护的紧密关联
海量数据增长——传统业务数据由于非结构化数据的日益增长,业务数据在不断的增加着;而基于云平台的数字电视、3G上网、GPS定位、统一监控等等各种各样的业务诞生,每一个用户一个简单的操作可能就会生成几KB大小的数据。由于大数据挖掘带来的巨大商业价值,让越来越多的人类行为习惯被捕获变为数据化。面对爆炸式增长的大数据,传统的数据保护技术难以胜任新的需求。
虚拟化环境的数据安全——云平台的三层及架构IaaS,PaaS和SaaS已成为共识,而其中PaaS基础架构层主要依靠全面的虚拟化技术,包括计算资源池、网络资源池、存储资源池等,虚拟化技术将物理硬件进行逻辑池化。而随着云计算的发展虚机将在机房广泛应用,管理员需要繁琐的方式定位追踪虚拟机位置,以确保虚机数据得到有效的保护。如何简化备份恢复策略,如何准确定位减少人工操作,让管理员从虚机维护中解放出来,也是云计算对数据保护的要求之一。
数据恢复的颗粒度——传统数据保护,在查询数据时候需要先进行恢复,而恢复时间决定于备份策略定义的文件夹或者卷的大小,恢复以后用户才能从恢复的数据内容中找回所需要的那份文件,复杂繁琐的恢复步骤很难满足对于时效性的要求。用户对于数据保护需要的是即时查找,定位需要的文件并快速恢复,颗粒度从原有的卷文件夹提升到单个文件甚至是某一邮件的附件,如何快速定位并提取所需内容成为数据恢复不可忽视的问题。
数据恢复时效性——传统数据保护手段最大的问题是恢复时间长,相对大一些的数据恢复一次需要几天的时间,而在云平台之上,越来越多的频繁在线交互业务已经不准许出现问题后几天时间才能正常运转。另外,传统数据保护采用的多为夜间闲置时间做数据备份,一旦出现问题,则恢复的将是前一天的数据,当天业务产生的数据可能面临全部丢失,这对于在线交互业务而言是不可忍受的。用户对于RPO与RTO的要求越来越高,对某些在线业务需要恢复时效性是分钟级甚至秒级,而恢复时候的状态也需要维持在故障前几秒或几分钟,同样传统备份而言无疑是一种新的挑战。