”5·28携程事件“以后,关于互联网的安全话题得到了爆炸式的关注,许多业内人士纷纷出来分析和论证关于互联网企业的隐患根源所在。那么当今互联网的安全与运维,真的出了大漏洞吗?请看Mr.A为你一一道来。
从“携程”事件看运维
5月28日,携程网遭受不明攻击导致官方网站及APP暂时无法正常使用,携程首页挂出通知,建议用户选择艺龙旅行网。
而就在28日17时许,艺龙网首页也出现无法访问的情况。更有消息称,携程已召集了所有技术人员加班加点提供解决方案,但一直到当日晚间10点,携程的服务都可能无法恢复。
社交媒体上有网友称:“携程数据库被物理删除”。
这是携程最近一年来爆发的第二次安全事件。
事故原因猜测
▼猜测一 数据库被物理删除
物理删除是指文件存储所用到的磁存储区域被真正的擦除或清零,这样删除的文件是不可以恢复的。如果携程的数据库被物理删除,那损失不可估量。不过,单从技术角度来看,物理删除的速度非常慢,携程那么多的数据在短时间内被删除的可能性不大。
事实上这个猜测实在不算专业,从理论上而言,很难有一个人能把所有的备份数据都删除,更不用说这个绘声绘色的物理删除了。所以根据Mr.A总结,即使没有官方辟谣,这一猜测也基本可以被否认。
▼猜测二 业务代码被删除
Mr.A找到一份疑似携程的内部邮件表示:『Croller中保留了上次编译后的版本,fat到prd环境所有Windows环境编译后的源代码被删除』,如果这份邮件属实,那基本可以确认此次事故是由于业务代码被删除引起的。业内某专业人士也赞同此观点。由于代码每天都会上线并且有代码库,所以可能没有做备份。但反对派的意见是,不太可能瘫痪这么长时间。
▼猜测三 黑客攻击OR内部员工破坏
这个说法能满足一些围观者猎奇的心理,因此也传播的比较快。但Mr.A分析,可能性也不大。黑客讲究的是潜伏和隐蔽,做这种事等于是在做自杀性攻击。而内部员工也不太可能,我还是相信携程的运维人员的操守和职业素养,在刑法的威慑下,除非像“法航飞行员撞山”那种极个别案例,正常情况下不太可能出现人为恶意的可能性。
从现象上看,最大的可能还是运维人员在正常的批量操作时出现了误操作。
国内互联网忽视企业安全
中国互联网企业巨头多次陷入各类安全事件,探其原因,还是因为国内企业对安全问题的漠视,大家都忙于业务、忙于竞争,所有的资源都投入到一线业务中去了。特别是企业数据的管理和保护这个领域,一旦出现问题,造成的损失无法弥补,这和国人的观念不无关系,就像买保险一样,大家都抱着侥幸心理,万分之一的几率,但是万一发生了呢?
Mr.A有一个数据可以例证,到微博上搜索一下备份,上面有近1亿条用户记录痛哭流涕的抱怨自己没有及时备份个人数据而终身遗憾!
欧美国家对数据保护极为重视
再来看看欧美环境,再小的一家公司,都有专业的数据管理软件或者专业的IT维护人员,他们极其重视数据,视数据为企业生命。所以在欧美,做数据管理和保护的IT公司不下500家,像IBM、HP、Dell、EMC等这些老牌的上市公司都在做数据管理和保护。国内在企业数据管理和保护该领域企业少之可怜,国内的IT软件公司绝大部分是代理欧美产品,极少数是自己维护开发,无法保证专业性。
故障根源反思
▼运维:预防和治理更应该从企业入手
Mr.A分析,携程的这次事件,不管原因是什么,都会成为IT运维历史上的一个标志性事件。这是一个由运维引发的问题,但真正的根源其实不仅仅在运维,预防和治理更应该从整个企业的治理入手。然而长久以来,在所有的企业中,运维部门的地位都是很边缘化的。
传统的运维人员实际上是所谓的“黑盒运维”,因此不知道服务里面应用的依赖关系。对于这样的故障,真正有效的根源解决做法是从黑盒运维走向白盒运维。从黑盒运维走向白盒运维,再进一步实现DevOps(开发运维衔接)和软件定义数据中心,就是所谓的运维2.0了。很显然,这个单靠运维部门自身是做不到的,需要每一个企业的管理者、业务部门、开发部门去思考。
▼数据管理:核心不变
数据备份保护
Mr.A提醒您,数据备份是数据保护的最后一道防线。数据备份的核心价值是通过有效的数据备份手段,降低数据丢失风险,提升数据安全保障。数据备份的关键是有效性。数据备份不是目的,可恢复才是关键。
如何节省用户数据存储与管理成本
关于数据存储的成本Mr.A也有话说,我们通常想到的是存储容量成本,如每TB多少钱。实际上,数据存储与管理的成本远远不止这些,还涉及备份成本(本地及异地)、I/0效能成本等。然而大多数公司只注重容量成本,却忽略了其他成本,例如安全成本。