大数据的喧嚣充斥在数据中心、云以及新闻当中,有朝一日,有没有可能大数据进入我们的家庭呢?有可能。
我不知道这想法想法从何而来,也不知道我是不是第一个有此想法的人,不过,猜想一下这种可能性总是可以的。大数据,正如字面意思反应的那样,是指数据太大,难以用传统手段与标准进行处理。按照这一定义,大数据怎么会进入家庭呢?
毫无疑问,数据正在以惊人速度增长。不仅是数据量,而且是每个增长数据单元的体积。还记得1.44MB磁盘吗?15年前,我们可以将整个操作系统拷进一张软盘(DOS,XENIX,Minix等等)。10年前,Linux需要两张这样的盘。当时,Windows需要一张CD光盘的容量。一张CD光盘可以存储700MB数据,当时我觉得是非常大的数据了。然后就是DVD(4GB/8GB)。
我认为,数据存储的增长要走在数据使用的前面,因为我们使用越来越多的数据。Windows现在需要一张DVD存储。一张数码单反相机照片的数据容量在4M到5M,即使最简单的Word文档的体积也比那些古老的软盘大。
当年一个64MB的硬盘就觉得很大了,今天,一个32GB的硬盘仅能保存很少的东西。
这就是问题的关键。
数据正在变得越来越大。而且,数据随着时间而快速增长。
因此,大数据进入家庭并不是空想。
想想你全部保存在纸上、你脑海、或者存在各种地方,比如网络,磁盘,硬盘,云中心当中的数据吧。我本人在Dropbox上保存了50GB数据。大部分是图片,也有一些文档。对一个人讲,那是很大的数据了。
想一想你自己的音乐、你全部的账单、交易、电话、电视剧、银行信息、医疗记录,你的家电、家庭、家具、汽车等的全部维护记录,如此等等。
那些是很多的数据。当你考虑到这些,数据容量最低也要用TB级别来计算吧。当你考虑到这些数据的增长,数据的容量会变得更大。
当你将全部的生活数据数字化,到哪里存储它们呢?
选择有很多。
你如何存储它们?
这是一个技术问题。
我们需要面向个人数据的大数据解决方案。它们需要安全、灵活、低价、可扩展,要能随处访问,容易管理。
云可能是数据存储的最好方式。但这种云存在于哪里?你的家?数据中心?还是多个数据中心?
答案是,三种地方均有。
为了满足我们上面提出的要求,存储应该无处不在。尽管数据中心不会有容量限制,但我们自己也要存储部分数据。最终,我们需要将自己的存储,CPU以及内存资源“捐献”给集体云。
有一家忘记名字的公司,已经在进行这样的存储。你加入云,捐赠一部分自己的存储给云,其它用户可以利用这些存储空间。他们的一些数据会保存到你的硬盘上,你的也保存在别人的盘上,整个数据进行加密,非常安全。
想想SETI@home项目,这种搜索地外生命的项目会分解任务给众多计算机。
我认为,大数据将会大举进入我们的家庭。硅谷的聪明人,企业家们应该为此打造解决方案。
数据的数字化以及如何存储它们是两个关键问题。