大数据的概念和云计算一样,不是新近出现的。它早如一阵风,悄悄地进入到各大会议和论坛中,进入人们的视线。但是也有很多人疑惑,什么是大数据?大数据是不是指数据量非常大,和海量数据是同一概念吗?
就大数据的问题,有关专家对大数据和海量数据作了解释。
首先,大数据和海量数据这两个词汇都是来自英文,但翻译不大相同,也有很多人混淆翻译。大数据的英文译文是“big data”,直白明了;而海量数据则是“large- scale data”或者“vast data”,字面意思很明显,就是规模很大、量很大的数据。
其次,海量数据包括结构化和半结构化的交易数据,而大数据除此以外还包括非结构化数据和交互数据。那么大数据应该如何定义呢?大数据意味着包括交易和交互数据集在内的所有数据集,其规模或复杂程度超出了常用技术,按照合理的成本和时限捕捉、管理及处理这些数据集的能力。大数据由海量交易数据、海量交互数据和海量数据处理三大趋势汇聚而成。
目前在中国,4%的银行客户贡献了80%的利润;医疗影像和电子病历的数据量每24个月就会增长1倍,这些不断增长的数据量要保证日后任何时间均可访问。仅一家普通的社交网络公司每天要收集至少600亿个数据点,用于分析用户行为,通过数据分析保证留住用户。实际上,除金融、医疗、互联网三大典型行业外,政府部门及电信、能源、公共事业、零售、仓储物流等行业也面临着大数据的挑战。
大数据将成为行业和企业信息化建设的一道分水岭,用好大数据将会给信息化注入活力并推动业务创新,最终帮助企业找到新的增长点;而错过大数据的发展机会,不但无法保证信息化建设的深入开展,最终还会使企业丧失竞争优势。