很多人迷恋大数据,以为有了数据就有了金矿,其实并不是这样。
数据是我们通往价值规律认知的一个台阶而已,完整的价值进化台阶如下:
首先是自然噪声,说白了就是各类信号源,可以是一本书,一个电话,一个告密者,任何东西。所需的第一种能力是从自然信号中获得信号源的能力,一个灵敏的收音机可以听到很远的电台声音,比如你能否在书店里找到你想要的书。对多数人来说,第一种能力就是知道什么对你的工作和生活是有用的。
第二是信号,就是在信号源中解调出信号,对于专业人士来说,他们对某一特定的信号就会非常敏感,能捕捉到信号源,可能是一个词,一个表情。这个信号可以是模拟的,比如人的表情,语调,也可以是数字信号,比如一串莫尔斯密码。当然,学过信号与系统的人肯定知道信号与数据的关系。模拟信号可以传送数字数据(各类调制解调器),数字信号也可以传递模拟数据(CD和MP3)。
第三是数据,如果我们把这里的数据定义到数字数据的话,这就是数据分析和大数据的概念了,当然数据还分结构化数据、半结构化数据和非结构化数据,目前多数的数据分析技术还是针对结构化数据的,说白了就是结构化数据库里的数据,而对于类似时间序列的半结构化数据和音频视频这类非结构化数据,目前也是学术研究的热点吧,比如对于海量视频监控数据的脸部识别,动作捕捉,乃至直接定位恐怖分子啥的。
第四是信息,其实对人和计算机来说,数据不重要,数据蕴含的信息才重要,比如几个TB视频数据,真正破案需要的恐怖分子信息,可能只在其中占几个帧而已,而要从这几个帧的数据里,发现恐怖分子的各类特征信息,比如面部,躯体,走路样子,从哪里来到那里去等等,这才是需要专业分析的地方,目前计算机估计比不上专业的人。所以信息才是重要的,知道为啥很多系统叫做信息系统了吧,因为它们是基于数据处理信息的系统。
信息真正的价值是什么?按照系统论的观点,信息是系统交互中,降低系统不确定性的关键。所以信息论鼻祖香浓咖啡,错了是香农大爷提出了信息熵的概念,熵是不确定性的衡量标准。说白了互联网思维的核心就是低熵,信息的交互和传播可以使开放系统的熵降低,确定性增加。控制,就是使得系统的不确定性向我们希望的确定方向演化。在这个层面上,系统论,信息论,控制论这三个系统工程的理论和谐的展现了。
第五是知识,对人和未来的机器来说,信息的不断沉淀和应用交互过程就产生出人类的知识,知识构建于信息之上,但不是信息,信息是知识的载体。举个例子,时刻变化的股票交易中,股价是信息,但是股价代表了什么,如何根据股价\指数和其他交易信息去确定交易时间,买卖股票,那就是知识了,如果你把经验也看成知识的一种,信息系统搞到后面就是搞知识管理和知识库,做个股票信息软件不牛逼,牛逼的是自动选股和买卖点提示,这背后需要有算法和专家库,这些都是知识处理的内容。
第六是价值,所有的数据\信息都必须产生价值,人不会做无价值的事情,互联网最牛逼的地方是颠覆了传统现金流的概念,而是把未来的现金流转换成当下的价值。而从知识、信息积累起来的价值判断和价值思考,又会反过来指导我们对于信号、数据的理解和需求,新的价值会带来新的数据,新的数据又产生新价值,这才是互联网、物联网未来不断演化的源泉。