大数据时代,通过非常规业务可获取的气象相关信息越来越多,将这些庞大的、有些并非是直接气象变量的信息处理好并有效使用,是件值得下大力气做好的事情。
这类非常规信息被称为众包数据,是从英文“crowdsourced data”翻译过来的。这些众包数据都包括哪些呢?很难完整概括。例如,通过手机结合GPS定位获取的信息,应属于这个范畴。一是直接在手机上安装传感器,如温度、气压、湿度传感器等,就可以直接获取气象探测数据了;二是通过手机传播一些非数字信息,如文字、图片等,描述天气状况,处理这些信息会更复杂一些。
美国强风暴实验室实施了一个项目,通过公众手机APP,收集天气情况报告。他们结合GPS定位,接收并处理用户选择上报的天气类型信息。由于公众难以像专业人员那样提供精确数据,后期的处理尤为重要,通过人工智能技术可以解决这类问题。美国海洋大气局还设立了一个智能手机传感器感知气象的APP,通过手机随时获取气压、温度、湿度、光照等大气变化数据,这与传统的气象信息更接近一些,但毕竟不是标准数据,仍需要进一步加工后才能应用。
以上这些信息还算是直接对大气变化状况的描述,有一类气象信息则是通过间接换算而得到的。例如,德国汉诺威大学的研究人员开发了一种利用汽车雨刷器变化速度与GPS定位信息相结合,获取降雨量信息的系统。研究者认为,利用大量可能不很准确的测量信息,可以获知更多降雨空间分布的状况,与少量的准确观测实现互补。
在前不久召开的欧洲地球物理学会上,丹麦的学者介绍了他们对手机内置气压传感器信息进行收集并加工处理的结果,这一项目取得了令人满意的效果。手机气压传感器获取信息的绝对测值与观测站的准确气压相比,确实存在误差,但可喜的是,其变化趋势表现出了很好的一致性,这显然有助于对这类信息进行系统性订正,获取大量可用的数据。
类似这样的研究在欧洲地球物理学会上还介绍了不少。卢森堡大学和美国爱荷华大学研究人员,介绍了利用卫星通信网络信号强度变化对降雨强度分布进行估算的做法,具有应用前景。
以上介绍的这些信息具有明显的非实时、非定点、非精确、非直接、非规则、非标准等特点,这与传统气象观测业务的代表性、准确性、可比性“三性要求”,有很大区别。这些信息的处理方法显然也要根据这些特点进行设计,通过大数据分析、智能化处理等技术才能最终获取可用的数据。从我国的实际情况来看,对于从传统探测业务获取的信息,以及可能获取的各类潜在新型信息,在处理技术方面都存在较大差距,需要引起更多关注,在不断拓展各类探测业务的同时,更要注重提升信息处理加工能力和技术水平。