几年前,Kord Davis(前任Cap Gemini分析师,《Ethics of Big Data:Ethics of Big Data: Balancing Risk and Innovation》一书的作者)发现自己陷于一个接一个的会议中,和技术人员以及产品推广经理一起讨论所谓大数据的道德伦理。会议一般是这样进行的:技术人员首先介绍自己在数据方面的创新,而后一个产品推广经理表示赞同,另一个则认为非常危险。
“我逐渐认识到,如果在业务语境下没有达成词汇和框架的一致性,我们仍然会把讨论局限在个人道德的范畴内。”Davis在O'Reilly Media讨论会上表示。
在业务范畴内讨论道德伦理并非易事。Davis认为这个话题过于宏大,而且通常会回归到义务和责任的主线上。换句话说,这个话题很难短期内讨论清楚,但是在技术发展迅速而立法相对缺失的情况下,讨论是必需的 – 尤其是对于正在进行的大数据分析而言。
“大数据创新可以创造价值,我们要做的就是尽量降低风险。”Davis说。对于风险的定义,不同企业各有不同。但是,Davis相信所有企业都可以针对数据建立自身适用的道德规范:明确数据对于自身的价值;愿意讨论关于数据隐私和归属方面的政策;基于数据蕴含的价值付诸行动 – 同时,做好准备应对异议。
长期来说,只要在收集和利用数据方面有足够的透明度,就足以抵消各种异见和杂音。“很多企业对自身价值认识清晰并秉持开诚布公的态度,那么用户的忠诚度就不会受到影响。这一点从Patagonia(户外品牌)、Ben & Jerry(冰淇淋制造商)和Newman's Own(食品公司)就能看出来。”Davis说。
另外一个好处:对价值的共识可以促进创新。“问题从‘我们应该这么做吗?’变成了‘我们如何来做?’”Davis说。
个人数据和大企业数据
Davis认为,在大数据伦理这个话题上不要只盯着那些大公司。根据其对财富50强的研究,这些公司的数据政策在表述上各不相同。
没有任何单独的说明企业可以出售个人数据。相反,超过半数(34家)的公司声明不会在客户没有同意的情况下出售其数据。同样的,没有一家公司明确声明不会购买个人数据,其中有11家公司曾经购买过第三方数据。但是,是否有公司在购买数据时确认过没有侵犯数据所有人的隐私?
“这就是问题所在:既然出售行为不妥,那么购买行为怎么可能独善其身?”Davis表示。
大数据与透明度
对于在数据采集和使用上更加透明这件事,说来容易做起未必 – 遵守规则并取得客户信任是非常困难的。鉴于Davis自己也没有很全面的答案,他建议借鉴Umpqua银行的例子(一家美国西北部的地区性银行)。
“Umpqua一向以对客户友好著称,他们会播放流行音乐并给客户送饼干。”Davis说:“他们非常开放。”
客户会收到一份关于数据方面的政策说明(用Davis的话说,内容确实是用人类语言写的),其中描述了该银行是如何处理和保存客户信息的。
另一个案例是加州Orange县和Sierra Club(一个美国环境组织)之间旷日长久的法律诉讼,焦点在于是否向公众开放漆地理信息系统的地图。Orange县拒绝向Sierra Club开放其地图数据,其理由是GIS数据库属于计算机软件,并不在加州公共记录法(Public Records Act)的涵盖范围内。最终,该县输掉了官司,将不得不支付一百万美元的诉讼费用。
大数据与社交网络
根据Gartner(位于康涅狄格Stamford)分析师Elden Nelson最近的调查,对于CIO来说,回避Twitter或其他社交媒体的日子一去不复返了。原因主要在于:首先,不使用社交媒体的CIO无法理解企业的行为及其原因;其次,企业已经开始默认CIO是精于社交媒体的。
“在所有社交媒体相关的活动中,数据收集活动是一个特例。业务端会认为IT在这方面应该负起责任来,而IT端可能未必能有这个认知。”Nelson说。根据企业中业务端受访者的反馈,IT在社交媒体方面应该负责工具维护、策略制定和实施、数据分析等职责。
既然业务端已经默认IT在社交媒体上的角色,Nelson建议CIO们优先考虑这方面的工作。“IT需要站出来改变社交媒体游离于企业整体架构之外的现状,从系统全局角度进行规划、部署、使用和维护。”