在短短的几十年里,“技术天才”与社会的关系已经改变:他们从关在屋里的孤独者变成救世主,从反社会者变成社会的最大希望。许多人现在似乎相信,理解我们这个世界的最佳方式,就是坐在电脑屏幕前分析我们称之为“大数据”的海量信息。
但他们错了,因为如果没有“厚数据”(丰富的、具有前后关联性的数据,它们只能通过丢开电脑、深入实际生活才能获得),大数据就没有意义。电脑极客们曾经因为不能适应社会生活而被嘲笑,他们被告知应该“多出去走走”。实际上,如果大数据的信徒们希望理解这个他们也在参与塑造的世界,他们真的需要多出去走走。
谷歌的失败与算法无关
对很多人来说,“谷歌流感趋势”已经成为大数据的一个典型代表,它表现了大数据的巨大力量。
“谷歌流感趋势”的目的是:找出人们在流感季节常用的搜索词,然后实时跟踪这些搜索词的使用高峰期。这样,谷歌就可以在新流感爆发之前发出警报,而且预警时间要比官方疾病防治中心的预警时间早大约两周。
然而,著名的《科学》杂志本月刊登一篇文章告诉我们,自2011年8月以来,“谷歌流感趋势”几乎每周都会高估流感的盛行率。而在2009年,就在“谷歌流感趋势”推出后不久,它竟然完全没有察觉猪流感的爆发。
许多人争论道,“谷歌流感趋势”的失败缘于大数据的不成熟。然而,大数据鼓吹者真正的狂妄之处不在于对一套不成熟的算法过于自信,而在于盲目地相信坐在电脑屏幕前捣鼓一些数字就可以充分理解世界。
厚数据才能真正认识世界
大数据仅仅是大量的“薄数据”,它们通过对人们的活动和行为进行跟踪而获得。如果你对一个领域高度熟悉,有能力填补信息空白并想象人们的行为原因,那么“薄数据”将是有用的。如果缺乏对行为情境的了解,就不可能推出任何因果关系,也不可能理解人们的行为原因。
为了真正地了解人,我们不仅需要大数据,而且需要厚数据。厚数据不仅包括事实,而且包括事实的前后联系。比如说,美国有86%的家庭每周会喝掉6夸脱以上的牛奶,但是她们为什么喝牛奶?他们是怎么喝的?一块包含三种颜色、绣着星星和条纹图案的布,这是薄数据;一面在风中飘扬的美国国旗,这是厚数据。
基于“我们做了什么”,大数据对我们进行简单化的理解;厚数据则试图通过我们与周围世界的联系来理解我们。只有理解人与周围世界的联系,人们才能从整体上认识这个世界。
没有哪一个单独的工具能够成为理解人类的超级武器。尽管硅谷有许多出色的发明,不过我们对任何数字技术的期望都应该有个限度。“谷歌流感趋势”真正教给我们的是:不能仅问这些数据有多“大”,还要问这些数据有多“厚”。
有时我们必须要丢下电脑,走进真实生活会得到更好的结果。