要把“大数据”转变为文化符号

在这本书中,涂子沛把美国200多年的历史划分为七个时代,即初数时代、内战时代、镀金时代、量化时代、抽样时代、开放时代及大数据时代。通过讲述美国各个历史阶段内发生的具有代表性的事件,深度剖析了数据及数据应用在美国历史上所发挥的重要作用,透过数据看历史,展现了数据文化的形成和发展进程。

image.png

内容简介

作者认为,美国之所以繁荣鼎盛,数据文化根基牢不可破概是主因之一。基于此,这本书从美国建国之基讲起,以数据的视角,描述了美国不同时代的特征,系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处,展望了未来数据世界的远景,并呼吁中国普及数据文化。

数据治国:从人口普查到民意调查

数据治国理念在美国深入人心,而美国开国时期的人口普查是美国数据治国的起点。美国的建国者认为,国家权利应该在人口之间平均分配,而在分权之前,需要把国民数量算清楚,要开展人口普查。由此美国成为全世界最早定期开展人口普查的国家,并因此开创了现代意义上的人口普查制度。美国使用“数据”的初衷是通过数据分权,创造性应用人口数据成就了美国的民主共和制。但涂子沛认为,这一体制一旦确定,“其中蕴含的自由思考和平等讨论精神,又开始反哺美国社会的数据文化,成为美国社会数据文化不断发展的重要驱动力”。

美国的政治制度对统计的影响,除了“用数据分权”,美国的选举制度也推动了统计的创新以及数据知识的普及。以调查数据为依据,预测选举结果,即民意调查,逐渐成为大众政治生活中的重要内容。

20世纪30年代,《文学文摘》杂志成功预测了1920年、1924年、1928年、1932年连续四届总统大选的结果,把民意调查的可信度推到了前所未有的高度。然而《文学文摘》却在1936年的总统预测中败给了乔治·盖洛普(George Gallup)。盖洛普以5000个样本量的“科学抽样”调查,以小见大,成为民意调查领域的一匹黑马。他还将他的抽样方法从政治领域推广到商业领域。通过他的调查,盖洛普成功地帮助《乱世佳人》电影制片人、剧组和发行商确定了电影时长、是否分为上下集、黑白还是彩色、电影广告的设计、是否由费雯·丽担任女主角等一系列争议问题,并预测《乱世佳人》的观众将达到5650万,这和最终结果(5997万)相距不到6%。凭借精确的市场调查和数据推演,盖洛普把数据带进了美国的电影行业,开启了市场调查的新时代。数据驱动的决策方法,在今天已经成为美国电影制片人的常规武器。

不论是治国理政、社会治理,还是商业运作、技术创新,涂子沛总是能够发掘出数据改变观念、改造社会、改革制度的故事。

数据之巅:从计算社会到智能社会

数据的产生源于人类对精确描述客观世界的需求。除了描述世界,数据还是我们改造世界的重要工具。人类的一切生产、交换活动,可以说都是以数据为基础展开的,比如度量衡、货币的背后都是数据,它们的发明和出现,都极大地推动了人类文明的进步。而大数据是人类文明新的土壤,在这片土壤之上,人类将开始建设一个智能社会。

书中认为,大数据成因有三:进入社交媒体时代让人类生产数据的能力增强;摩尔定律催生的硬件技术飞速发展使得人类保存数据的能力增强;数据分析、数据挖掘等技术让人类使用数据的能力增强。有数据就会有计算,对数据的分析、挖掘等处理都可以看作是一种计算,大数据时代最大的亮点就是人和社会的计算,越来越多的社会问题都将通过对数据的计算得以解决。可以说,进入大数据时代就进入了计算社会。

大数据的作用还不仅如此。数据是信息的载体,信息是知识的来源,知识是智能的基础。用数据训练机器,赋予机器智能,为人类提供自动化的服务。未来,大数据将推动人类迈进智能社会,这才是人类使用数据的巅峰状态。

“未来已经来到我们中间,只是还没有均匀地分布到生活的各个角落。”如今,我们可以从交通、医疗、家居、制造等很多领域看到智能社会的端倪。机器智能将体现在人类生活、工作的方方面面,并最终交会于一个点上,这个点就是城市。智慧城市概念的提出,可视为人类向智能社会迈进的先声。

从2008年IBM董事长彭明盛提出“Smart City”的概念,到如今,全球智慧城市建设方兴未艾。世界各国对智慧城市的定义和标准不同,但都少不了技术支持、市民参与、政策配套这三个要素。智慧城市的建设,各国面对的挑战不尽相同。围绕这三要素来说,技术问题是最容易解决的问题,更大的困难还在于城市建设。例如,为了配合无人驾驶汽车的普及,城市道路必须进行大改造,而无人驾驶汽车上路的相关法律也需要出台。这些问题指向的都是政府。各国政府如何应对这些挑战,将决定它们如何跃进到下一个社会形态。书中认为,对于中国来说,建设滞后的主要原因还是文明与观念。

数据布道:从科技符号到文化符号

除了讲述不同时代美国的数据故事,在每一章的最后,书中都会转向对同时期中国大数据发展的关注。

在讲到美国南北战争时期,谢尔曼将军根据当时人口普查提供的丰富数据资料,确定最佳的行军路线和在各地停留的时间,取得的胜利成为了南北战争后期重要的转折点。对比中国历史上,孙膑“减灶计”破庞涓于马陵,虞诩“增灶计”惑敌得增援,林彪从战报数据中分析出敌情等以“数”谋胜的战例不少,书中认为,与谢尔曼相比,中国人使用数据的方式与其存在差距,究其根源,是中国几千年的文明史中,没有建立系统收集数据的制度。

日本“二战”后的崛起也跟数据应用有密切的关系。通过学习美国人爱德华兹·戴明的运用统计数据分析提高产品质量的管理方法,日本制造的产品质量快速提升,逐渐占领国际市场,日本制造业和经济迅速崛起。日本的崛起,引发了美国人“日本行,为什么我们不行?”的自我反省。面对这个问题,我们中国人又会有怎样的思考?书中认为,用数据来改善、控制产品质量只是一种方法和手段,我们应该学习的,是日本人对待先进文明的胸怀和态度,提升“中国制造”的质量,更需要数据思维和数据文化。

每一次对中国大数据发展的分析和思考,都体现了涂子沛对中国数据文化匮乏的叹息和迫切呼吁。他认为,一切竞争归根到底是国民文化和素质的竞争。数据文化是尊重事实、强调精确、推崇理性和逻辑的文化。

美国的数据文化也不是一蹴而就的,而是不同时期对数据的需求,不断推动数据思维的变革、数据技术的发展、数据文化的形成。随着计算机、智能手机、可穿戴设备等技术的逐渐普及,人们对大数据的接触、产生和使用越来越频繁,中国的大数据土壤正在形成。涂子沛认为,当前信息技术的发展,已经让中国获得了后发优势,中国要建设世界强国、在大数据时代的全球竞争中胜出,必须把大数据从科技符号提升成为文化符号,在全社会普及数据文化。

image.png

涂子沛,江西吉安人,本科毕业于华中科技大学,研究生毕业于中山大学、卡内基梅隆大学,曾在美国学习、生活多年。先后担任中国旅美科技协会副主席、中国旅美科技协会匹兹堡分会主席,在国内有上海真爱梦想公益基金会理事、中国人民大学中国调查与数据中心客座研究员等兼职。2014年12月任阿里巴巴副总裁。著有《大数据》《数据之巅》《数文明》。

文 / 张春婵

精彩推荐

下载安装手机客户端