百道网
 您现在的位置:Fun书 > 数据之巅:大数据革命,历史、现实与未来(精装)
数据之巅:大数据革命,历史、现实与未来(精装)


数据之巅:大数据革命,历史、现实与未来(精装)

作  者:涂子沛 著

出 版 社:中信出版集团

出版时间:2014年04月

定  价:65.00

I S B N :9787508644660

所属分类: 人文社科  >  管理  >  管理读物  >  企业管理    

标  签:管理  管理信息系统  

[查看微博评论]

分享到:

TOP好评推荐   [展开]

书评书荐

TOP内容简介

数据,自古就有,人口普查、土地丈量、军事战争、政治计算……数据虽小,却有助于治国安邦。美国之所以繁荣鼎盛,数据文化根基牢不可破概是主因之一。
互联互通、信息爆炸、智慧城市时代,大数据,更以排山倒海之势席卷全球,政府施政、企业掘金,大众要公平与正义,大数据被赋予了新的历史使命。
在这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描述了一幅数据文化、智慧文化的全景画面。全书从美国的数据文化根基开始讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代的数据文化特征,以数据分权、人口普查、土地丈量、数据远征、数据审判等历史事件为主线、系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处。
“尊重事实,用数据说话”,从科技符号演变为文化符号,形成一种文化话语体系,大数据,正在撬动中国的制度创新、科技创新。
阅读此书,历史与现实相互融合,知识与激情相互交织,思想与观念相互碰撞,未来与前景必定豁然开朗。 

TOP作者简介

涂子沛,开中国大数据之先河,知名信息管理专家、专栏作家。首次提出大数据从科技符号转变成文化符号的话题。他认为中国之所以落后,原因之一是中国没有重视数据文化的传统。为此,他以历史的使命感,一直在推动中国数据文化的形成,并认为对中国来说,这是一件极其有意义的事情。历史学家许倬云先生更是盛赞其“为华文世界开创了一个重要话题”。受到中央电视台等多家媒体专访,其著作《大数据》在中国引起了对大数据战略、数据治国和开放数据的讨论。
他毕业于华中科技大学、卡内基梅隆大学。曾担任中国旅美科学技术协会副主席、中国旅美科技协会匹兹堡分会主席。他现居住于美国硅谷。 

TOP目录

推荐序言一 许倬云

推荐序言二 郭为

 

第一部分 小数据时代

第一章 初数时代:数据文化的根基

克服民主的劣势:用数据分权

制度创新:变对抗为合作的魔法棒

两党之争:无法精确分割的权力

阿拉巴马悖论:没有完美的方案

几何平均数的优越性

有数初成:共和政治反哺数据文化

专制文化对数学发展的限制

中国往事:第一次现代意义上的人口普查

第二章 内战时代:数据是一座灯塔

人口普查:南方最大的敌人

用数据辩论:南北战争的序幕

用数据远征:向大海进军

政治计算:解放黑奴的真正原因

兵家和数据:中国历史上的吉光片羽

数据和数字

第三章 爆发:镀金时代的三重崛起

用数据预测:转变思维方式

总统之死:专业化的悲情序曲

世纪巅峰:大数据驱动的创新

和政治分家:劳工统计的异军突起

姑娘、棉花和数据:究竟谁在推动历史

尘封的瑰宝:中国的数据可视化先驱

第四章 量化:进步时代的数据大潮

匹兹堡的城市转型经验

冲击量化的极限:给生命定价

“平托”风波:福特公司的道德危机

用数据来审判:理性的必然选择

代理人需要监督:成本收益分析方法的未来

思考中国话题:民族复兴能否量化?

第五章 抽样时代:统计革命的福祉

从选票到电影票:和《乱世佳人》共舞

用数据跨界:质量大师是怎样炼成的

旋转质量的飞轮:日本崛起

世纪之问:日本行,为什么我们不行?

 

第二部分 大数据的崛起

第六章 开放时代:内开放的历程

内开放1.0:数据承载知情权

内开放2.0:用数据制衡

悲剧现场的第一个问题:普查局的数据之痛

LEHD 项目:开放数据的使用权

内开放3.0:用数据推动创新

2012 年:来自中国的组织创新

第七章 大数据时代:通往计算型的智能社会

世上本没有数:正解大数据

改变世界的三股力量:大数据的成因

有数据,还要有计算:计算型社会的兴起

普适计算:即将到来的超级数据爆炸

数据和计算:第三次工业革命的CPU

数据之巅:通向智能型社会的挑战

第八章 智慧城市:正在拍打世界的浪潮

西方和东方:聪明和智慧目标

锁定“平台”:神州数码对话录

众包、众智和众创:让大众解决大众的问题

云、隐私和未来:中国和美国的不同挑战

结语 把科技符号变成文化符号

 

后记 

TOP书摘

第七章 大数据时代:通往计算型的智能社会
大数据是人类文明新的土壤,在这片土壤之上,人类将开始建设一个智能社会。
—本书作者,2014年
世上本没有数:正解大数据
传统意义上的“数据”,是指“有根据的数字”,数字之所以产生,是因为人类在实践中发现,仅仅用语言、文字和图形来描述这个世界是不精确的,也是远远不够的。例如,有人问“姚明有多高”,如果回答说“很高”、“非常高”、“最高”,别人听了,只能得到一个抽象的印象,因为每个人对“很”、“非常”有不同的理解,“最”也是相对的,但如果回答说“2.26米”,就一清二楚。除了描述世界,数据还是我们改造世界的重要工具。人类的一切生产、交换活动,可以说都是以数据为基础展开的,例如度量衡、货币的背后都是数据,它们的发明和出现,都极大地推动了人类文明的进步。
数据最早来源于测量,所谓“有根据的数字”,是指数据是对客观世界测量结果的记录,而不是随意产生的。测量是从古至今科学研究最主要的手段,可以说,没有测量,就没有科学;也可以说,一切科学的本质都是测量。就此而言,数据之于科学的重要性,就像语言之于文学、音符之于音乐、形色之于美术一样,离开数据,就没有科学可言。
除了测量,新数据还可以由老数据经计算衍生而来。测量和计算都是人为的,也就是说,世上本没有数,一切数据都是人为的产物。我们说的“原始数据”,并不是“原始森林”这个意义上的“原始”,原始森林是指天然就存在的,而原始数据仅仅是指第一手的、没有经过人为修改的数据。
传统意义上的数据,和信息、知识也是完全不同的概念:数据是信息的载体,信息是有背景的数据,而知识是经过人类的归纳和整理,最终呈现规律的信息。
图7–1 传统意义上的数据和信息的区别
但进入信息时代之后,“数据”二字的内涵开始扩大:不仅指代“有根据的数字”,还统指一切保存在电脑中的信息,包括文本、图片、视频等。其中的原因是,20世纪60年代软件科学取得了巨大进步、发明了数据库,此后,数字、文本、图片都不加区分地保存在电脑的数据库中,数据也逐渐成为“数字、文本、图片、视频”等的统称,也即“信息”的代名词。
文本、音频、视频本身就已经是信息,而且其来源也不是对世界的测量,而是对世界的一种记录,所以信息时代的数据又多了一个来源:记录。
图7–2 数据的三大来源
图7–3 现代意义上的“数据”:范畴比信息还要大
注:进入信息时代之后,数据成为信息的代名词,两者可以交替使用。一封邮件虽然包含很多条信息,但从技术的角度出发,可能还是“一个数据”,就此而言,现代意义上的数据的范畴,其实比信息还大。
除了内涵的扩大,数据库发明之后,还出现了另外一个重要现象,那就是数据的总量在不断增加,而且增加的速度不断加快。
20世纪80年代,美国就有人提出了“大数据”的概念。这个时候,其实还没有进入数据大爆炸的时代,但有人预见到,随着信息技术的进步,软件的重要性将下降,数据的重要性将上升,因此提出“大数据”的概念。这时候的“大”,如“大人物”和“大转折”之“大”,主要指价值上的重要性;到了21世纪前10年,尤其是2004年社交媒体产生之后,数据开始爆炸,大数据的提法又重新进入大众的视野并获得了更大的关注。这个时候的“大”,含义也更加丰富了:一是指容量大,二是指价值大。
从这个角度出发,大数据可以首先理解为传统的小数据加上现代的“大记录”,这种大记录的主要表现形式是文本、图片、音频、视频等,和传统的测量完全是两回事。而且大数据之所以“大”,主要是“大记录”的增长,基于信息技术的进步,人类记录的范围在不断扩大:
大数据 = 传统的小数据 + 现代的大记录
(源于测量) (源于记录)
但到底多大才算大呢?针对这一问题,十多年来争议颇多。这首先涉及衡量数据大小的单位,2000年的时候,一般认为,“太”(T)级别的数据就是大数据了,当时拥有“太”级别数据的企业并不多,但自此之后,互联网企业开始崛起,这些企业拥有各种各样的数据,其中大部分都是文本、图片和视频,其数据量之大,传统企业根本无法望其项背。
理解几个主要的存储单位
一首音乐 ≈ 4兆(M)
一部电影 ≈ 1吉(G,1吉=1 024兆,相当于250首歌曲的大小)
一个普通图书馆的藏书 ≈ 1太(T,1太=1 024吉,相当于1 024部电影的大小)
我认为,不仅仅是互联网行业,其实各行各业的数据都在爆炸,只是规模不同。如果仅仅把大数据的标准限定在互联网企业,认为只有互联网企业才拥有大数据,那就严重窄化了大数据的意义。毕竟容量只是表象,价值才是本质,而且大容量并不一定代表大价值,大数据的真正意义还在于大价值,价值主要是通过数据的整合、分析和开放而获得。大数据是指人类有前所未有的能力来使用海量的数据,在其中发现新知识、创造新价值,从而为社会带来“大知识”、“大科技”、“大利润”和“大智能”等发展机遇。
以上论述,是从概念上分析“数据”和“大数据”的区别,而掌握一个概念最好的方法,还是从动态上了解其成因。大数据的成因,还是人类信息技术的进步,而且是信息技术领域不同时期多个进步交互作用的结果,其中最重要的原因,当数摩尔定律。
改变世界的三股力量:大数据的成因
1965年,英特尔的创始人之一戈登·摩尔(Gordon Moore)在考察了计算机硬件的发展规律之后,提出了著名的摩尔定律。该定律认为,同一面积芯片上可容纳的晶体管数量,一到两年将增加一倍。1
要理解这种增加的意义,并不简单。摩尔的本意是,由于单位面积芯片上晶体管的密度增加了,计算机硬件的处理速度、存储能力,即其主要性能一到两年将提升一倍。本来性能提升了,价格也应该上升才对,但现实却很诡异:半个多世纪以来,硬件的性能不断提高,价格却持续下降。之所以这样,竟然还是因为晶体管越做越小,这种体积的缩小也导致其成本下降,再加上人类对晶体管的需求越来越大,大规模的生产也导致价格不断下降。
回顾这半个多世纪的历史,硬件的发展基本符合摩尔定律。以物理存储器为例,其性能确实不断上升,与此同时,价格不断下降。1955年,IBM推出了第一款商用硬盘存储器,一兆字节的存储量需要6 000多美元,此后,其价格不断下降:1960年,一兆字节下降到3 600美元;1993年,下降到大概1美元;2000年,再降至1美分左右;到2010年,每兆价格约为0.005美分。半个多世纪,存储器的价格下降了1亿多倍,这种变化的速度既巨大又剧烈,令人瞠目结舌。事实上,考察人类全部的历史,没有其他任何一种产品的价格下降空间能够如此巨大!
图7–4 1971~2011年中央处理器上的晶体管数量和摩尔定律
注:纵坐标为晶体管数量,横坐标为年份。该曲线表明,在1971~2011年,大概每两年相同面积的中央处理器集成电路上的晶体管数量就增加1倍。需要注意的是,纵坐标从2 300到10 000再到
100 000,其实不成比例,如果严格按比例作图,这将是一条非常陡峭的曲线,页面将无法容纳。(资料来源:维基百科)
晶体管的产量多过全世界的大米颗粒
…… 

TOP 其它信息

装  帧:平装

页  数:352

版  次:1

开  本:16开

加载页面用时:62.5074