百道网
 您现在的位置:Fun书 > 大数据主义
大数据主义


大数据主义

作  者:[美] 史蒂夫·洛尔(Steve Lohr) 著

译  者:胡小锐,朱胜超

出 版 社:中信出版集团

出版时间:2015年09月

定  价:49.00

I S B N :9787508653716

所属分类: 人文社科  >  经济  >  经济学读物  >  经济学理论、研究与通识    

标  签:经济  经济通俗读物  

[查看微博评论]

分享到:

TOP好评推荐   [展开]

TOP内容简介

  根据一项估计,人类历史上90%的数据都在过去两年中产生。2014年,国际数据公司预测,数据世界已增至4.4亿万亿字节。如果将如此庞大的信息量存储在苹果平板电脑ipad中,叠加起来的Ipad的厚度可达到地球到月球距离的2/3。这预示着我们已经进入了大数据时代。

  煤、铁和石油是推动工业革命进程的三大生产性资产,如今信息经济时代的主要原材料是大数据。

  在《大数据主义》一书中,作者解释了大数据技术将如何引发一场新的革命,促进新一轮经济效率的提高和创新。互联网规模的海量数据集将被用于几乎各个领域、各个行业和各个企业,以进行探索、预测和提高效益。《大数据主义》重点关注那些处于数据科学领域前沿的年轻企业家,还有诸如IBM等为公司前景而在数据科学领域押下极大赌注的行业巨头。

  《大数据主义》还介绍了新的技术革命将如何改变人类的决策方式——人们将更加依赖于数据和分析,而不是直觉和经验;同样,它还将改变领导力和管理的本质。

  该书对读者而言是一本行业指南,它预测了行业动向,详细解释了个人和组织应该如何利用、保护并管理大数据,从而在变幻莫测的未来仍能立于不败之地。

  大数据主义时代已经来临,我们是否做好了准备去应对它的好与坏?

TOP作者简介

  史蒂夫·洛尔(Steve Lohr),为《纽约时报》撰稿长达20多年,写作内容涉及技术、商业和经济三大领域,同时他还负责撰写《纽约时报》的科技博客Bits,曾采访过史蒂夫·乔布斯(这在《史蒂夫·乔布斯传》里面有所体现)。2013年,他所在团队获得普利策新闻奖。他还做过10年的海外记者,也当过编辑,为《纽约时报杂志》《大西洋月刊》《华盛顿月刊》等媒体撰稿。

TOP目录

序言

推荐序 IX

 

第1章 大数据到底有多“大”?

 我们已经进入大数据时代/ 006
 技术进步与摩尔定律/ 009
 大数据主义的兴起/ 013
第2章 人的潜力与数据的潜力
 一位年轻的明星数据科学家/ 025
 一个阅读兴趣广泛的“T型人”/ 028
 聪明人也会犯低级错误/ 039
 从华尔街到脸谱网/ 046
第3章 蓝色巨人与大数据的博弈
 大数据技术在医疗领域的应用/ 054
 IBM公司的大数据战略/ 060
 从“蓝色巨人”到“智慧的地球”/ 067
 大数据时代的企业生存法则/ 076
第4章 企业决策与数据挖掘
 数据、直觉与好的决策/ 093
 大数据将引发“管理革命”/ 103
 数据驱动型企业的赢利之道/ 109
第5章 数据科学的崛起与发展
 社交网络大数据的价值何在?/ 123
 用户数据分析技术是脸谱网的引擎/ 127
 数据科学家们的颠覆式创新/ 134
第6章 人工智能与机器学习
 厘清大数据中的相关关系和因果关系/ 153
 人类与人工智能的未来/ 162
 人工智能系统要学会讲故事/ 169
第7章 用大数据推动企业与行业发展
 当传统的葡萄酒业遇上大数据/ 180
 物联网与大型工业机器的数字化/ 188
 大数据可以产生巨大的经济效益/ 194
第8章 物理世界与数字世界的融合
 人与智能机器的合作博弈/ 205
 大数据营销的艺术与科学/ 215
 用大数据建立人类行为模型/ 225
第9章 医疗行业的大数据革命
 最棘手也是最有价值的问题/ 233
 建立数据驱动的医疗保健体系/ 239
 用数据杠杆撬动医疗行业的进步/ 247
第10章 大数据时代的隐私“黑洞”
 个人隐私权受到前所未有的挑战/ 262
 大数据会泄露多少我们的隐私?/ 268
 是个性化服务还是经济歧视行为?/ 272
 能精准量化人类性格特征的数据技术/ 278
 如何将隐私风险降至**?/ 286
第11章 大数据主义与美丽新世界
 大数据市场的野蛮生长/ 297
 大数据技术引发的关键思考/ 303

 

致谢/ 307

TOP书摘

序言

  大数据何以成为“主义”?

  数据者,有广义与狭义之分。狭义的数据,就是数字或数值,如1、2、3、4、5……;广义的数据,则可概括为人类观察、实验、计算等的记录。作为这些记录的符号,或数字,或文字,或图像,或音视频,从上古时代的结绳记事、楔形文字、甲骨文,到古代乃至现代以竹简、布帛、羊皮、纸张等为载体的图文,直至现在以比特为单位的电子信息,可谓无所不包。

  也许,正是由于互联网技术工程师们习惯于把以电子信息方式存在的内容统称为“数据”,于是,“数据”一词便由狭义的“数字”或“数值”演变为主要指向通用的广义“数据”。

  随着计算机、互联网、现代通信以及相关软硬件技术的飞速发展,大数据和云计算,如同一枚硬币不可分离的两面,成为我们这个时代的高频词。

  大数据之大,不仅大在巨量或海量——由人们熟知的千字节(KB)、兆(MB)、千兆(GB)和太字节(TB),跃升为专业人士才了解的拍字节(PB)、艾字节(EB)、泽字节(ZB),乃至尧字节(YB)。(1KB=1 024B,1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,1PB=1 024TB,1EB=1 024PB,1ZB=1 024EB,1YB=1 024ZB)。其中,不变的是基本单位B,即比特或字节,而从K到Y,则是成千倍的递增,以致有人据此宣称,目前的数据计算已经进入“PB时代”。

  大数据之大,还大在数据结构的有容乃大——它不再需要传统的数据库表格来整齐排列,几乎可以无所不包地记录、存储和计算各种规则的结构化数据和不规则的非结构化数据,于是便有了逐步演变为一个数字化世界的可能。

  如此庞大和复杂的数据,远远超出传统计算机的处理能力,于是,建立在互联网基础上的云计算技术应运而生,承担起存储、传输、计算和应用大数据的重任。而正是大数据与云计算的有效互动,打开了世界观、方法论乃至价值观的新视野。

  在本书中,作者引用专业研究机构的统计,揭示了大数据的规模与速度:一方面,到2014年,全世界电子化数据已增至4.4ZB,即4.4亿万亿字节,如果将如此之巨的信息量存入只有7.5毫米厚的苹果平板电脑,后者叠加起来的厚度可达地球与月球间距离的2/3;另一方面,有史以来90%的数据量,都是在过去两年的时间里产生的。

  由此不难预期,一个电子化的、独立于物质世界的“数字世界”,正在大数据和云计算的互动中迅速构建,它虽然不可能穷尽物质世界全部存在,越来越逼近物质世界本体却是不争的事实。

  尤为值得注意的是,许许多多以往被闲置的数据,由于一些精明商家的开发和利用,开始“变废为宝”。一个耳熟能详的案例,就是那个“尿片+啤酒”的商业发现与行动。世界最大零售商沃尔玛通过大数据统计和分析发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒,于是推出将啤酒和尿片捆绑销售的促销手段,从而有效提高了啤酒销量。

  凡此种种表明,如同宇宙大爆炸般飞速扩张的“数字世界”,不仅日益成为外在的客观物质世界的“镜像”,而且正在越来越多地包含了对人类自身行为的追踪和记录,成为人类观察和认识自我的“镜子”。

  二者的叠加,形成一个有趣的悖论:由大数据构筑而成的数字世界,在日趋脱离客观物质世界的同时,又越来越接近世界的本原。因此,人们在解码这样一个虚拟世界的同时,也在一定程度上改变着对世界的看法。

  然而,就在哲学家们对数字世界的属性还没有来得及给出明确界定之际,为利益所驱动的商家们却迫不及待地启动了对这一新矿藏的发掘。

  他们是如此的急切:还没来得及弄清两个相关现象之间的互动机理或因果关系,便急匆匆地将其中的商机转化为提升经济效益的手段;云计算技术刚刚出现,便迅速地将统计分析对象由随机采样拓展为可获取的全部数据;为寻求“大数据的高效率”,不惜置“小数据的精确度”于不顾……

  回过头来看,正是这近乎“饥不择食”的匆忙,竟在无意中成就了认识数字世界的锁钥:不再执着于因果关联,不再满足于抽样分析,不再一味地追求精确度的提高,转而直面模糊与混杂,关注看似不相关的相关现象。这一系列有别于以往的方法,为人类认识世界、解决问题提供了传统工具箱中没有的新工具。

  诚如史蒂夫·洛尔在本书中的比喻,这些大数据时代的新工具,犹如“望远镜”或“显微镜”。“望远镜”让人们看得更远,发现新的星系;“显微镜”则将比细胞更加微小的世界展示在人们面前。人们据此看到并计量之前一无所知的事物。

  抛开学术和技术层面的研讨,大数据及其应用几乎与生俱来就伴随了喋喋不休的争论。

  其中有两个关键词,一是“开放”,一是“保护”。如果说开放就是要打破垄断分割,推动信息与数据互联互通;变革体制机制,实现数据资源共有共享;鼓励技术创新,促进大数据资源开发利用……最大限度地拓展数字世界“公共空间”,让大数据和云计算普惠大众,造福人类;那么保护则意味着要在数字世界为个人留下一方“私密领地”,或者为公权力划上一道不能逾越的“红线”——“风可进,雨可进,国王不能进”。

  开放与保护,“公共空间”与“私密领地”,在这里构成既对立又统一的关系。对立在开放与保护“井水不犯河水”,统一在“公共空间”与“私密领地”共存于同一个数字世界,且双方都以对方的存在为自身存在的证据,正所谓没有“公”即没有“私”,没有“私”亦没有“公”。

  一言以蔽之,数字世界与现实世界理应奉行同样的价值理念:该开放的一定要最大程度开放,该保护的必须严格加以保护。

  本书向读者展示了这样一幅图景:不管你自觉还是不自觉,乐意还是不乐意,大数据正以空前的速度和规模渗透到人类社会生活的方方面面,它在一定程度上已经和正在改变人们观察、认识、思考乃至生存与发展的方式。特别是这后一方面的变化,或许就是“大数据”之所以成为“主义”的原因。

  大数据何以成为“主义”?

  数据者,有广义与狭义之分。狭义的数据,就是数字或数值,如1、2、3、4、5……;广义的数据,则可概括为人类观察、实验、计算等的记录。作为这些记录的符号,或数字,或文字,或图像,或音视频,从上古时代的结绳记事、楔形文字、甲骨文,到古代乃至现代以竹简、布帛、羊皮、纸张等为载体的图文,直至现在以比特为单位的电子信息,可谓无所不包。

  也许,正是由于互联网技术工程师们习惯于把以电子信息方式存在的内容统称为“数据”,于是,“数据”一词便由狭义的“数字”或“数值”演变为主要指向通用的广义“数据”。

  随着计算机、互联网、现代通信以及相关软硬件技术的飞速发展,大数据和云计算,如同一枚硬币不可分离的两面,成为我们这个时代的高频词。

  大数据之大,不仅大在巨量或海量——由人们熟知的千字节(KB)、兆(MB)、千兆(GB)和太字节(TB),跃升为专业人士才了解的拍字节(PB)、艾字节(EB)、泽字节(ZB),乃至尧字节(YB)。(1KB=1 024B,1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,1PB=1 024TB,1EB=1 024PB,1ZB=1 024EB,1YB=1 024ZB)。其中,不变的是基本单位B,即比特或字节,而从K到Y,则是成千倍的递增,以致有人据此宣称,目前的数据计算已经进入“PB时代”。

  大数据之大,还大在数据结构的有容乃大——它不再需要传统的数据库表格来整齐排列,几乎可以无所不包地记录、存储和计算各种规则的结构化数据和不规则的非结构化数据,于是便有了逐步演变为一个数字化世界的可能。

  如此庞大和复杂的数据,远远超出传统计算机的处理能力,于是,建立在互联网基础上的云计算技术应运而生,承担起存储、传输、计算和应用大数据的重任。而正是大数据与云计算的有效互动,打开了世界观、方法论乃至价值观的新视野。

  在本书中,作者引用专业研究机构的统计,揭示了大数据的规模与速度:一方面,到2014年,全世界电子化数据已增至4.4ZB,即4.4亿万亿字节,如果将如此之巨的信息量存入只有7.5毫米厚的苹果平板电脑,后者叠加起来的厚度可达地球与月球间距离的2/3;另一方面,有史以来90%的数据量,都是在过去两年的时间里产生的。

  由此不难预期,一个电子化的、独立于物质世界的“数字世界”,正在大数据和云计算的互动中迅速构建,它虽然不可能穷尽物质世界全部存在,越来越逼近物质世界本体却是不争的事实。

  尤为值得注意的是,许许多多以往被闲置的数据,由于一些精明商家的开发和利用,开始“变废为宝”。一个耳熟能详的案例,就是那个“尿片+啤酒”的商业发现与行动。世界最大零售商沃尔玛通过大数据统计和分析发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒,于是推出将啤酒和尿片捆绑销售的促销手段,从而有效提高了啤酒销量。

  凡此种种表明,如同宇宙大爆炸般飞速扩张的“数字世界”,不仅日益成为外在的客观物质世界的“镜像”,而且正在越来越多地包含了对人类自身行为的追踪和记录,成为人类观察和认识自我的“镜子”。

  二者的叠加,形成一个有趣的悖论:由大数据构筑而成的数字世界,在日趋脱离客观物质世界的同时,又越来越接近世界的本原。因此,人们在解码这样一个虚拟世界的同时,也在一定程度上改变着对世界的看法。

  然而,就在哲学家们对数字世界的属性还没有来得及给出明确界定之际,为利益所驱动的商家们却迫不及待地启动了对这一新矿藏的发掘。

  他们是如此的急切:还没来得及弄清两个相关现象之间的互动机理或因果关系,便急匆匆地将其中的商机转化为提升经济效益的手段;云计算技术刚刚出现,便迅速地将统计分析对象由随机采样拓展为可获取的全部数据;为寻求“大数据的高效率”,不惜置“小数据的精确度”于不顾……

  回过头来看,正是这近乎“饥不择食”的匆忙,竟在无意中成就了认识数字世界的锁钥:不再执着于因果关联,不再满足于抽样分析,不再一味地追求精确度的提高,转而直面模糊与混杂,关注看似不相关的相关现象。这一系列有别于以往的方法,为人类认识世界、解决问题提供了传统工具箱中没有的新工具。

  诚如史蒂夫·洛尔在本书中的比喻,这些大数据时代的新工具,犹如“望远镜”或“显微镜”。“望远镜”让人们看得更远,发现新的星系;“显微镜”则将比细胞更加微小的世界展示在人们面前。人们据此看到并计量之前一无所知的事物。

  抛开学术和技术层面的研讨,大数据及其应用几乎与生俱来就伴随了喋喋不休的争论。

  其中有两个关键词,一是“开放”,一是“保护”。如果说开放就是要打破垄断分割,推动信息与数据互联互通;变革体制机制,实现数据资源共有共享;鼓励技术创新,促进大数据资源开发利用……最大限度地拓展数字世界“公共空间”,让大数据和云计算普惠大众,造福人类;那么保护则意味着要在数字世界为个人留下一方“私密领地”,或者为公权力划上一道不能逾越的“红线”——“风可进,雨可进,国王不能进”。

  开放与保护,“公共空间”与“私密领地”,在这里构成既对立又统一的关系。对立在开放与保护“井水不犯河水”,统一在“公共空间”与“私密领地”共存于同一个数字世界,且双方都以对方的存在为自身存在的证据,正所谓没有“公”即没有“私”,没有“私”亦没有“公”。

  一言以蔽之,数字世界与现实世界理应奉行同样的价值理念:该开放的一定要最大程度开放,该保护的必须严格加以保护。

  本书向读者展示了这样一幅图景:不管你自觉还是不自觉,乐意还是不乐意,大数据正以空前的速度和规模渗透到人类社会生活的方方面面,它在一定程度上已经和正在改变人们观察、认识、思考乃至生存与发展的方式。特别是这后一方面的变化,或许就是“大数据”之所以成为“主义”的原因。

TOP 其它信息

加载页面用时:44.9364