百道网
 您现在的位置:Fun书 > 决战大数据:驾驭未来商业的利器
决战大数据:驾驭未来商业的利器


决战大数据:驾驭未来商业的利器

作  者:车品觉 著,安烨 编

出 版 社:浙江人民出版社

丛 书:湛庐文化

出版时间:2014年03月

定  价:45.90

I S B N :9787213060007

所属分类: 人文社科  >  管理  >  管理读物  >  企业管理    

标  签:

[查看微博评论]

分享到:

TOP好评推荐   [展开]

TOP内容简介

你也许对“大数据”已经有所耳闻,但是你是否真的了解“大数据”的奥秘?你是否了解无线数据对当今商业的影响?你是否洞察到了大数据背后企业经营实质的变革?你是否能真正识别数据的盲点和噪音、抓住了海量信息中的核心信息……当这些问题摆在你眼前时,你还认为自己了解“大数据”吗?

《决战大数据》将视角投入到了“大数据实践”的领域,对数据收集、数据化运营、运营数据、无线数据、数据盲点和噪音、数据分类和数据价值等大数据应用的热点问题做出了详细的解答,提出了“用大数据创建商业未来”的前瞻性建议,创建了一整套系统的数据应用法则。同时,《决战大数据》首次揭开阿里巴巴数据应用的神秘面纱,解密了其数据运营中的“三板斧”、“三利剑”和“化骨绵掌”等终极法宝,对于当今绝大多数的企业来说十分有借鉴意义。

《决战大数据》是继经典畅销书《大数据时代》之后聚焦中国大数据实践的重磅新作。 

TOP作者简介

车品觉,国内大数据实践先行者、数据观察家。现任阿里巴巴集团商业智能部副总裁、数据委员会会长。

拥有多元化与国际化的教育背景:生于香港,在美国、英国、澳洲等地接受西方教育,曾于新南威尔士大学、斯坦福大学、INSEAD商学院及清华大学经管学院等世界一流学院进修。

拥有丰富的数据实战经验与独特的数据化思维:曾先后在汇丰银行、香港电讯盈科、微软、易趣等多家著名跨国公司任总监职务。对电子商务未来趋势有独到见解,是一名未来趋势观察家和实战型培训师。 

TOP目录

前言   忘掉大数据

 

第一部分 从数据化运营到运营数据
01 大数据,为什么很多人只会谈,不会做
大数据从来不是免费的午餐
人的断层
模型数据从何而来
更主动的管理,更多的创新
【数据化思考】 问题就是答案


02 大数据的本质就是还原用户的真实需求
识别,让似是而非的行为数据串联起来
价值,企业价值 Vs 客户价值
场景,你知道当时所有的场景吗
还原是一个瞄准器
【数据化思考】CEO们关心哪三个数据


03 “活”的数据才是大数据
“活”做数据收集,抓住相关性
“活”看数据指标,动态地使用数据
【数据化思考】 别再做碰巧游戏


04 无线数据,大数据的颠覆者
无线数据正在将整个数据变成“噪音”
PC 数据与无线数据的关系
多屏思维下的电子商务
【数据化思考】 样本的偏见

05 数据分类与数据价值,什么才是你的核心数据
数据分类为什么如此重要
数据分类的 4 大维度
数据的 5 大价值
【数据化思考】 用傻瓜的角度去观察

06 从用数据到养数据
数据应用因小而美
把数据放进“框”之中
如何用框架来做决策
养数据,重要的数据战略
【数据化思考】 远离“或”选择

07 数据的盲点,负面数据的力量
数据盲点
小偷思维
数据盲点的价值
【数据化思考】 为什么数据会骗人:常态、时态与变态
第二部分 阿里巴巴的大数据秘密
08 阿里巴巴的大数据实践
假定数据是稳定的
假定数据是可获取的
【数据化思考】 先开枪,后瞄准

09 混、通、晒,阿里巴巴数据化运营的内三板斧
混,“混”出数据
通,打“通”“混”的数据
晒,“晒”出“混”和“通”的数据
【数据化思考】思考,要学会关窗口

10 存、管、用,阿里巴巴运营数据的外三板斧
存,数据收集的开始
管,保护好存储数据
用,从收集数据到管理数据
【数据化思考】用化骨绵掌解决本质问题

11 大数据,未来商业的利器
假定数据是脏的
学会慢慢淡化数据
数据的标签化管理
重要的是数据和数据之间的关系,而不是数据本身
数据的实时化与实时性分层
未来是人机的结合体
【数据化思考】 忽略了趋势,过去的价值一文不值

结 语  开启属于你的个人大数据管理
后 记  像李小龙的格斗一样去思考
品觉的话  人在修行的路上,不要单打独斗 

TOP书摘

还原是一个瞄准器
数据的本质就是还原,这是收集元数据的关键方法。

当我们在进行用户的场景还原时,必须认清数据收集的领域是什么。在不同的领域里收集到的数据,可以找到与其所在领域里不同的东西,比如,搜索引擎和社交网络(SNS)得到的数据就是不一样的。而企业首先要做的是,确认用户是不是同一个人,比如在SNS 里涉及的很多信息主要都是聊天内容,如果我是做 SNS 的,我就会更多地去寻找这个人和其他人的关系。他今天跟张三聊了 3 分钟,明天跟李四聊了 5 分钟,这项数据在 SNS 领域里可以获得。但当我们要真实地还原整个人的行为的话,最好要有不同领域作为互补,这会让你掌握更多更全面的信息。
你有多大的能力知道哪些数据是同一个用户的,这是企业首先必须解决的问题。然后再去关注,收集到的数据的量这么大,广度这么?宽,价值在哪里。而当企业不清楚收集到的数据是不是同一个用户的时,那这个数据又有什么用?所以,在大数据里,最重要的还是收集人的数据。
而数据的价值,正如我们前面所分析的,必须来自场景。
对于消费者数据的收集,其中一个瞄准器就是你能否还原用户购买行为的场景。基于科技的不断进步,如果有一天 Google? 眼镜成为每个人的标配,或者是有一天,我们买的每一部电脑,其本身都是跟手机捆绑的,那么这两种交叉数据是很容易获取的。
为什么场景会变得如此重要?场景是不是被准确地表达了?场景是否会成为一件事情的背景,用来还原整件事情?有一年的“十一黄金周”,我们发现很多用户使用 iPad 购物,为什么?你或许不会想到,这是因为那年的“十一黄金周”第一次实行黄金周高速公路不收过路费的政策,很多人堵在了路上,没有其他事情做,所只能以使用 iPad 购物。如果企业在分析数据的时候,没有考虑到 10月1日整个中国的高速公路都出现拥堵的这个场景,企业就没有办法还原整个场景,也就无法解释这个现象。
我还发现了一个新场景。有一天,我们研究了一些无线数据——用二维码让用户到 达我们预想让他到达的页面。我们可以看到,iPhone 手机在扫完二维码后就到达了页面,但是安卓却没有。在中国,很多装有安卓系统的手机在扫完二维码之后都无法自动跳转到关联页面。这时,安卓手机就成为用户登陆网站购物的重要场景。不管是一部 iPhone 手机、一部三星手机,还是一部其他类型的手机,手机的大小和系统的兼容性本身都能对场景产生巨大的影响。而如果我们盲目地去观察数据本身,自以为是地认为用户没有进行点击,那就大错特错了。事实上,是他点不了。
可见,有很多看似无关紧要的东西都在场景里,而在无线移动终端的世界里,这个场景又平添了很多其他的东西,这都需要我们仔细地甄别。
当我和数据分析师们聊天时,我总是会特别提醒,在研究无线数据的时候,要特别注意的是用户在每天移动的时间点和非移动的时间点里都做了什么。从起床到睡觉,有几个时间点基本是固定的,所以基本上就可以判断每个人一天的行为走势是什么。
我曾经在一次电商大会的圆桌论坛上提出了一个观点,当时与会者都很认同,就是我建议把一些以前用来观察用户忠诚度的框架,比如 RFM 模型来做收集数据的瞄准器。有什么数据能让我更好地看到 R,更好地看到 F,更好地看到 M ? RFM 是一个收集维度,个人 PC、手机、平板电脑是另一个终端场景维度,PC 能更好地收集 R,手机能更好地收集 M,这样就可以通过场景的不断变换来收集更多的数据。
现在,有一些终端的确可以收集以前收集不到的数据。以前,我们不知道一些数据的收集背景是不是移动的,但现在可以。用户做一件事情的时候是不是正在移动?他是不是在银泰百货里面?面对不同的场景,我们的框架也要相应改变。所以,现在做数据分析报告,最后的一个问题变成了:“无线变了,这个报告的结果还是一样吗?你的报告应不应该也变一下?”
我认为,数据的本质就是还原,这是收集元数据的关键方法。如果没有这个概念,你就不知道未来你需要什么数据,就更不懂得什么是重要的数据,到最后只会产生越来越多的无从辨别的数据。一旦数据多到了连你的公司都没有办法处理的时候,那么其他会处理的人、公司和国家就会把你毫不留情地挤出市场。
“未来一定是国家和国家之间的数据大战,公司与公司之间的数据大战!”信息时代催生了海量数据的出现,这个世界上每时每刻都在产生大量的数据。此时,大数据已经不再是一个单纯的概念,而是像空气一样围绕在每个人的身边,每个人都是数据的制造者。也正是因为每个人都在通过不同的设备生产着数据,使得数据更多在“量”这个维度上不断膨胀,但是,“量”的单纯膨胀却对企业真正了解一个用户的需求产生了极大的挑战。所以,如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。
在不久的将来,随着 O2O的深入和穿戴式设备的兴起,企业和企业之间必须进行更多的数据融合和交换,必须进行更多的跨行业的数据交流,这样才能更好地还原用户真正的需求,让用户在任何一个场景中都能够获得由数据带来的便利。
总而言之,更深化的数据连接使海量数据经过提炼更真实地还原了事实,也使我们运用数据科技去解码未来的需求成为可能。


CEO们关心哪三个数据

我在面试数据分析师的时候,必然会问他们一个问题:“假如我是一家知名电商的 CEO,而今天是星期一早上 9 点钟,请你给我提供三个数据指标向我证明在过去的一周里,企业运营得一切正常,可以让我踏实下来。你认为,会是哪三个指标呢?”
绝大多数应聘者对这个问题的回答比较一致:第一个是流量;第二个是交易量;第三个是其他,这个其他包括转化率、交易额等。
当他们这样回答完后,我会反问他们:“刚刚我问的问题,你真的听清楚了吗?”
这时候,有人会回答说,我听清楚了,而答案就是的真实需求这三个数据。
往往这个时候,我会提醒应聘者说:“请注意,我要的数据是给CEO 看的,而且还是 顶级电商的CEO,而且时间轴是周敏感数据。”面试进行到这一环节,我就发现大部分面试者根本听不懂“CEO”的含义。事实上,既然是 CEO,就意味着他是公司里的最高领导层,那么给他看的东西明显要与其他人不同。
在这个例子中,我们会发现绝大多数应聘者很少会换位思考。也就是说,事实上,他们都是从自己的角度来思考,而不是以一个数据分析师、一个要给 CEO 汇报三个数据指标的分析师的身份来思考问题。
那么,什么是以数据分析师的身份来思考问题呢?通常来说,在我问出问题时,作为数据分析师的你首先要想的是 CEO 会关注什么数据,是长期的,还是短期的?是风险最大的,还是风险一般的?或者是最近发生了什么事情?以及给 CEO 提供的数据要有什么注意事项,等等。
所以,我要再问问应聘者:“当你坐在面试桌对面给我答案的时候,有没有想过在星期一的早上,这家知名电商的 CEO 真正想看的是什么?”
再想想这个问题,你到底有没有真正听清楚“CEO”、“知名电商”、“周敏感数据”这些关键词? CEO 要的是“踏实”——他听完了就可以安心地吃早饭了。
在面试时,如果面试者不对这几个问题进行询问就贸然回答的话,满分是 10 分,我只会给 5 分。因为这个问题里面本身就有很多问题,比如,什么是踏实?踏实是一个概念,你不问清楚“踏实”的含义,就给我三个指标,无论如何都是错的。
在正常情况下,首先不要急于回答我提出的问题,而是先问清楚什么是踏实,切勿自己先做假定。以下,我们可以假定一个相对理想的面试场景。
你反问:“什么是踏实的状况?”
我回答道:“最近这家电商和另一家电商在打价格战,而它最近又新推出了图书类目,那么 CEO 自然最关注的是这些图书的业务做得好不好。”
你再问:“什么是好?是否基于每天来买书的新增用户和原有用户购书的数量多少?而且,CEO 是希望更多地用书来吸引新用户,还是想通过图书业务的推广让现有的用户进行交叉购买行为?”
在这些思考结束之前,你绝对不能给出指标。因为,在没有解决一个问题的内涵之前,任意给出的一个指标,必错无疑。所以,我才会问应聘者到底听清楚问题没有。
在我做面试官的经历中,很多看似有经验的数据分析师,往往在我提出的问题还没有解释清楚时就抢着作答。绝大多数人在思考不到一秒钟的时间里就给出了答案,而这一秒钟的答案,我可以确定他们根本没有听清楚我的问题。
通常这个时候,我会再给他们一次机会,问他们:“刚才你给我的这个答案,如果我给你满分 10 分,你会给自己打几分?”而此时,大部分人只会打 6 ~ 7 分。
当应聘者给自己打 7 分时,我会反问:“另外 3 分丢的原因是什么?”他开始反思,说自己刚才给的可能并不是 CEO 想要的指标,因为他对这家电商的近况不是很了解……
接下来,当我再反问:“刚才我的问题是‘假如我是一家知名电商的CEO,今天是星期一早上 9 点钟,你给我三个数据指标向我证明在过去的一周里,企业运营得一切正常’,你听清楚了吗?如果你确认自己清楚了,能请你再给我一次答案吗?”
这时候,聪明的人不会再用一秒钟就给我答案了,而是重新思考,开始问问题,再给出答案。这时候的答案,当然会比第一个答案要好得多。最后,当我再问他:“现在,10 分满分你给自己打多少分?”此时,他们自己给出的分值通常都会高一些。至此,我的面试也就结束了。
事实上,关于这个问题,我根本就不关注打分的结果。当然,如果评价是 10 分,那就不用面试了,因为在没有仔细考虑过答案的时候就自信满满地回答,这种人必然无法承担做数据分析师的责任。虽然,自信是对的,但是思考更重要。作为一名数据分析师如果你不把自己的分析与当下结合,是没法进步的。
有趣的是,当我把这个问题贴在网上时,还是会有很多人追问我答案是什么、CEO 关心的到底是哪三个数据。这时候,我真的很想说,答案不是结果,方法才是。

多屏思维下的电子商务

探索到的无线数据场景为清晰的数据分析打下了基础,从而能
够更好地还原用户的行为,以便分析在多屏环境下的电子商务。

面对无线数据,要解决的主要问题有两个:一是做到高效准确的收集;二是培养数据分析师的多屏思维。
所谓做到高效准确的收集,就是需要建立一套面向多操作系统、多版本、自动、可灵活配置的用户行为获取系统。通过这个系统,开发工程师不再需要采用人工写代码的方式来收集数据,从而也就保证了数据的纯净无噪音。但是,这套系统还需要应对一个问题,那就是可能出现的因操作系统的变化而使用户识别失效的情形。因此,企业需要能够建立自己的用户识别方式,能够建立独立于设备号之外的识别代码。同时,这套系统还需要做到多系统的适配,要保证同一个版本在安卓和 iOS 上面的数据具有一致性。
数据分析师多屏思维的培养,则是一个长期的过程。我的方法是先派出精干的数据分析师小团队去探索无线数据的场景,因为即便像阿里这样的大公司,无线数据的分析也是一个全新的领域,所以需要有分析师去探索。
…… 

TOP 其它信息

装  帧:平装

页  数:240

版  次:1

开  本:16开

加载页面用时:99.1348