描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302466291
第1章
数据,另一种视角 / / 0011.1数据之下的中国 / / 003
1.1.12015年,中国人是怎么花钱的 / / 003
1.1.2游遍全国,我们的假期够吗 / / 017
1.1.3淘宝改变了哪些城市 / / 025
1.2数据之下的城市 / / 35
1.2.1人口疏解,让城市更拥堵 / / 035
1.2.2在上海上班,地铁和开车哪个快 / / 048
1.2.3上海餐馆取名大法 / / 056
第2章
数据之于工作 / / 0672.1学习/就业指南 / / 069
2.1.1好好学习,是另一种童年 / / 069
2.1.2应该去哪里买书呢 / / 077
2.1.3月薪多少才配坐高铁 / / 086
2.1.4哪些公务员辛苦 / / 095
2.1.5奔赴大城市,还是回家乡 / / 103数据不说谎: 大数据之下的世界目录 2.2在创业的风口上 / / 112
2.2.1一个估值10亿美元的养猪O2O项目 / / 112
2.2.2大鹏猪肉,为红烧而生 / / 121
2.2.3如何在上海开一家靠谱的餐馆 / / 130
2.2.4快捷连锁酒店选址的空间陷阱 / / 140
第3章
数据之于生活 / / 1533.1理性生活: 那些你所不知道的事 / / 155
3.1.1你的消费水平给上海拖后腿了吗 / / 156
3.1.2如何面对注定平庸的人生 / / 165
3.1.3下雨天外卖会变多吗 / / 175
3.1.4“双12”规避“假折扣”指南 / / 183
3.1.5上海的水源安全吗 / / 189
3.1.6“控制人口”——开给上海的一剂毒药 / / 198
3.2感性生活: 八卦新玩法 / / 212
3.2.1高颜值的人都在哪儿 / / 212
3.2.2中国正在二次元化吗 / / 221
3.2.3如何像白富美一样生活 / / 232
3.2.4长三角城市那些不得不说的八卦 / / 242
3.2.5上海哪所高校的吃货幸福 / / 249
3.3生活之重: 生为房奴 / / 259
3.3.1上海的房子都被谁买走了 / / 259
3.3.2上海购房攻略 / / 268
3.3.3遥不可及的学区梦 / / 278
3.3.4房地产泡沫有多大 / / 287
附录1:
我们是怎么学会玩城市数据的? / / 297
附录2:
城市数据团工作方法简介 / / 305
我们在用数据做什么
在这本书的开始,我们想要提出这样一个问题:
谁了解你?
是自己?
是配偶/恋人?
是父母/子女?
是同学/同事/朋友?
毫无疑问,以上几种人都存在于我们的生命中。
但是,跟“它”比起来,以上几种人对我们的了解恐怕都不够全面和客观。
没错,“它”就是手机,与我们形影不离的手机。
看看你手机上的那一大堆APP——
微博和朋友圈知道,你今天心情好不好。
支付宝知道,你买了什么东西、花了多少钱。
微信和QQ知道,你都有哪些朋友,你跟哪些朋友的交流更密切。
豆瓣、知乎、每日头条知道,你都喜欢浏览哪些帖子和新闻。
虾米和酷狗知道,你喜欢听什么歌。
优酷和B站知道,你喜欢看什么视频。
饿了么和美团知道,你喜欢什么菜系和口味。
……就算你什么APP也没装,只要你有一部手机,“它”就知道你什么时候工作,什么时候休息,知道你去了哪里,待了多久。
在手机面前,我们简直无所遁形。手机所知道的你,可能比你所知道的自己,更为真实。
而这些,都是我们自己告诉手机的。我们的每一次浏览、点赞、评论、下单、聊天,都以数据的形式被记录、被沉淀,终塑造出了我们自己。
所以,请不要被“大数据”“开放数据”“数据挖掘”“深度学习”“神经网络”“云计算”“DMP”等奇奇怪怪的词汇所吓倒。我们每个人每天的生活起居、衣食住行,都在产生数据,并享受着数据给我们带来的便利服务。
事实上,数据已经和我们的视觉、听觉、触觉一样,成为了帮助我们去了解自己、了解他人、了解事物的重要方法。
与其他信息源相比,数据更有可能提供全面和客观的信息,从而帮助我们更快速和高效地了解问题、解决问题。
数据不说谎: 大数据之下的世界前言我们在用数据做什么 例如,你母亲催你去相亲,并提供了100位相亲者的资料。显然,你不可能一个个把他们约出来见面,一个个去了解和评价他们——你甚至都不可能仔细读完这100份资料。
我们通常的做法是,设立一些限制条件,对年龄、身高、学历、收入等进行筛选,再逐份阅读符合条件的相亲者的资料,直到将相亲对象数量减少到个位数。如此,我们的相亲效率就大大提高了。
然而,在享受数据给我们带来的高效便利的同时,我们还必须意识到: 数据分析只能提供结果,不能提供结论;数据之所以能做许多事情,是因为使用数据的人做了很多的思考。
例如,2013年,Amazon
Studios和Netflix,美国的两家传媒公司,都对自己网站上客户的视频浏览行为进行了分析。接受分析的浏览行为包括客户看了什么视频、什么时候看的、在何处暂停、在何处跳过、在何处反复观看、给视频的评分等。
根据数据分析的结果,两家公司一致认为观众会对政治主题感兴趣,但在视频的体裁、制作等方面则有着完全不同的认知。而后,Amazon Studios推出了由四位议员作为主角的情景喜剧,Netflix则推出只有一位议员作为主角的电视连续剧。前一部作品名为《阿尔法屋》(Alpha House),观众反应平平;后一部作品则是风靡一时、获奖无数的《纸牌屋》(House
of Cards)。
所以,即使在一个“大数据”炙手可热、喧嚣尘上的时代,人仍然是主体,是人的智慧让数据具有了价值。
我们,城市数据团的小伙伴们,就是这样一群人: 利用数据去了解城市的发展、挖掘城市生活中有趣的故事。对我们而言,数据是帮助我们认识城市的工具、帮助我们在城市里更好地生活的工具,而通过数据发现的东西才是价值和乐趣所在。我们乐意将这些发现拿出来共享。
本书由城市数据团组织编写,并写作了本书的大部分章节。城市数据团的主要成员包括高路拓、汤舸、王咏笑、王宇鹏等。参与了本书部分章节写作的其他数据团成员和合作伙伴包括(按文章收录顺序):
陈宇佳(1.1.2)、郭斌亮(1.2.1)、陈至奕(1.2.3/2.1.1)、冯里婧(2.1.2)、钱骏杰(3.1.2)、张慈(3.1.3)、曹新(3.1.5)、曹湛(3.2.4)、韩旭(3.2.5)、方娴(3.3.1)、张健(3.3.2)、衣霄翔(3.3.3)、陈晨(3.3.4)。
除写作团队之外,感谢以下机构对本书内容提供了数据支持和技术支持(按文章收录顺序):
银联智惠信息服务(上海)有限公司(1.1.1/3.1.1/3.2.3)
滴滴大数据研究中心(1.2.2/3.2.2)
小猿搜题(2.1.1)
BDP个人版(2.1.2/3.1.4)
TalkingData(2.1.4/3.2.2/3.2.4)
阿里研究院(2.2.1)
大众点评研究院(2.2.2/3.1.2/3.1.3/3.2.5)
上海道融自然保护与可持续发展中心(3.1.5)
同策房产咨询(3.3.1)
本书由城市数据团这个活跃在互联网上的大数据团队完成。如果您看完本书以后,能够增加一些对这个数据时代的了解、愿意去热爱数据和使用数据,将是对我们莫大的鼓励。
城市数据团
2017年3月
——复旦大学数字与移动治理实验室主任 郑磊
收集当下,技术立身,留菁去芜;反映现象,印证趋势,透视未来。
——李承海
数据的演绎结果虽然不能总是让我们激动万分,但它确实能够斩断主观臆想和流言交织的枷锁,让我们触碰这个城市模糊面纱下真实的轮廓,看清当前时局下城市前进的准确趋势。〖城市数据团〗的这本书,让我们于迷惑中摸清现状,在失望中看到希望,它使得数据能在灿烂的阳光下行走,让真理终将启明于昏暗的天边。
——复旦大学博士 王波
从数据养猪到数据交友,数据团带着我们用数据认识世界;从微信文章到团学社,数据团带我们从旁观者转为参与者,一起用数据改变未来。一切改变都是为了未来能更好,*不变的是永远神秘的学姐。
——冯轩
第3章 数据之于生活
在互联网时代,数据已经与我们的生活如影随形。
我们的衣、食、住、行、教育、旅游、娱乐,都在产生数据,沉淀数据。这些数据记录下我们的日程、勾勒出我们的性格,描绘出我们生活的轨迹。这样的数据和轨迹多了,便纠缠成大千世界。
毫无疑问地,数据也可以透过喜怒哀乐,还原生活本来的样子。
数据之下的生活,可能比你想象得更精彩。
3.1 理性生活:那些你所不知道的事
你一定关注过这些问题:怎么样算穷怎么样算富?做鸡头好还是做凤尾好?双11双12是真打折还是假打折?
的确,生活中有一些问题是我们大家都非常关心的。我们搜集小道消息,我们热衷于猜测,却无法获得准确的解答。
而本节的六篇文章就正好回答了这样的六个问题:《你的消费水平给上海拖后腿了吗》《如何面对注定平庸的人生》《下雨天外卖会变多吗》《双12规避“假折扣”指南》《上海的水源安全吗》《“控制人口”——开给上海的一剂毒药》等。
3.1.1 你的消费水平给上海拖后腿了吗
学姐刚过完生日,但她看上去却并不是特别开心。
她说:过生日啊,也没什么大意思。无非是抽选一个男友,一起逛逛名牌店,买买衣服和包包,吃吃大餐,住住五星级酒店什么的。但这些项目全加上,这一天也花不了多少钱,实在看不出来他的诚意来。这让我如何客观判断和他下一步的发展呢?
小团,你能不能综合评价一下,他给我过生日的这个消费水平,到底是高还是低呢?
学姐果真是一个我见过的“单纯”,但同时也是理性的好女生。看着她愁眉不展的样子,我也有些于心不忍。好吧,让我用近与银联智惠研究院合作时用的一组数据结果,来帮她做一做分析吧。
那么,男友的消费水平是高是低呢?有没有拖上海的后腿?
由于学姐生日当天进行了多种活动,行程较为复杂,我们不妨拆解来看,简单分成三个部分:1,购物(衣服和包为主);2,餐饮;3,开房。然后,我们再用这三类消费项目分别去匹配学姐生日当天上海全市的银联线下刷卡统计数据,整理出三组全样本的对比。
好的,组全样本对比的问题来了:
学姐生日那天,一个人在魔都买买买的话,要花到多少钱时才算不拖上海的后腿?
首先,从全样本对比组数据中可以统计出:
在学姐生日那天(不告诉你是哪天哈哈),全上海所有市民,在买衣服和包这项活动上,一共进行了6.7万笔消费,并花掉了约6900万元。平均每笔要花约1100元。
然后,我们可以把这6.7万笔消费和金额落到空间上来看,画出图大概长这样:
图3?1上海消费金额分布(买衣服)
毫无疑问,大部分的高端服装消费,都集中在市中心。
学姐学姐,你男友带你去的是哪个商场?
当然,单纯的学姐并不关心这个。学姐关心的是,男友为她买衣服和包所花费的钱,在这6.7万笔交易中排名第几呢?请看下图:
图3?2上海买衣服消费金额分布
可以看到,虽然全市人民平均每次“买买买”要花1100元,但实际上“买买买”消费的中位数值约270元而已。也就是说,少数的有钱人在“买买买”上的花费大大地拉高了全市整体消费水平。
那么,是谁拖了后腿呢?具体来看:
1,假如男友给学姐买衣服和包的花费超过2700元,那么该男友本次消费力就能跻身全市前5%。
2,假如男友给学姐买衣服和包的花费达到1400元,那么该男友本次消费力就能跻身全市前10%。
3,假如男友给学姐买衣服和包的花费达到270元,那么该男友本次消费力就能达到全市中位水平。
4,假如男友每次给学将姐买衣服和包的花费不超过100元,那么可以判断:该男友本次消费力被全市80%的人打败。
看完这个结果,学姐似乎对自己的男友有了一点信心,嘴角逐渐绽开了笑容。
好的,个问题得到解决,接着第二个问题又来了——-
学姐生日那天,在魔都吃顿大餐,要花到多少钱时才算不给上海拖后腿?
同样地,首先来看:魔都人民在学姐生日那天去餐馆吃饭一共吃了多少钱?
从对比组数据可以看到,在学姐生日那天,全上海市人民在餐饮这一项目上,一共进行了23万笔消费,总金额约8000多万元。
我们可以把这23万笔交易落到空间上,画出图大概长这样:
图3?3上海消费金额分布(餐饮)
但需要注意的是,以上消费是全天汇总结果,那么则意味着早餐买包子午餐买煎饼什么的也就算在里面了。这势必会大大影响分析结果。
为了更精确地判断男友的消费能力,我们则需要把全上海餐饮行业消费的时间维度拉出来,画出图来大概长这样:
图3?4 2015年学姐生日银联餐饮分小时交易额
很明显,晚饭的消费水平比午饭还是要高出一截的。仅仅晚上8点一个小时,全上海就吃掉了超过1500万元。
因此,我们可以把研究样本进一步缩小到高消费的晚餐时段,选择学姐生日当天晚上6点到12点期间的消费作为对比组。而在这个时间段上,全市人民在餐饮活动上一共进行了9.2万笔消费,吃掉了大概4500万元。平均每笔要吃掉约500元。
从空间上看,这4500多万元大概长这样:
图3?5上海消费金额分布(晚餐)
果然,与全天餐饮消费的分布进行对比,可以看到那些分布在中环线附近的办公园区周边那些由于吃午饭而出现的热点纷纷消失了。城市夜间餐饮活力重新回归市中心。
学姐学姐,你男友带你去哪吃的大餐呢?好吃吗?
当然,理性的学姐也并不关心这个。学姐关心的是,男友请她吃饭所花掉的钱,在这9.2万笔交易中,到底排名第几呢?请看下图:
图3?6上海吃晚餐消费金额分布
可以看到,虽然全市人民平均每次晚上下馆子要花约500元,但实际上这个平均值毫无任何意义,因为其中位数仅有约200元。也就是说,少数有钱人吃饭的花费大大地拉高了整体消费水平。
那么,是谁又拖了后腿呢?具体来看:
1,假如男友请学姐吃大餐的花费超过1800元,那么该男友本次消费力就能跻身全市前5%;
2,假如男友请学姐吃大餐的花费达到1100元,那么该男友本次消费力就能跻身全市前10%。
3,假如男友请学姐吃大餐的花费达到200元,那么该男友本次消费力就能达到全市中位水平。
4,假如男友请学姐吃大餐的花费不到40元,那么可以判断:该男友本次消费力将被全市80%的人打败。
看完这个结果,学姐对男友的信心似乎又多了一点,笑容灿烂了起来。
于此同时,后,也是重要的问题来了——
学姐生日那天,在魔都找个酒店开房,住多少钱的房间才算不给上海拖后腿?
同样地,先来看一下:学姐生日当天,魔都人民在开房这项活动上一共花了多少钱?
通过对比组数据可以看到,在学姐生日当天,上海全市人民在开房这件事上一共进行了约7.1万笔消费,总金额约8800万元。平均每次花费约1200元。
然后我们可以把这7.1万笔开房交易落到空间上,画出图来大概长这样:
图3?7上海消费金额分布(酒店住宿)
终于,与餐饮和购物不同,开房的消费不再单极地集中在市中心了。在郊区的金山和川沙等地,也有高消费开房的身影哦。
评论
还没有评论。