描述
开 本: 128开纸 张: 胶版纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787300263953
改变数据思维,将大数据落地,切实实现数据的商业价值
场景*,数据第二,算法第三
本书试图回答以下问题:
?数据如何产生价值?
?纯粹而孤立的数据有商业价值吗?
?预测不准为什么是常态?
?一个预测不准的场景能有什么用处?
?数据隐私如何保护?
?如何对数据确权?
?数据资产应该如何定价?
?定价的逻辑是什么?
本书会告诉你:
?一套规范的数据分析方法论,帮助你从业务角度定义数据分析,从数据分析角度实践业务;
?预测不准是常态,是大千世界无常的一个正常反映;
?数据模型的价值,主要体现在预测精度的相对优势上(相对于经验方法),而不是对*预测精度的无限追求;
?数据带来价值的同时,也带来了伤害:隐私泄漏;
?数据*的合法拥有者需要通过对数据确权来实现;
数据资产同样遵循*基本的经济学供求关系,交易才是数据资产定价的核心微观基础。
从不确定性开始
什么是不确定性?
不确定性事件广泛存在
不确定性推动科研
不确定性创造商机
产生不确定性的原因
第二章 数据的时代特征
数据的朴素定义
数据的时代特征
运营商数据
支付交易数据
手机数据
社交网络数据
位置轨迹数据
浏览日志的数据
第三章 朴素的数据价值观
数据分析的核心
价值表现的三个方面
参照系
价值与业务场景
价值与商业模式
可被归因的价值
第四章 回归分析的“道”与“术”
统计学不研究统计
回归分析与不确定性
回归分析与管理决策
回归五式
第五章 因变量与业务诉求
确定业务的核心诉求
纵横对比两步法
不存在完美定义的 Y
瞄准真实的业务目标
瞄准原因而不是结果
第六章 解释性变量与业务洞见
X就是业务洞见
X决定竞争优势
运营实践产生 X
制度设计保障 X
第七章 预测精度与产品设计
预测不准是常态
预测精度的改进
预测精度的界定
大数定律与产品化
第八章 数据资产定价
必要性与挑战
数据确权
交易标的
价值测算
第九章 数据资产交易
交易的内容与形式
可替代性与套利交易
一个假想的资产交易所
第十章 数据治理与价值创造
数据治理时代
公司治理与数据治理
数据资源资产化
数据确权与合规
价值创造与人才培养
讨论与总结
数据是一种资产的观点正逐渐被接受,究竟什么样的数据才能成为资产,如何定价及交易,却鲜见阐述。本书深入浅出,从*基础的数据定义和数据价值开始,到回归分析、XY变量的选取,*后到数据资产定价、确权、交易、治理,做了全面的剖析。承认数据重要性却不唯数据论,提出了“场景*,数据第二,算法第三”的观点。做数据分析的行业新人亦或从业多年的数据专家,都能从中得到不少启发。
——孙中东(重庆富民银行行长)
数据其实是一个古老的行业,从孟德尔豌豆实验到*早的保险精算师,都是从数据中挖掘有价值的科研或者商业信息。而数据的大爆发诞生于互联网,尤其是随着移动互联网的普及和深入,极大地加强了数据的广度与深度。
随着工业4.0的发展,越来越多的行业的数据被电子化,数据成为重要的生产资料。由此,数据行业的发展关系到国家的核心竞争力与国计民生的方方面面。作者敏锐地指出,在大数据场景下,必须提出创新的解决方案,在海量数据中挖掘有价值的信息并兼顾隐私,积极探索实用案例。本书深入浅出地从产品设计、资产定价、数据交易等方面,利用丰富的经验和实用的行业洞见提出多种建议。这是一本既适合对行业充满兴趣的新人,又能够引发行业资深人士思考和启迪的好书。
——方毅(个推CEO)
数据的概念并不陌生,但随着时代的演进,其内涵和外延在不断变化。本书从数据的不确定性切入,阐述了不确定性的确定性存在。王老师基于扎实的理论基础、丰富的实践经验和朴素适用的方法论,从数据的基本概念出发,围绕数据资产、数据产业、XY因果、数据交易与数据治理、理念认知与人才培养,形象通俗、入木三分地深刻分析与独特解释,面对业界难点,提出问题、分析问题和解决问题,具有较强的时代性、专业性与实用性。此书既是一本与时俱进的教科书,又是一本通俗易懂的科普书和故事书。更难能可贵的是,读完本书,读者不仅可以对数据资产有体系化的认识,而且会发现本书透射出的方法论对于分析发现客观世界具有相当强的普适性。本书值得强烈推荐。
——狄刚(中国人民银行数字货币研究所副所长)
王老师以浅显而又专业的方式,从产业领域、技术领域、伦理学领域以及经济学领域等诸多视角,帮助读者建立了一个完整的大数据概念,并引导读者根据自身体验,在各个维度上进行独立、更深入的思考。我会很高兴推荐身边的人都仔细阅读本书。起码,我们可以一起从“青春期”时代成长到”成年人“时代。
——陈灏(收钱吧CEO)
人们都说,这是一个大数据时代,是数据产生价值的时代,更是数据成为资产的时代。真的是这样吗?
要认真探讨这个问题并不容易。首先,要理解什么是数据。对于数据,可以给出多种不同的定义,各有其道理。但是,哪种定义能够帮助我们更好地理解数据产业?理解它的昨天,今天,还有明天呢?其次,要理解什么是资产。会计学对资产的定义是什么?数据就是资产,这个说法站得住脚吗?根据会计学的定义,资源要成为资产有一个必要条件:带来预期的经济收益。那么什么是经济收益?我认为就是商业价值。由此可见,不是所有的数据都可以称为资产,只有那些能够产生商业价值的数据才可以称为资产。因此,数据创造价值的过程,就是数据资源资产化的伟大历程!
数据如何产生价值?纯粹而孤立的数据有商业价值吗?没有。数据价值的彰显需要一个必要条件:业务场景。只有合适的数据配合合适的业务场景,才能产生价值。业务场景可以孤立于数据之外而产生价值,但是数据却无法孤立于业务场景之外产生价值。因此,数据价值之道在于:场景为王,数据次之,算法最后。所以,数据分析的第一步,也是最重要的一步,不是分析数据,不是建立模型,而是分析业务。对业务缺乏充分的理解,不可能让数据产生价值。为此,需要一套规范的方法论,帮助我们从业务角度定义数据分析,从数据分析角度实践业务。这就需要具备一种能力,即把抽象的业务问题转变为数据可分析问题。这是数据分析最困难、最具挑战也是最了不起的地方。为此,你需要重新理解:什么是回归分析。
人们通过各种数据建模的技术手段,对业务的核心指标做出预测,希望可以无限准确。但悲催地发现,无论如何努力都无法做到非常高的预测精度。你可能开始怀疑人生,变得焦虑、苦恼、迷失方向。其实不必慌张,这一切都很正常,这才是数据分析的真实世界。对真实的数据分析而言,预测不准是常态,预测过度准确才是一个让人非常担忧的“变态”。为什么?因为预测过度准确常常是一个假象、一个幻觉。预测过度准确可能是人们犯了愚蠢的错误。所以,任何时候我看到预测过度准确的模型,第一反应是:错了!从未失手!因此,你需要坦然接受预测不准的常态,这是大千世界无常的一个正常反映。所谓无常就是难以预知的变化,就是不确定性!在实践中,不确定性随处可见。不确定性常常由两部分组成:一是无知;二是无奈。无知可以通过数据分析、模型学习慢慢化解;无奈却让人束手无策,而无奈恰恰决定了预测不准是常态!
既然预测不准是常态,为什么还要做预测?一个预测不准的场景能有什么用处?其实,这才是数据模型最有价值的场景。在这个场景下,由于不确定性的影响,数据模型预测精度可能算不上完美,但是没有数据模型加持的经验方法往往表现更差。因此,数据模型的价值主要体现在预测精度的相对优势上(相对于经验方法),而不是对绝对预测精度的无限追求。事实上,对于一个业务场景,如果数据模型可以预测准确,那么经验方法常常也会表现优异,甚至与数据模型旗鼓相当。此时,数据模型并没有相对优势。深刻理解了预测不准是常态这一道理,你的世界观就变了。虽然仍在努力改进数据,改进模型,提高预测的精度,但已不再排斥不确定性。开始拥抱预测不准这一常态,看待数据商业价值的高度也就变了!
任何事物都有它的两面性。数据带来价值的同时,也带来了伤害:隐私泄露。相信你也深受其害。我家小朋友上了一个英语补习班,其他英语学校的骚扰电话就接踵而来,不胜其烦!因此,全社会对于隐私保护的意识越来越强烈。但为了隐私保护而保护隐私,就如同医生给病人看病,头痛医头,脚痛医脚,不治根本。隐私保护的根本是:数据确权与合规。仔细思考,什么是隐私保护?就是保护同隐私相关的数据。为此,你需要得到法律的支持,即我才是这个数据唯一的合法拥有者。因此,需要对数据确立清晰的产权,这就是数据确权。数据确权非常重要,不局限于隐私保护。如果数据的产权都不明晰,它又怎么能成为可交易的数据资产呢?但现实中的关键问题是:数据如何确权。数据资源的生产过程很复杂,往往多方参与其中(企业、政府、用户等),而且数量巨大(海量用户)。这一点同实物资产很不一样,需要一些独特的创新,需要法学的智慧!
最后讨论的是,数据资产如何定价?定价的逻辑是什么?同实物资产相比,有什么异同之处?数据资产与实物资产的相同之处在于,资产的价格无法通过一个神奇的数学公式准确计算。因为同样的资产(无论是数据资产,还是实物资产),在不同的场景下价值各不相同,无法给出一个绝对准确的价格。而资产只能遵循最基本的经济学供求关系:高价格提高供给、降低需求,低价格降低供给、提高需求。但是,价格与供需之间到底是什么样的数学关系,无法描述,只能交给市场,通过大量的交易自动碰撞摸索形成。因此,交易才是定价的核心微观基础。要想给数据资产定价,就要促进数据资产交易。那么数据资产应该如何交易?交易的形态应该如何设定?数据资产和实物资产的不同在于,复制成本几乎为零。因此,如果数据资产模仿实物资产,以金钱为媒介进行交易恐怕欠妥。因为购买方可以零成本立刻复制多份盗版向市场非法售卖,其监管成本极其高昂。由此,我大胆猜测,数据资产交易需要一种独特的交易形态和交易场所。这是本书最后为大家分享的内容。
以上就是本书想要讨论的内容,总结了我对数据产业的思考和瞎想,纯思想性内容,没有任何数学公式。所有的讨论都关注在一个焦点上:践行数据商业价值,也即数据资源资产化。希望探索一条践行数据商业价值的道路,发展一套数据资源资产化的方法。显然,我不能保证书中所有的观点就是正确的,恰恰相反,其中必有荒诞、谬误甚至陷阱。但是,不经历荒诞,不尝试谬误,不蹚平陷阱,哪来的康庄大道?希望你不要袖手旁观,能够为我加油,并提出建设性意见。我想以此书为践行数据商业价值的同行加油喝彩,为我国的数据产业讴歌,为数据资源资产化的伟大历程做忠实记录!
评论
还没有评论。