描述
开 本: 16开纸 张: 胶版纸包 装: 平装是否套装: 否国际标准书号ISBN: 9787300057477丛书名: 当代世界学术名著
编辑推荐
本书是朱·弗登伯格和戴维·K·莱文的经典力作。本书收集了博弈学习和演进理论的前沿领域中的主要现有成果,以及两位作者的新成果。对于任何从事学习理论和博弈理论研究或在应用研究中使用演进博弈理论的人来说,这本书将是必不可少的。
内容简介
在经济学中,绝大多数的非合作博弈理论集中研究博弈中的均衡问题,尤其是纳什均衡及其精炼。对均衡什么时候出现以及为什么均衡会出现。传统解释是,均衡是在博弈的规则、参与人的理性以及参与人的支付函数都是共同知识的情况下,由参与人的分析和自省所得出的结果。不论是在概念上还是在实证上,这个理论都存在许多问题。
在《博弈学习理论》一书中,朱·弗登伯格和戴维·K·莱文提出了另一种解释:均衡是并非完全理性的参与人随着时间的推移寻求*化这一过程的长期结果。他们研究的模型为均衡理论提供了基础,并为经济学家评价和改进传统的均衡概念提供了有用的方法。
在《博弈学习理论》一书中,朱·弗登伯格和戴维·K·莱文提出了另一种解释:均衡是并非完全理性的参与人随着时间的推移寻求*化这一过程的长期结果。他们研究的模型为均衡理论提供了基础,并为经济学家评价和改进传统的均衡概念提供了有用的方法。
目 录
第1章 引论
1.1 前言
1.2 大群体模型和匹配模型
1.3 三个常用的学习和/或进化模型
1.4 库诺特调整
1.5 库诺特动态分析
1.6 具有锁定功能的库诺特过程
1.7 回顾同时行动有限博弈
附录:动态系统和局部稳定性
参考文献
第2章 虚拟行动
2.1 引言
2.2 两人虚拟行动
2.3 虚拟行动中的渐近行动
2.4 对虚拟行动中循环的解释
2.5 多人虚拟行动
2.6 虚拟行动的支付
2.7 两战略博弈中的一致性和相关均衡
2.8 虚拟行动和反应动态
2.9 虚拟行动的一般化
附录:狄利克雷先验和多项抽样
参考文献
第3章 模仿者动态和相关的确定性进化模型
3.1 引言
3.2 同质群体中的模仿者动态
3.3 同质群体模仿者动态的稳定性
3.4 进化稳定战略
3.5 非对称模仿者动态模型
3.6 对模仿者动态方程的解释
3.7 模仿者动态的一般化和重复剔除严格劣战略
3.8 短视调整动态
3.9 集值极限点和漂移
3.10 廉价磋商和秘密握手
3.11 离散时间模仿者系统
附录:刘维尔(Liouville)定理
参考文献
第4章 随机虚拟行动和混合战略均衡
4.1 引言
4.2 收敛的概念
4.3 渐近短视和渐近经验主义
4.4 随机扰动支付与平滑反应
4.5 平滑虚拟行动和随机逼近
4.6 部分抽样
4.7 普遍一致性和平滑虚拟行动
4.8 刺激反应和作为学习模型的虚拟行动
4.9 对战略空间的学习
附录:随机逼近理论
参考文献
第5章 具有持续随机性的调整模型
5.1 引言
5.2 回顾随机调整模型
5.3 坎多里-迈拉斯-罗布(Kandori-Mailath-Rob)模型
5.4 讨论其他动态
5.5 局部相互作用
5.6 吸引域的半径和协半径
5.7 修正的协半径
5.8 具有异质群体的一致随机匹配
5.9 随机模仿者动态
附录A:有限马尔可夫链的回顾
附录B:随机稳定分析
参考文献
第6章 扩展式博弈和自确认均衡
6.1 引言
6.2 一个例子
6.3 扩展式博弈
6.4 一个简单的学习模型
6.5 自确认均衡的稳定性
6.6 异质的自确认均衡
6.7 一致自确认均衡
6.8 一致自确认均衡与纳什均衡
6.9 可理性化的自确认均衡和关于对手支付的先验信息
参考文献
第7章 纳什均衡,大群体模型和扩展式博弈中的变异
7.1 引言
7.2 相关信息集和纳什均衡
7.3 外生试验
7.4 在被比做吃角子老虎机问题的博弈中的学习
7.5 定态学习
7.6 “快速学习”模型中的随机调整和后向归纳
7.7 廉价磋商博弈中的变异和快速学习
7.8 试验和期限的长度
附录:吃角子老虎机问题回顾
参考文献
第8章 老练学习
8.1 引言
8.2 条件学习的三个范例
8.3 老练学习的贝叶斯方法
8.4 连续条件的解释
8.5 选择专家
8.6 条件学习
8.7 折现
8.8 分类策略和循环
8.9 内省的分类规则,校准和相关均衡
8.10 模式识别中的索斯诺模型
8.11 操纵学习程序
参考文献
索引
1.1 前言
1.2 大群体模型和匹配模型
1.3 三个常用的学习和/或进化模型
1.4 库诺特调整
1.5 库诺特动态分析
1.6 具有锁定功能的库诺特过程
1.7 回顾同时行动有限博弈
附录:动态系统和局部稳定性
参考文献
第2章 虚拟行动
2.1 引言
2.2 两人虚拟行动
2.3 虚拟行动中的渐近行动
2.4 对虚拟行动中循环的解释
2.5 多人虚拟行动
2.6 虚拟行动的支付
2.7 两战略博弈中的一致性和相关均衡
2.8 虚拟行动和反应动态
2.9 虚拟行动的一般化
附录:狄利克雷先验和多项抽样
参考文献
第3章 模仿者动态和相关的确定性进化模型
3.1 引言
3.2 同质群体中的模仿者动态
3.3 同质群体模仿者动态的稳定性
3.4 进化稳定战略
3.5 非对称模仿者动态模型
3.6 对模仿者动态方程的解释
3.7 模仿者动态的一般化和重复剔除严格劣战略
3.8 短视调整动态
3.9 集值极限点和漂移
3.10 廉价磋商和秘密握手
3.11 离散时间模仿者系统
附录:刘维尔(Liouville)定理
参考文献
第4章 随机虚拟行动和混合战略均衡
4.1 引言
4.2 收敛的概念
4.3 渐近短视和渐近经验主义
4.4 随机扰动支付与平滑反应
4.5 平滑虚拟行动和随机逼近
4.6 部分抽样
4.7 普遍一致性和平滑虚拟行动
4.8 刺激反应和作为学习模型的虚拟行动
4.9 对战略空间的学习
附录:随机逼近理论
参考文献
第5章 具有持续随机性的调整模型
5.1 引言
5.2 回顾随机调整模型
5.3 坎多里-迈拉斯-罗布(Kandori-Mailath-Rob)模型
5.4 讨论其他动态
5.5 局部相互作用
5.6 吸引域的半径和协半径
5.7 修正的协半径
5.8 具有异质群体的一致随机匹配
5.9 随机模仿者动态
附录A:有限马尔可夫链的回顾
附录B:随机稳定分析
参考文献
第6章 扩展式博弈和自确认均衡
6.1 引言
6.2 一个例子
6.3 扩展式博弈
6.4 一个简单的学习模型
6.5 自确认均衡的稳定性
6.6 异质的自确认均衡
6.7 一致自确认均衡
6.8 一致自确认均衡与纳什均衡
6.9 可理性化的自确认均衡和关于对手支付的先验信息
参考文献
第7章 纳什均衡,大群体模型和扩展式博弈中的变异
7.1 引言
7.2 相关信息集和纳什均衡
7.3 外生试验
7.4 在被比做吃角子老虎机问题的博弈中的学习
7.5 定态学习
7.6 “快速学习”模型中的随机调整和后向归纳
7.7 廉价磋商博弈中的变异和快速学习
7.8 试验和期限的长度
附录:吃角子老虎机问题回顾
参考文献
第8章 老练学习
8.1 引言
8.2 条件学习的三个范例
8.3 老练学习的贝叶斯方法
8.4 连续条件的解释
8.5 选择专家
8.6 条件学习
8.7 折现
8.8 分类策略和循环
8.9 内省的分类规则,校准和相关均衡
8.10 模式识别中的索斯诺模型
8.11 操纵学习程序
参考文献
索引
媒体评论
本书收集了博弈学习和演进理论的前沿领域中的主要现有成果,以及该领域两位权威学者的新成果。对于任何从事学习理论和博弈理论研究或在应用研究中使用演进博弈理论的人来说,这本书将是必不可少的。
——拉里·萨缪尔森 威斯康星大学安托万·奥古斯丁·库
——拉里·萨缪尔森 威斯康星大学安托万·奥古斯丁·库
在线试读
第1章 引论
1.2 大群体模型和匹配模型
本书研究学习理论,如果要发生学习,参与人必须重复进行相同或者相关的博弈才可能从中学到一些东西。迄今为止,大多数有关学习理论的文献集中研究重复进行的相同博弈,而不是更为复杂的问题,即两个博弈足够相似以至于一个博弈的结果对另外一个博弈有暗示作用。我们也将避免讨论这个问题,尽管我们认为关于参与人在他们认为是相似的博弈中类推的假设是学习理论与真实世界相关的重要原因。
为了集中思考,我们从分析两人博弈(two-player games)开始。研究学习模型的一个自然起点是想像两个参与人重复进行两人博弈,并试图通过观察过去的行动学习预测另外一个参与人的未来行动。我们称之为固定参与人模型(fixed—player model)。然而,在这种情况下,参与人不仅应该考虑其对手在未来将如何行动,而且应该考虑他们当前的行动影响其对手未来行动的可能性。例如,参与人可能认为,如果他们是友好的,他们的对手也将采取友好的行动作为回报。或者他们会通过重复采取一个行动“教导”(teach)他们的对手对这一特定行动做出反应。
……
1.2 大群体模型和匹配模型
本书研究学习理论,如果要发生学习,参与人必须重复进行相同或者相关的博弈才可能从中学到一些东西。迄今为止,大多数有关学习理论的文献集中研究重复进行的相同博弈,而不是更为复杂的问题,即两个博弈足够相似以至于一个博弈的结果对另外一个博弈有暗示作用。我们也将避免讨论这个问题,尽管我们认为关于参与人在他们认为是相似的博弈中类推的假设是学习理论与真实世界相关的重要原因。
为了集中思考,我们从分析两人博弈(two-player games)开始。研究学习模型的一个自然起点是想像两个参与人重复进行两人博弈,并试图通过观察过去的行动学习预测另外一个参与人的未来行动。我们称之为固定参与人模型(fixed—player model)。然而,在这种情况下,参与人不仅应该考虑其对手在未来将如何行动,而且应该考虑他们当前的行动影响其对手未来行动的可能性。例如,参与人可能认为,如果他们是友好的,他们的对手也将采取友好的行动作为回报。或者他们会通过重复采取一个行动“教导”(teach)他们的对手对这一特定行动做出反应。
……
评论
还没有评论。