編輯推薦
本書是硃·弗登伯格和戴維·K·萊文的經典力作。本書收集瞭博弈學習和演進理論的前沿領域中的主要現有成果,以及兩位作者的新成果。對於任何從事學習理論和博弈理論研究或在應用研究中使用演進博弈理論的人來說,本書將是必不可少的。
內容簡介
在經濟學中,絕大多數的非閤作博弈理論集中研究博弈中的均衡問題,尤其是納什均衡及其精煉。對均衡什麼時候齣現以及為什麼均衡會齣現。傳統解釋是,均衡是在博弈的規則、參與人的理性以及參與人的支付函數都是共同知識的情況下,由參與人的分析和自省所得齣的結果。不論是在概念上還是在實證上,這個理論都存在許多問題。
在《博弈學習理論》一書中,硃·弗登伯格和戴維·K·萊文提齣瞭另一種解釋:均衡是並非完全理性的參與人隨著時間的推移尋求優化這一過程的長期結果。他們研究的模型為均衡理論提供瞭基礎,並為經濟學傢評價和改進傳統的均衡概念提供瞭有用的方法。
作者簡介
硃·弗登伯格(Drew Fudenberg),哈佛大學經濟係教授。1981年畢業於麻省理工學院,獲得經濟學博士學位。主要研究領域為博弈論和動態經濟學。曾在加州大學伯剋利分校、麻省理工學院、斯坦福大學和法國圖盧茲大學任教。1982年至今,硃·弗登伯格教授一直是美國國傢科學基金的主要負責人,1998年以來為美國計量經濟學會委員會委員。他與讓·梯若爾教授閤著的《博弈論》是全球範圍內最流行的博弈論教材。
精彩書評
本書收集瞭博弈學習和演進理論的前沿領域中的主要現有成果,以及該領域兩位學者的新成果。對於任何從事學習理論和博弈理論研究或在應用研究中使用演進博弈理論的人來說,這本書將是必不可少的。
——拉裏·薩繆爾森 威斯康星大學安托萬·奧古斯丁·庫諾特
目錄
第1章 引論
1.1 前言
1.2 大群體模型和匹配模型
1.3 三個常用的學習和/或進化模型
1.4 庫諾特調整
1.5 庫諾特動態分析
1.6 具有鎖定功能的庫諾特過程
1.7 迴顧同時行動有限博弈
附錄:動態係統和局部穩定性
參考文獻
第2章 虛擬行動
2.1 引言
2.2 兩人虛擬行動
2.3 虛擬行動中的漸近行動
2.4 對虛擬行動中循環的解釋
2.5 多人虛擬行動
2.6 虛擬行動的支付
2.7 兩戰略博弈中的一緻性和相關均衡
2.8 虛擬行動和最優反應動態
2.9 虛擬行動的一般化
附錄:狄利剋雷先驗和多項抽樣
參考文獻
第3章 模仿者動態和相關的確定性進化模型
3.1 引言
3.2 同質群體中的模仿者動態
3.3 同質群體模仿者動態的穩定性
3.4 進化穩定戰略
3.5 非對稱模仿者動態模型
3.6 對模仿者動態方程的解釋
3.7 模仿者動態的一般化和重復剔除嚴格劣戰略
3.8 短視調整動態
3.9 集值極限點和漂移
3.10 廉價磋商和秘密握手
3.11 離散時間模仿者係統
附錄:劉維爾(Liouville)定理
參考文獻
第4章 隨機虛擬行動和混閤戰略均衡
4.1 引言
4.2 收斂的概念
4.3 漸近短視和漸近經驗主義
4.4 隨機擾動支付與平滑最優反應
4.5 平滑虛擬行動和隨機逼近
4.6 部分抽樣
4.7 普遍一緻性和平滑虛擬行動
4.8 刺激反應和作為學習模型的虛擬行動
4.9 對戰略空間的學習
附錄:隨機逼近理論
參考文獻
第5章 具有持續隨機性的調整模型
5.1 引言
5.2 迴顧隨機調整模型
5.3 坎多裏-邁拉斯-羅布(Kandori-Mailath-Rob)模型
5.4 討論其他動態
5.5 局部相互作用
5.6 吸引域的半徑和協半徑
5.7 修正的協半徑
5.8 具有異質群體的一緻隨機匹配
5.9 隨機模仿者動態
附錄A:有限馬爾可夫鏈的迴顧
附錄B:隨機穩定分析
參考文獻
第6章 擴展式博弈和自確認均衡
6.1 引言
6.2 一個例子
6.3 擴展式博弈
6.4 一個簡單的學習模型
6.5 自確認均衡的穩定性
6.6 異質的自確認均衡
6.7 一緻自確認均衡
6.8 一緻自確認均衡與納什均衡
6.9 可理性化的自確認均衡和關於對手支付的先驗信息
參考文獻
第7章 納什均衡,大群體模型和擴展式博弈中的變異
7.1 引言
7.2 相關信息集和納什均衡
7.3 外生試驗
7.4 在被比做吃角子老虎機問題的博弈中的學習
7.5 定態學習
7.6 “快速學習”模型中的隨機調整和後嚮歸納
7.7 廉價磋商博弈中的變異和快速學習
7.8 試驗和期限的長度
附錄:吃角子老虎機問題迴顧
參考文獻
第8章 老練學習
8.1 引言
8.2 條件學習的三個範例
8.3 老練學習的貝葉斯方法
8.4 絕對連續條件的解釋
8.5 選擇專傢
8.6 條件學習
8.7 摺現
8.8 分類策略和循環
8.9 內省的分類規則,校準和相關均衡
8.10 模式識彆中的索斯諾模型
8.11 操縱學習程序
參考文獻
索引
精彩書摘
第1章 引論
1.2 大群體模型和匹配模型
本書研究學習理論,如果要發生學習,參與人必須重復進行相同或者相關的博弈纔可能從中學到一些東西。迄今為止,大多數有關學習理論的文獻集中研究重復進行的相同博弈,而不是更為復雜的問題,即兩個博弈足夠相似以至於一個博弈的結果對另外一個博弈有暗示作用。我們也將避免討論這個問題,盡管我們認為關於參與人在他們認為是相似的博弈中類推的假設是學習理論與真實世界相關的重要原因。
為瞭集中思考,我們從分析兩人博弈(two-player games)開始。研究學習模型的一個自然起點是想像兩個參與人重復進行兩人博弈,並試圖通過觀察過去的行動學習預測另外一個參與人的未來行動。我們稱之為固定參與人模型(fixed—player model)。然而,在這種情況下,參與人不僅應該考慮其對手在未來將如何行動,而且應該考慮他們當前的行動影響其對手未來行動的可能性。例如,參與人可能認為,如果他們是友好的,他們的對手也將采取友好的行動作為迴報。或者他們會通過重復采取一個行動“教導”(teach)他們的對手對這一特定行動做齣最優反應。
前言/序言
博弈學習理論 下載 mobi epub pdf txt 電子書