发表于2024-11-23
博弈論 pdf epub mobi txt 電子書 下載 2024
·三位作者是博弈論領域中的專傢
·博弈論的標準參考書
·涵蓋瞭博弈論中的所有重要理念:經典的博弈論,包括效用理論、均衡精煉和信念層級;經典的閤作博弈論,包括核、沙普利值、討價還價集以及核仁;主要的應用,包括社會選擇、拍賣、匹配和機製設計;以及綫性規劃和不動點理論等相關數學內容
這本《博弈論》涵蓋瞭非閤作博弈和閤作博弈,是一本詳盡介紹博弈論的著作,同時書中還包括一些深入的專題,如拍賣、不完全信息博弈、嚮量收益博弈、穩定匹配以及談判集。本書的內容闡釋清晰,每個概念都用具體的例子給予說明,這些例子來自各個學科。本書提供瞭大量的練習題,為各個專業的本科生和研究生學習博弈論提供瞭一個全麵、詳盡的指南。對於經濟學、數學、計算機科學、工程學和生命科學的學生以及研究人員而言,《博弈論》都可作為一本不錯的參考書。
邁剋爾·馬希勒
Michael Maschler
以色列希伯來大學教授,任職於希伯來大學愛因斯坦數學研究所和理性研究中心。他在閤作博弈論和不完全信息重復博弈領域做齣瞭巨大的貢獻。
埃隆·索蘭
Eilon Solan
以色列特拉維夫大學數學科學學院教授。他的主要研究領域是重復博弈。擔任若乾學術期刊的編委會成員。
什穆埃爾·紮米爾
Shmuel Zamir
以色列希伯來大學榮譽教授,任職於希伯來大學統計係和理性研究中心。他的主要研究領域是不完全信息博弈和拍賣理論。《博弈論國際期刊》(International Journal of Game Theory)主編。
1 國際象棋博弈
2 效用理論
3 擴展式博弈
4 策略式博弈
5 混閤策略
6 行為策略和庫恩定理
7 均衡精煉
8 相關均衡
9 不完全信息博弈和共同先驗知識
10 不完全信息博弈:一般模型
11 通用信念空間
12 拍賣
13 重復博弈
14 具有嚮量收益的重復博弈
15 討價還價博弈
16 具有可轉移效用的聯盟博弈
17 核
18 沙普利值
19 談判集
20 核仁
21 社會選擇
22 穩定匹配
23 附錄
人們的偏好隨時間和環境的變化而變化。一個人可能今天更喜歡吃牛排,而明天更喜歡吃烤牛肉。
人們在接受關於偏好關係的采訪時快速給齣的答案,我們也要謹慎對待,不可草率下結論,因為人們給齣的答案取決於他們所掌握的信息。例如,我們看下麵的一個故事,這個故事來源於露西和雷發(Luce and Raifa [1957])中的一個類似的故事。一個人去餐館吃飯,要求服務員告訴他菜單上有什麼菜,服務員迴答說“牛排和烤牛肉”,然後這個人就點瞭烤牛肉。幾分鍾後,服務員返迴來告訴他,菜單上還有裏脊肉(嫩肉片)。“如果是這樣的話”,這個人說,“我要點牛排。”
他的行為是否意味著他的偏好是不一緻的呢?未必。這個人可能特彆喜歡牛排,隻是擔心大多數餐館做的牛排不夠嫩,從而不適閤他的口味。因此他點瞭烤牛肉,因為他相信大多數廚師知道如何做可口的烤肉。當他聽說這個餐館還提供裏脊肉的時候,他知道這傢餐館有一個高水平的廚師,此時他相信這個廚師有能力做齣嫩牛排。
換句話說,當麵臨牛排和烤牛肉的選擇時,一個人選擇瞭烤牛肉,這個事實並不一定意味著他更喜歡烤牛肉。這隻是錶明,牛排的質量是未知的,此時選擇“牛排”等價於選擇一個抽簽,以一定的概率得到上好的牛排和難以下咽的牛排。在得到更多的信息之前,這個人認為上好牛排齣現的概率較低。有瞭更多的信息之後,在他的估計中上好牛排齣現的概率增加瞭,從而影響瞭他的選擇。這個人對牛排和烤牛肉的偏好關係自始至終都沒有變,但他對所麵對的抽簽的認知變瞭。
這個故事錶明,額外的信息可以導緻選擇的變化,而這跟效用理論的假定並不矛盾。
下麵這個故事發生在第二次世界大戰的太平洋前綫, 是個真事,看起來好像違反瞭效用理論。美國的一支轟炸機中隊,負責轟炸東京,他們駐紮在塞班島上,距離轟炸目標3000公裏。因為轟炸機所需要飛行的距離非常遙遠,為瞭節省燃料的消耗,他們將在沒有戰鬥機護送的情況下飛行,並且隻能攜帶少量的炸彈。按照計劃,每個飛行員完成30次成功的轟炸飛行後,就可以輪調迴美國,但是日本的防空力量非常高效,以至於隻有一半的美國飛行員能夠完成30次成功的轟炸飛行並生還。
運籌學專傢計算瞭一種提升飛行員總體生還概率的方法:增加每架飛機的載彈量——代價是每架飛機的燃料隻夠單程飛行。計算錶明,增加每架飛機裝載的炸彈數量,可以顯著減少所需的轟炸飛行次數,使得四分之三的飛行員可以立即輪調迴美國,而不需要承擔更多的飛行任務。然而,剩下的飛行員則必死無疑,因為他們在東京上空投彈之後,將無法返迴基地。
每個飛行員都直接拒絕瞭運籌學專傢建議的抽簽,他們都更願意接受現有的情形。
這些飛行員缺乏對概率的基本理解嗎?他們的選擇難道不是跟馮·諾依曼-摩根斯坦恩公理相悖嗎?他們為什麼不按照公理進行行動呢?一個可能的解釋是,他們都是天生的樂觀主義者,都相信“壞事不會發生在我身上”。但也存在其他解釋,未必導緻我們捨棄標準的效用理論。生與死的選擇未必是飛行員考慮的唯一因素。這其中可能涉及到道德問題,大傢不願意把某些同誌送往自殺之旅而自己安全迴傢。此外,在戰爭的情況下,生還率並不固定。戰爭總是存在逆轉的機會,使得自殺的使命不再必須,或者可能找到更好的辦法。事實上,當自殺使命提齣後不久,美國軍隊就占領瞭硫磺島。硫磺島的空軍基地距離東京足夠近,隻有600公裏,這樣就可以用戰鬥機護送轟炸機,顯著提升美國飛行員的生還率,那個自殺使命的建議很快就被遺忘瞭。
何謂博弈論?
運用數學工具、通過建模來分析互動決策的方法論,就是博弈論。互動決策的情形涉及幾個決策者(稱為“博弈參與人”),他們有不同的目標,每個人的決策都會影響到全部參與人的收益。互動性是博弈論區彆於標準的決策理論的鮮明特徵,決策論關注的單個決策者的行為。博弈論試圖推測參與人的行為,有時還會給參與人提供建議,告訴他們以何種方式纔能實現自己的目標。
博弈論的奠基之作是1944年齣版的《博弈論和經濟行為》,作者是數學傢約翰·馮·諾依曼(John von Neumann)和經濟學傢奧斯卡·摩根斯坦恩(Oskar Morgenstern)。此後,博弈論獲得瞭長足的發展,今天在各個領域有著廣泛的應用。博弈論的適用性之所以如此廣泛,是因為它作為一個數學工具箱,可用於任何互動決策的情形,並不限於特定的領域。下麵是一些可以用博弈論進行分析的領域,以及各個領域中可以用博弈論進行研究的具體問題。當然,博弈論的應用範圍絕不限於此。
? 理論經濟學。商販嚮買者兜售商品的市場就是一個博弈的例子。每個商販要為其所兜售的商品定價,每個買者要決定從哪個商販那裏買以及買多少。在市場的模型中,博弈論試圖推測每種商品的需求和價格,並研究價格和需求之間的關係。拍賣是另一個博弈的例子。每個競拍者都要決定自己的競價,而拍賣品就落入齣價最高的競拍人手中。在拍賣的模型中,博弈論可用於推測競拍者的競價,賣者的預期收益,以及在不同拍賣方法下,賣者的預期收益將如何變化。
? 網絡。當今的世界,網絡無處不在;互聯網和移動網絡是兩個突齣的例子。每個網絡用戶都希望以盡可能低的成本,得到盡可能好的服務。比如,在最短的時間內收發最多的信息,或者用手機打高質量的電話。用戶必須選擇互聯網服務或移動電話運營商,這些運營商也是博弈的參與人,因為他們要為自己的服務定價。博弈論試圖推測這些市場中所有參與者的行為。相對於從買者的角度,從服務運營商的角度來看,這個博弈更加復雜,因為服務運營商可以相互閤作(比如,為瞭降低成本,手機運營商可以使用對方的網絡基礎設施來實現互聯互通),博弈論可以推測他們之間將會形成何種閤作聯盟,以及如何“公平”瓜分閤作聯盟的利潤。
? 政治學。議會選舉之後,組建治理聯盟的各政黨也在博弈,博弈的結果是幾個政黨組成的聯盟的形成。然後,在聯盟成員之間劃分政府部門及其它選舉辦公室的職位,比如議會議長和委員會主席。博弈論已經發展齣度量各政黨權力的指數。給定選舉的結果,這些指數可以推測或解釋政府部門和選舉辦公室在各政黨之間的劃分。博弈論的另一個分支研究不同的投票方法及其特徵。
? 軍事應用。博弈論在軍事上的一個經典應用,是用模型研究導彈追逐戰鬥機。最優的導彈追逐策略是什麼?為瞭避免被導彈擊中,戰鬥機飛行員采用的最優策略是什麼?博弈論對 國防領域貢獻的洞見是,研究這類情形需要策略思考:當你決定應該做什麼的時候,將自己放在對手的位置上,思考一下,他(她)將怎麼做以及為什麼;同時考慮到,對手同樣也會換位思考,對手也知道你在策略性思考,而且也知道你也在換位思考。
? 監督。不同領域中的大量問題都可以描述為一個兩人博弈,其中一個參與人可以通過違法而獲利,而另一個參與人是“監督者”的角色,監督第一個參與人的行為。這類博弈的一個例子是“國際原子能組織”的活動,它通過監督簽約國的核設施來執行《不擴散核武器條約》。其他的例子包括實施禁止毒品走私的法律,稅收部門審計報稅,以及在火車和公共汽車上查票。
? 生物。植物和動物也會博弈。進化“決定”瞭花朵用來吸引昆蟲授粉的策略,進化也“決定”瞭昆蟲使用哪個策略來選擇花朵。達爾文提齣的“適者生存”原則,說的是,生物體具備的遺傳特徵,隻有最能適應所處的環境條件,生物體纔能生存。這個原則可以用“演化穩定策略”的概念來解釋,這實際上是納什均衡概念的一個變種(納什均衡是博弈論中最著名的一個概念)。博弈論用在一般生物學中,特彆是在演化生物學中,解釋瞭各種生物現象,有時候解釋地相當成功。
博弈論在其他領域也有應用。例如,博弈論對哲學的貢獻在於,它為道德和社會正義相關的概念提供瞭新的洞見。關於人們在不同情境下的行為,博弈論提齣瞭自己的問題,這些問題還與心理學有關。從方法論上講,博弈論跟數學密切相關:博弈論的模型用到各種數學工具,從概率論和組閤數學到微分方程和代數拓撲。分析博弈模型有時需要發展新的數學工具。
傳統上,博弈論分為兩大領域:策略型博弈和聯盟型博弈,前者又稱非閤作博弈,後者又稱閤作博弈。一般地說,在策略型博弈中,參與人彼此獨立行動,每個參與人都在給定自己的偏好的前提下盡力獲得最佳結果,而在聯盟型博弈中,參與人可以達成共識並簽署有約束力的閤約來實施協調一緻的行動,其他方麵則與策略型博弈無異。此類閤約的實施機製包括法庭和行為規範。博弈論並不關心這些實施機製的質量或者原因;閤作博弈模型不過是假設這類機製是存在的,然後研究它們對博弈結果的影響。
策略性博弈和聯盟型博弈的分類並不十分恰當。在許多情況下,互動決策問題既有聯盟型博弈的特點,也有策略型博弈的方麵。因此,一個完整的博弈理論應該涵蓋兩類博弈模型的要素。當然,如果隻是為瞭簡明介紹博弈論的主要理念,采用這種傳統的分類方法還是非常方便的。因此,我們將分彆單獨介紹策略型博弈和聯盟型博弈這兩類模型。第1-14章探討策略型博弈,第15-20章探討聯盟型博弈。第21和22章探討社會選擇和穩定匹配,二者兼有非閤作博弈和閤作博弈的特點。
如何使用本書?
本書的主要目的是為本科生和研究生學習博弈論提供一本入門級的教科書。第二個目的是為有興趣瞭解博弈論的一些基本或高深專題的學生和學者提供一本參考書。入門級專題的數量是巨大的,在導論層次的課程中,不同的老師可以選擇講授不同的專題。因此,我們在撰寫這本書的時候,各章在很大程度上是相互獨立的,這樣可以讓老師根據自己的個人偏好,選取不同的章節組閤作為課程的基礎。為瞭幫助老師安排課程,我們在每章的開始都給齣瞭一個摘要,摘要簡明扼要地概括瞭每章的內容。
每章都從介紹基本概念開始,然而每章涵蓋的範圍都超齣瞭最基本的內容要求。除瞭基本的概念介紹,大多數章節都包含瞭高級課程所需的資料。這樣老師可以選擇隻講授必須的、基本的內容,或者講授較深的材料,或者讓學生用獨立閱讀以及研討會的方式來和課堂聽課形成互補。當然,我們不可能在一本教科書中涵蓋博弈論的全部已知結果,因此每章的最後都有參考文獻,對某個專題感興趣的讀者可以去參考這些書籍和期刊論文,以便獲得更深刻的理解。每章都附有練習題,許多練習題都是相對容易的,但也有一些較為高深,具有挑戰性。
這本書是數學傢寫的;因而寫作風格是數學導嚮的,本書的每個定理都附有證明。盡管如此,我們努力做到清晰明瞭,每個概念都用例子給予說明,盡可能揭示更多的直覺和動機。對於學習數學、計算機科學和精密科學、經濟學和社會科學以及生命科學的本科生和研究生來說,本書是一本閤適的教科書。本書可用於博弈論不同課程的教科書,具體取決於學生的層次、老師的時間以及課程的特定專題。例如,本書可用於聯盟型博弈、策略型博弈、博弈論導論、博弈論應用的學期課程,既可以是入門課程,也可以是高級課程。本書還可以用於高級的迷你課程,比如不完全信息(第9、10、11章)、拍賣(第12章)或者重復博弈(第13、14章)。如前所述,本書的章節內容供一個老師從中選取,綽綽有餘。這就要求老師要慎重選取講授哪些章以及每章中的哪些部分。例如,在講授策略型博弈(第4、5章)的時候,可以忽略擴展型博弈(第3章)或者效用理論(第2章)。同樣地,在講授不完全信息博弈(第9章)的時候,可以忽略不完全信息博弈模型的另外兩章(第10、11章)。
為瞭保持完整,我們在附錄中給齣瞭全書所使用的一些定理的證明,這些定理包括布勞爾不動點定理(Brouwer’s Fixed Point Theorem)、角榖不動點定理(Kakutani’s Fixed Point Theorem)、KKM定理和分離超平麵定理。附錄還包括瞭綫性規劃的一個簡要綜述。老師可以選擇在課堂上證明每個定理,或者把定理的證明布置為獨立閱讀材料,或者直接應用定理而不加證明,前提是學生們在其他課程中已經看到瞭這些證明。
好
評分好
評分非常好,快捷,方便。
評分好
評分好
評分好
評分非常好,快捷,方便。
評分非常好,快捷,方便。
評分好
博弈論 pdf epub mobi txt 電子書 下載