发表于2024-11-27
SAS金融數據挖掘與建模:係統方法與案例解析 pdf epub mobi txt 電子書 下載 2024
SAS公司官方齣品,SAS大學授權編寫,SAS全國高校數據分析大賽指定參考書
作者在銀行等金融領域有近20年工作經驗,是資深的數據挖掘與分析專傢
本書以金融客戶生命周期管理為主綫,純實戰導嚮,通過5個經典案例詳細講解金融數據挖掘與建模的方法與技巧
這是一部從實戰角度講解如何利用SAS對金融數據進行挖掘與建模的專著,由SAS大學授權撰寫,是SAS大學的指定參考書,也是“SAS大學技術叢書”的*一本書。
全書兩條主綫:
主綫1:金融客戶(信貸)的生命周期管理,通過5個具有代錶性的案例,講解瞭金融客戶再獲取、提升、成熟、衰退、挽留這5個階段的關鍵數據的挖掘與建模方法;
主綫2:數據挖掘項目的生命周期管理,把項目生命周期的各個階段的關鍵技術和處理方法融入到案例中,串接起一個一個獨立、完整的實戰場景。
全書一共6章:
第1章介紹瞭數據挖掘和建模在信貸(信用卡)客戶生命周期管理中的15個主要應用場景;
第2章通過信用卡客戶反欺詐案例,講解瞭如何應用隨機森林算法構建欺詐評分模型;
第3章通過信用卡客戶精準營銷案例,講解瞭營銷響應模型的構建、評估與應用;
第4章通過信用卡客戶細分講解瞭完整的聚類過程,對聚類做瞭*完整的闡釋;
第5章通過貸款違約預測案例,為零建模基礎的讀者提供瞭一個簡化版的行為評分模型;
第6章結閤信用卡客戶流失預警與挽留案例,講解瞭客戶價值(數值)預測與流失傾嚮(事件)預測兩類問題的組閤建模與應用。
不拘泥於方法本身,彰顯瞭以企業實際運用為導嚮的寫作思路,讓案例更具實用參考價值。五個案例之後,你會發現這些方法和模型在大部分業務場景中似曾相識,金融企業數據挖掘與建模將變得迎刃而解。
陳春寶
上海交通大學工業工程博士,現任職於某商業銀行,擔任大數據專傢。在銀行、信用卡、醫藥與電信等行業擁有十年數據挖掘與建模經驗,工作跨大數據、營銷、風控、運營等多個領域,擅長診斷各類業務問題,應用商業和大數據手段獲得創新性的解決方案並有效實施。曾擔任美國管理科學協會谘詢顧問、交通銀行信用卡中心數據分析經理、上海交大工程碩士企業導師。
著有《大數據與機器學習:實踐方法與行業案例》一書,在SCI&EI;索引期刊發錶論文10餘篇。
徐筱剛
上海某金融機構高級數據分析師,具有深厚的數理統計與應用數據分析專業背景,8年數據分析與挖掘從業經驗,曾就職零售企業、谘詢公司等,獨立或帶團隊完成零售、電信、金融等多個大型數據挖掘項目。
田建中
北京師範大學管理學碩士,先後在電信業、銀行業從事數據倉庫建設、數據建模谘詢等工作,對數據挖掘在營銷中的應用有深入研究,擁有10多年的SAS開發經驗。曾就職於河北移動、美商天睿有限公司,現就職於某大型商業銀行大數據管理部,從事數據挖掘、業務用例研究及營銷體係建設等工作。
如何挖掘數據資産,並應用於業務實踐,産生價值,需要一套係統的方法和工具,本書正好結閤具體的案例,深入淺齣地迴答瞭這個問題,對從事大數據分析與挖掘的數據人有很好的參考價值。
——鄭承滿 廈門銀行CIO
數字化是銀行經營客戶的趨勢,數據分析和應用的變現能力是核心。本書歸納瞭客戶數字化經營的主要場景,並選取代錶性案例進瞭行剖析和介紹,對從業人員授之以漁,值得推薦。
——楊誌敏 浦發銀行零售業務管理部副總經理
把數據挖掘比作一場獵取寶藏的屠龍之旅,卻有太多屠龍之術濃墨重彩於寶藏之瑰麗或神兵之鋒利。而本書更像是作者把他們親曆的一次次真實冒險娓娓道來,把讀者帶入一個個真實的場景,與作者一起麵臨險境,審時度勢,化險為夷。曆經百轉韆迴纔得峰迴路轉,柳暗花明。一氣讀完,頓覺身上的行囊充實瞭許多,遠處寶藏的光輝也真實瞭幾分,便急不可耐的踏上瞭新的冒險旅程。
——王曉 太平洋人壽保險客戶資源整閤部高級經理
寫法化繁為簡,案例源自實踐,很多分析方法和代碼可以直接復用,對挖掘建模人員具有很強的導嚮性和啓發性,無論使用SAS或開源工具,都能從分析思路中受益。
——鍾飛 螞蟻金服風控策略專傢
這是一套涵蓋SAS編程語言、SAS應用實操、SAS統計理論分析的工具書,內容專業精深,語言淺顯易懂,案例貼近熱點業務需求,真可謂一套心血之作、誠意之品、價值之典!
——萬平 平安銀行總行大數據決策管理部
數字化轉型是銀行業未來十年的發展趨勢,大數據的分析與應用能力至關重要。本書係統歸納瞭數字化客戶經營的主要場景,並選取*有代錶性的案例介紹分析建模過程,寫法通俗易懂,對技術和業務人員提升數字化客戶經營能力都很有幫助。
——吳純傑 上海財經大學統計與管理學院副院長
SAS是統計分析軟件領域的標杆,以功能強大著稱,已經有超過40年的曆史。由SAS技術大學精英學院組織撰寫的這套書,有SAS編程的主題,有SAS EG和SAS EM這樣的重要工具,還有金融數據挖掘與建模這樣的行業應用,內容係統、立體、豐富,強烈推薦!
——俞章盛 上海交通大學教授/博士生導師
SAS是全球分析領域的引*者,數十年來一直緻力於應用分析解決*睏難的業務問題,在統計分析、商業智能、客戶智能、數據管理、風險管理、欺詐與安全智能等多個領域獨樹一幟。相信由SAS技術大學官方編寫的係列參考書,一定能將SAS的技術精華和優秀實踐總結、提煉齣來,奉獻給廣大的SAS技術、産品的支持者和使用者們。
——宇傳華 武漢大學教授/博士生導師
在開源軟件大行其道的今天,作為商業軟件,SAS不僅沒有沒落,反而正爆發齣更強大的生命力,這與SAS公司與時具進的創新能力是分不開的。SAS的技術和産品在不斷改進,SAS的教育工作也一直做得很好,每年一度的“高校SAS數據分析大賽”在教育界的影響力越來越大。他們齣版的“SAS大學技術叢書”一定能再為他們的SAS教育工作添磚加瓦。
——楊啓貴 華南理工大學教授/數學學院副院長/博士生導師
Contents 目 錄
贊譽
序
前言
第1章 金融數據挖掘與建模應用場景 1
1.1 客戶數據挖掘的價值 1
1.2 金融客戶生命周期及數據應用場景 3
1.3 最具代錶性的數據應用場景 7
第2章 客戶獲取:信用卡客戶欺詐評分案例 8
2.1 案例背景 9
2.2 數據準備與預處理 10
2.2.1 數據源 10
2.2.2 變量設計 11
2.3 構建評分模型 13
2.3.1 算法選擇 13
2.3.2 模型訓練 14
2.3.3 模型評估 16
2.4 評分模型的應用 19
2.5 小結 20
第3章 客戶提升:信用卡客戶精準營銷案例 21
3.1 案例背景 21
3.2 建模準備 21
3.2.1 準備數據 22
3.2.2 數據預處理 26
3.2.3 過度抽樣 27
3.2.4 構造訓練集及測試集 30
3.3 數據清洗及變量粗篩 32
3.3.1 連續變量與連續變量之間 33
3.3.2 分類變量和分類變量之間 39
3.3.3 分類變量和連續變量之間 43
3.3.4 數據的錯誤及缺失值 47
3.3.5 數據離群值 53
3.3.6 重編碼 59
3.4 變量壓縮與轉換變量 61
3.4.1 分類變量的水平數壓縮 61
3.4.2 連續變量聚類 65
3.4.3 連續變量的分箱 77
3.4.4 變量的轉換 79
3.5 模型訓練 80
3.5.1 關於Logistic迴歸 80
3.5.2 變量篩選方法 81
3.6 模型評估 88
3.6.1 模型估計 88
3.6.2 模型評估 89
3.6.3 調整過度抽樣 98
3.6.4 收益矩陣 98
3.6.5 模型轉換為打分卡 100
3.7 模型的部署及更新 100
3.7.1 模型的部署 100
3.7.2 模型的監測及更新 101
3.8 本章小結 103
第4章 客戶成熟:銀行零售客戶渠道偏好細分案例 104
4.1 案例背景 104
4.2 聚類分析流程 105
4.3 數據標準化 107
4.3.1 標準化介紹 107
4.3.2 標準化實現 110
4.4 變量聚類 111
4.4.1 變量聚類介紹 111
4.4.2 變量聚類基本步驟 112
4.4.3 SAS實現變量聚類 113
4.5 變量降維與可視化 118
4.5.1 圖形化探索 118
4.5.2 主成分分析法降維 120
4.6 ACECLUS預處理過程 123
4.6.1 ACECLUS介紹 123
4.6.2 ACECLUS過程 123
4.6.3 ACECLUS示例 123
4.7 係統聚類分析 128
4.7.1 係統聚類法 128
4.7.2 樣本與樣本之間的度量 129
4.7.3 距離定義與測量 129
4.7.4 相關係數 131
4.7.5 類與類之間的度量 131
4.7.6 係統聚類法 139
4.7.7 不同係統聚類法之間的比較 140
4.7.8 類個數的確定 158
4.8 快速聚類 159
4.8.1 快速聚類法 159
4.8.2 快速聚類法實現 160
4.8.3 快速聚類法優缺點 161
4.9 兩步聚類法 161
4.9.1 兩步聚類法 161
4.9.2 兩步聚類法實現 161
4.10 本章小結 167
第5章 客戶衰退:銀行貸款違約預測案例 168
5.1 案例背景 169
5.2 維度分析 170
5.3 建模分析 177
5.4 業務應用 179
5.5 小結 179
第6章 客戶挽留:信用卡客戶流失管理案例 180
6.1 案例背景 181
6.2 數據準備 182
6.2.1 設定目標變量 182
6.2.2 設定時間窗 183
6.2.3 設計預測變量 184
6.2.4 準備數據寬錶 185
6.3 流失傾嚮預警:用Logistic迴歸構建響應率模型 186
6.3.1 粗分類 187
6.3.2 計算分組變量的WOE值和IV值 191
6.3.3 共綫性檢驗 194
6.3.4 模型訓練:顯著性檢驗 195
6.3.5 模型評估 196
6.4 潛在客戶價值預測:兩階段建模法 201
6.4.1 階段1概率預測 201
6.4.2 階段2 數值預測 201
6.4.3 模型評估 203
6.5 細分:差異化營銷服務的基礎 204
6.6 小結 208
Praise 贊 譽
數字化轉型是銀行業未來十年的發展趨勢,大數據的分析與應用能力至關重要。本書係統歸納瞭數字化客戶經營的主要場景,並選取最有代錶性的案例介紹分析建模過程,寫法通俗易懂,對技術和業務人員提升數字化客戶經營能力都很有幫助。
——吳純傑 上海財經大學統計與管理學院副院長
SAS是統計分析軟件領域的標杆,以功能強大著稱,已經有超過40年的曆史。由SAS技術大學精英學院組織撰寫的這套書,有SAS編程的主題,有SAS EG和SAS EM這樣的重要工具,還有金融數據挖掘與建模這樣的行業應用,內容係統、立體、豐富,強烈推薦!
——俞章盛 上海交通大學教授/博士生導師
SAS是全球分析領域的引領者,數十年來一直緻力於應用分析解決最睏難的業務問題,在統計分析、商業智能、客戶智能、數據管理、風險管理、欺詐與安全智能等多個領域獨樹一幟。相信由SAS技術大學官方編寫的係列參考書,一定能將SAS的技術精華和優秀實踐總結、提煉齣來,奉獻給廣大的SAS技術、産品的支持者和使用者們。
——宇傳華 武漢大學教授/博士生導師
在開源軟件大行其道的今天,作為商業軟件,SAS不僅沒有沒落,反而正爆發齣更強大的生命力,這與SAS公司與時俱進的創新能力是分不開的。SAS的技術和産品在不斷改進,SAS的教育工作也一直做得很好,每年一度的“高校SAS數據分析大賽”在教育界的影響力越來越大。他們齣版的“SAS大學技術叢書”一定能再為SAS教育工作添磚加瓦。
——楊啓貴 華南理工大學教授/數學學院副院長/博士生導師
Foreword 序
大數據的浪潮正漸漸平靜,整個行業已逐漸趨於成熟和理性。喧囂與嘈雜漸遠之時,纔能更清晰地透過錶象,看清事情的本質。大數據需要精挖掘,好客戶需要勤耕耘,再好的故事,再炫的包裝,再酷的産品,分析基礎還是以CRISP方法為主流,做好數據采集、清洗、整閤、建模、分析、部署與調優;經營基礎還是“客戶為中心”的市場營銷,通過信息對稱與否的博弈來駕馭經營風險,再給予風險成本加權計算基礎上的損益評價。大數據的世界有時確實沒錶麵上那麼“性感”,而是非常“感性”。對於從事大數據相關工作的大多數專業人士,尤其是年輕朋友而言,詩與遠方雖可築夢,但要真正走得長遠,還是需要真本領,需要耐著寂寞,翻開書本,擼起袖子,在實踐中學習,在學習中實踐。
書如其人。陳春寶博士的這本書和他本人一樣,不太容易評價。多樣、豐富、立體,因此復雜,需要多花些時間去深入細品,纔能發現如同一篇好的散文,貴在“形散而神不散”。全書圍繞兩條主綫,一條是金融客戶生命周期管理,另外一條是數據挖掘項目和模型的生命周期管理,這兩條主綫串接起瞭一個一個獨立、完整的實戰場景。這樣的組織方法使讀者學習各篇完整成章時,能按圖索驥,實踐參考;兩條主綫也使得知識點跳躍較大,給人點到即止的感覺。因此建議結閤其他書籍同步研讀,效果會更好。比如,客戶關係管理方麵的,V.庫馬爾的《贏得盈利客戶》;數據挖掘領域的,本書作者的另一部著作《大數據與機器學習:實踐方法與行業案例》。
金融數據的價值密度之高,堪稱數據中的黃金。以銀行為代錶的金融機構對數據的深入挖掘分析與應用,起步不可謂不早,投入不可謂不大,成果不可謂不多,但是在這波風口中,由於內因、外因和低調(網紅經濟時代,低調可真是“緻命”的優點),卻常常被懟到瞭市場邊緣,連市麵上關於大數據與數據挖掘方麵的實戰類專業書籍,也大多齣自互聯網同仁之手。其實銀行及各傢金融機構藏龍臥虎,不乏像三位作者這樣能夠洞察業務,兼具豐富實操經驗和紮實理論功底的高手。衷心期待陳春寶博士能繼續堅持下去,並帶動更多金融機構的同仁們積極行動進來,齣版更多優秀的,特彆是實戰類的書籍,共同為大數據時代增添一抹屬於金融數據科學傢們的彆樣風采。
陸小勇
浦發銀行信息科技部副總經理,信息服務中心主任
Preface 前 言
古之欲明德於天下者,先治其國;欲治其國者,先齊其傢;欲齊其傢者,先修其身;欲修其身者,先正其心;欲正其心者,先誠其意;欲誠其意者,先緻其知;緻知在格物。
——《禮記》
知之真切篤實處即是行,行之明覺精察處即是知。
——王陽明
大數據勢不可擋。然而,對於多數公司來說,數據分析和建模能力尚未完全發展起來,雖主觀意識上認同瞭大數據的潛在價值,也開始采集、儲備數據,卻不知如何纔能讓數據充分融入業務、幫助業務部門達成業務指標。
大數據是一種全新的業務和産品創新思維,是海量數據存儲和計算的基礎架構,但小數據的分析運用纔是多數公司和業務領域必須關注和掌握的核心能力。本書將聚焦於實踐應用,介紹數據分析、建模的方法和在業務領域的實際應用,原理和基礎理論知識不是重點,因此數學公式極少,除非它比文字更能錶達內容。總體上,本書不會詳細羅列最熱門的機器學習算法、數據挖掘方法以及人工智能,而是基於金融企業當前的實際需要,精選最具代錶性的業務領域以及被廣泛驗證實用高效的分析建模技術,這些技術是數據分析人員必須掌握的技能。本書同時也是為掌握統計學知識和基本數據分析方法的業務專傢所寫,幫助他們實踐、應用數據建模手段,提升對業務的引導和駕馭能力。
本書的目標讀者是高級數據分析師、谘詢顧問、企業內部的業務專傢、高校學者和研究生,以及立誌於夯實數據建模基本功,並希望不斷提升的數據挖掘與數據建模人員。
內容提要
知者過之,愚者不及也;賢者過之,不肖者不及也。
——《中庸》
在學校和生活中,工作的最重要的動力是工作中的樂趣,是工作獲得結果時的樂趣以及對這個結果的社會價值的認識。
——阿爾伯特·愛因斯坦
本書是一本介紹金融企業數據建模的專著。在內容上,書中以信貸(信用卡)客戶的生命周期管理為主綫,選取瞭5個在客戶獲取、提升、成熟和衰退環節的最經典的金融企業案例,來詳細介紹最具價值與實用性的數據建模過程,每個案例既自成體係又前後呼應。
第1章介紹瞭數據挖掘和建模在信貸(信用卡)客戶生命周期管理中的應用場景。
第2章結閤信用卡客戶反欺詐案例,介紹瞭常用的三類反欺詐手段以及欺詐評分模型的構建過程,模型采用機器學習集成算法的典範——隨機森林,並給齣SAS代碼(各類書中絕無僅有),對迴歸類、決策樹類、神經網絡類三大類機器學習算法做瞭比對。
第3章結閤信用卡客戶精準營銷案例,介紹瞭營銷響應模型的構建、評估與應用,完整闡述從數據準備、清洗、變量粗篩選、變量壓縮與轉換、建模、模型評估、部署、監測與更新等模型構建過程中所涉及的操作方法。
第4章通過信用卡客戶細分案例,介紹瞭完整的聚類過程,除快速、係統、兩步聚類算法外,還詳細介紹瞭實際分析過程中必不可少的數據預處理過程,並對聚類模型做瞭最完整的闡釋。
第5章通過貸款違約預測案例,為零建模基礎的讀者提供瞭一個最簡化的行為評分模型的構建過程,幫助零基礎讀者快速上手,同時簡單介紹瞭金融企業的三大風險模型(評分卡)。
第6章結閤信用卡客戶流失預警與挽留案例,介紹客戶價值(數值)預測與流失傾嚮(事件)預測兩類問題的建模過程及組閤應用,不拘泥於方法本身,彰顯瞭以企業實際運用為導嚮的寫作思路,讓案例更具實用參考價值。
瞭解完五個案例之後,你會發現這些方法和模型在大部分業務場景中似曾相識,金融企業的數據挖掘與建模將變得易如反掌。
全書由陳春寶統稿,其中,第1、2、5、6章由陳春寶撰寫,第3章由徐筱剛撰寫,第4章由田建中撰寫。
源代碼下載
若你對書中源代碼感興趣,可與作者聯係,郵箱:64346 SAS金融數據挖掘與建模:係統方法與案例解析 下載 mobi epub pdf txt 電子書
太薄瞭,乾活多些就好
評分印刷精美物流快點個贊
評分不錯
評分大概翻瞭一下,貌似有些乾貨,以後仔細研究
評分內容很實用,對工作很有藉鑒意義,不是紙上談兵的概念,理論結閤實際,還是不錯的
評分不錯
評分可以,不錯
評分很好,不錯;還好,值得參考
評分不錯的書籍,給同事代買的,物流也很快。
SAS金融數據挖掘與建模:係統方法與案例解析 pdf epub mobi txt 電子書 下載