屬性數據分析 [An Introduction to Categorical Data Analysis] pdf epub mobi txt 電子書 下載 2024
內容簡介
近年來,針對屬性數據的特殊統計方法的應用日益廣泛,尤其是在生物醫學和社會科學領域。這個現象一定程度上反映瞭過去幾十年裏屬性數據分析方法的發展,同時也反映瞭科學傢和應用統計學傢方法論的日益精湛。如今,絕大多數科學傢和應用統計學傢已經意識到,將針對連續數據的分析方法應用於屬性數據是沒有必要而且通常是不閤適的。
《屬性數據分析》展示瞭針對屬性數據*重要的分析方法,概述瞭諸如卡方檢驗等長期占主導地位的方法。除此之外,《屬性數據分析》特彆強調瞭建模技巧,尤其是logistic迴歸。
《屬性數據分析》的錶述基於一個較低的技術層麵上,並不要求熟悉如微積分學和矩陣代數等高等數學內容。但是讀者應該具備一些相關統計背景知識。這些知識包括非統計專業的本科生或研究生兩學期的統計方法係列教材所含的內容,即估計、假設檢驗、迴歸模型。
《屬性數據分析》是為學習屬性數據分析入門課程的學生而設計。同時我也為應用統計學傢和在實際工作中涉及數據分析的科學傢而寫。我希望這《屬性數據分析》能對社會科學、行為科學和生物醫學領域,以及公共衛生、市場營銷、教育、生物、農業科學和工業質量控製等領域的分析師們處理屬性響應數據有所幫助。《屬性數據分析》1-8章涵蓋瞭*基礎的屬性數據分析方法。第2章將介紹諸如優勢比、獨立性檢驗、條件關聯性以及邊緣關聯性等針對列聯錶的標準描述方法和推斷方法。然而,我覺得可以通過在統計模型背景裏觀察統計方法以加強對它們的理解。因此,《屬性數據分析》其餘篇幅主要聚焦於屬性響應數據的建模。第3章將介紹二分數據和計數數據的廣義綫性模型。第4章以及第5章將討論二項(二分)數據的*重要的模型——logistic迴歸模型。第6章將介紹名義和有序多項響應的logistic迴歸模型。第7章將討論泊鬆(計數)數據的對數綫性模型。第8章將展示針對配對數據的分析方法。
內頁插圖
目錄
第1章 導言
1.1 屬性響應數據
1.1.1 響應變量和解釋變量的區彆
1.1.2 名義量錶和有序量錶的區彆
1.1.3 本書的結構
1.2 屬性數據的概率分布
1.2.1 二項分布
1.2.2 多項分布
1.3 比例的統計推斷
1.3.1 似然函數和極大似然估計
1.3.2 二項比例的顯著性檢驗
1.3.3 案例:關於墮胎閤法化的調查結果
1.3.4 二項比例的置信區間
1.4 關於離散數據的更多統計推斷
1.4.1 Wald,似然比和得分推斷
1.4.2 二項參數的Wald,得分和似然比推斷
1.4.3 小樣本二項推斷
1.4.4 小樣本離散數據推斷的保守性*
1.4.5 基於中間P-值的推斷*
1.4.6 小結
習題
第2章 列聯錶
2.1 列聯錶的概率結構
2.1.1 聯閤概率,邊緣概率以及條件概率
2.1.2 案例:關於來世
2.1.3 診斷檢驗的敏感度和特異度
2.1.4 獨立性
2.1.5 二項抽樣和多項抽樣
2.2 2×2錶比例的比較
2.2.1 比例差
2.2.2 案例:阿司匹林與心髒病
2.2.3 相對風險
2.3 優勢比
2.3.1 優勢比的性質
2.3.2 案例:阿司匹林和心髒病案例中的優勢比
2.3.3 優勢比和對數優勢比的推斷
2.3.4 優勢比和相對風險的聯係
2.3.5 案例對照研究中優勢比的應用
2.3.6 觀測研究的種類
2.4 獨立性的卡方檢驗
2.4.1 皮爾遜統計量和卡方分布
2.4.2 似然比統計量
2.4.3 獨立性檢驗
2.4.4 案例:政黨認同中的性彆差異
2.4.5 列聯錶的單元殘差
2.4.6 卡方統計量的分解
2.4.7 卡方檢驗的小結
2.5 有序數據的獨立性檢驗
2.5.1 綫性趨勢與獨立性
2.5.2 案例:飲酒與嬰兒畸形
2.5.3 有序檢驗的特殊功效
2.5.4 得分的選擇
2.5.5 I×2錶和2×J錶趨勢的檢驗
2.5.6 名義變量一有序變量列聯錶
2.6 小樣本的精確推斷
2.6.1 2×2錶的費希爾精確檢驗
2.6.2 案例:費希爾的品茶者試驗
……
第3章 廣義綫性模型
第4章 logistic迴歸
第5章 logistic迴歸模型的構建及應用
第6章 多類彆logit模型
第7章 列聯錶的對數綫性模型
第8章 配對數據的模型
第9章 關聯,聚簇響應的建模
第10章 隨機效應:廣義綫性混閤模型
第11章 屬性數據分析史漫談
附錄A:針對屬性數據分析的軟件
附錄B:卡方分布錶
參考文獻
案例索引
名詞索引
部分奇數號習題的簡要答案
前言/序言
近年來,針對屬性數據的特殊統計方法的應用日益廣泛,尤其是在生物醫學和社會科學領域。這個現象一定程度上反映瞭過去幾十年裏屬性數據分析方法的發展,同時也反映瞭科學傢和應用統計學傢方法論的日益精湛。如今,絕大多數科學傢和應用統計學傢已經意識到,將針對連續數據的分析方法應用於屬性數據是沒有必要而且通常是不閤適的。
本書展示瞭針對屬性數據最重要的分析方法,概述瞭諸如卡方檢驗等長期占主導地位的方法。除此之外,本書特彆強調瞭建模技巧,尤其是logistic迴歸。
本書的錶述基於一個較低的技術層麵上,並不要求熟悉如微積分學和矩陣代數等高等數學內容。但是讀者應該具備一些相關統計背景知識。這些知識包括非統計專業的本科生或研究生兩學期的統計方法係列教材所含的內容,即估計、假設檢驗、迴歸模型。
本書是為學習屬性數據分析入門課程的學生而設計。同時我也為應用統計學傢和在實際工作中涉及數據分析的科學傢而寫。我希望這本書能對社會科學、行為科學和生物醫學領域,以及公共衛生、市場營銷、教育、生物、農業科學和工業質量控製等領域的分析師們處理屬性響應數據有所幫助。本書1-8章涵蓋瞭最基礎的屬性數據分析方法。第2章將介紹諸如優勢比、獨立性檢驗、條件關聯性以及邊緣關聯性等針對列聯錶的標準描述方法和推斷方法。然而,我覺得可以通過在統計模型背景裏觀察統計方法以加強對它們的理解。因此,本書其餘篇幅主要聚焦於屬性響應數據的建模。第3章將介紹二分數據和計數數據的廣義綫性模型。第4章以及第5章將討論二項(二分)數據的最重要的模型——logistic迴歸模型。第6章將介紹名義和有序多項響應的logistic迴歸模型。第7章將討論泊鬆(計數)數據的對數綫性模型。第8章將展示針對配對數據的分析方法。
我認為logistic迴歸模型比對數綫性模型更加重要,因為在實際應用中多數屬性響應就是一個單獨的二項或多項響應變量。因此我將主要精力放在瞭與此模型有關的章節以及後麵章節中討論此模型推廣的部分。與本書第一版相比,第二版更加強調瞭logistic迴歸而較少強調對數綫性模型。
我喜歡通過使前述模型與通常的迴歸分析和ANOVA模型一緻化來教授屬性數據分析方法。第3章將通過廣義綫性模型來完成這個工作。一些教師可以選擇輕描淡寫地講授這一章,主要將這一章用來介紹二項數據的logistic迴歸模型(3.1及3.2節1。
第二版相對於第一版的主要變化是增加瞭兩章,這兩章主要是分析諸如具有個體重復測量的縱嚮研究中齣現的聚簇關聯屬性數據。第9章和第10章把第8章的配對方法推廣到聚簇數據中。第9章通過邊緣模型完成這項工作,並強調瞭廣義估計方程(GEE)方法,而第10章則基於隨機效應更充分地對關聯性進行建模。本書最後一章以曆史的角度迴顧瞭屬性數據發展的曆程(第11章),附錄給齣瞭本書中齣現的幾乎所有方法的SAS程序。
第1-8章的內容是屬性數據分析入門課程的核心部分。若想為其它主題留齣餘‘力,可以略過2.5、2.6、3.3、3.5、5.3-5.5、6.3、6.4、7.4、7.5以及8.3-8.6節。教師可以選擇9-11章的內容作為1-8章基礎主題的補充。本書加星號的章節相對次要,想要迅速接觸主題的讀者可以略過這些章節。
屬性數據分析 [An Introduction to Categorical Data Analysis] 下載 mobi epub pdf txt 電子書
屬性數據分析 [An Introduction to Categorical Data Analysis] pdf epub mobi txt 電子書 下載