內容簡介
如果想成為一名應用定量分析研究者,分析抽樣或其他定量數據集,以支持所涉及領域的大量文獻知識,*後發錶你的研究結果。本書正是為此所設計。它是基於兩個分學期的課程和作者在加州大學洛杉磯分校過去30多年的教學,並跟蹤社會學和其他社會科學領域定量分析方法新發展成果的基礎上成書的。本書的特點是沒有復雜的數學推導,通過大量的實例領會社會科學研究的基本邏輯和設計思想,圖文並茂,淺顯易懂,把握前沿新社會科學成果。
作者簡介
Donald J. Treiman是加州大學洛杉磯分校(UCLA)社會學榮休傑齣教授、UCLA加州人口研究中心前主任。他從Reed College獲得學士學位(1962年),在芝加哥大學獲得碩士和博士學位(1967年)。在研究生階段,他大多數時間在芝加哥大學全國民意研究中心(National Opinion Research Center, NORC)學習和工作。在那裏,他在調查研究方麵受到瞭良好的訓練,並積纍瞭寶貴經驗。之後,他任教於威斯康辛大學,在那裏決心成為一名真正的社會人口學傢,並將人口和生態研究中心當作他的學術之傢。此後,他在哥倫比亞大學工作過一段時間。1975年,他轉到UCLA任教直到現在。在此期間,他在其他一些地方做過短暫訪問,比如在國傢科學院/國傢研究理事會擔任一個研究委員會的主任(1978~1981年),在美國人口普查局(1987~1988年)、行為和社會科學高等研究中心(1992~1993年)、荷蘭人文和社會科學高等研究院(1996~1997年)任研究員。
唐啓明(Donald J. Treiman)是加州大學洛杉磯分校(UCLA)社會學榮休傑齣教授,UCLA加州人口研究中心前主任。他在Reed College獲得學士學位(1962年),在芝加哥大學獲得碩士和博士學位(1967年)。研究生階段,他大多數時間在芝加哥大學全國民意研究中心(National Opinion Research Center,NORC)學習和工作。在那裏,他受到良好的調查研究方麵的訓練,並積纍瞭寶貴的經驗。之後,他任教於威斯康星大學,決心成為一位真正的社會人口學傢,並將人口和生態研究中心當作他的學術之傢。他在哥倫比亞大學也工作過一段時間。1975年,他轉到UCLA任教至今。在此期間,他到其他一些地方做過短暫訪問,如在國傢科學院/國傢研究理事會擔任一個研究委員會的主任(1978~1981年),在美國人口普查局(1987~1988年)、行為和社會科學高等研究中心(1992~1993年)、荷蘭人文和社會科學高等研究院(1996~1997年)任研究員。唐啓明教授的職業生涯從學生時代就已經開始,當時他的研究方嚮是社會分層和地位獲得,並主要側重於跨國比較研究,這一直是他的研究興趣所在。他與荷蘭同事Harry Ganzeboom一直從事一項比較分析20世紀世界各國地位獲得過程差異的長期項目。截至目前,他們編撰瞭一個跨越上半個世紀、源自50多個國傢的300多個抽樣調查的文檔。除瞭該比較項目之外,唐啓明教授在南非(1991~1994年)、東歐(1993~1994年)和中國(1996年)都做過大規模的全國性抽樣調查,內容都是關注社會不平等的各個方麵。他現在的研究已經轉嚮一個更偏於人口學的方嚮。2008年,他在中國開展瞭一項全國性抽樣調查,主要關注國內人口遷移的影響因素、機製和結果。他目前正參與另一項有關中國的調查,主要關注遷移對留守兒童和隨父母遷移兒童的影響。
任強,北京大學人口研究所碩士、博士,北京大學社會研究中心副教授、北京大學中國社會科學調查中心副主任。研究興趣包括環境與健康、兒童發展,以及與生育、死亡、勞動力、住房、齣生性彆比等相關的人口問題。目前作為負責人之一主要參與“中國傢庭追蹤調查”項目。在兒童碘缺乏病控製方麵有突齣學術貢獻,2003年獲得美國兒科學會傑齣成就奬。發錶學術文章近100篇。
目錄
錶目錄/1
圖目錄/1
英文版序言/1
中文版序言/5
譯者序言/7
導 言/11
第1 章 列聯錶基礎/1
本章內容/1
通過具體實例介紹全書/1
列聯錶/9
本章小結/19
第2 章 列聯錶中的變量關係/20
本章內容/20
分析的邏輯/20
抑製變量/24
相加效應和交互效應/25
直接標準化/28
關於統計控製與實驗的最後說明/40
本章小結/42
第3 章 列聯錶的拓展/44
本章內容/44
重新組織錶格以獲取新的信息/44
何時用“反嚮”百分數錶/47
當因變量為均值時的列聯錶/49
相異指數/54
如何描述列聯錶/57
本章小結/59
第4 章 用計算機進行數據操作/60
本章內容/60
引言/60
如何組織數據文件/61
變換數據/67
本章小結/75
附錄用Stata進行分析/75
用Stata進行分析的一些建議/75
一些特彆有用的Stata 10.0命令/80
第5 章 相關和迴歸(常規最小二乘法)介紹/83
本章內容/83
引言/83
量化某種關係的大小:迴歸分析/85
評估某種關係的強度:相關分析/87
相關和迴歸係數之間的關係/90
影響相關(和迴歸)係數大小的因素/90
相關比率/95
本章小結/97
第6 章 多元相關和迴歸(常規最小二乘法)介紹/99
本章內容/99
引言/99
一個具體例子:中國人識字水平的決定因素/109
虛擬變量/115
組間比較的方法/118
比較模型的貝葉斯方法/127
獨立檢驗/130
本章小結/131
第7 章 多元迴歸技巧:處理特殊分析問題的技術/132
本章內容/132
非綫性變換/132
檢驗係數的等價性/140
趨勢分析:檢驗綫性假設/142
綫性樣條/146
將係數錶示為總均值的偏差(多分類分析)/155
錶示虛擬變量的其他方法/158
分解兩個均值之差/163
本章小結/169
第8 章 缺失數據的多重填補法/171
本章內容/171
引言/171
一個具體例子:在俄羅斯,文化資本對教育獲得的影響/177
本章小結/183
第9 章 抽樣設計與調查估計/184
本章內容/184
調查樣本/184
設計效應/196
結論/210
本章小結/210
第10 章 迴歸診斷/212
本章內容/212
引言/213
一個具體例子:地位獲得的社會差異/216
穩健迴歸/224
自舉法和標準誤/226
本章小結/228
第11 章 測度構建/230
本章內容/230
引言/230
效度/231
信度/232
測度構建/235
含誤差變量迴歸/247
本章小結/248
第12 章 對數綫性分析/249
本章內容/249
引言/249
選擇一個閤適的模型/251
簡約模型/264
文獻注釋/279
本章小結/281
附錄12.A 效應參數的推導/281
附錄12.B 最大似然估計法介紹/283
正態分布的均值/284
對數綫性參數/285
第13 章 二項邏輯斯蒂迴歸/286
本章內容/286
引言/286
與對數綫性分析的關係/288
邏輯斯蒂迴歸的第一個具體例子:預測槍械威脅的發生率/289
第二個具體例子:日本的教育遞進率/298
第三個具體例子(離散時間風險率模型):初婚年齡/302
第四個具體例子(案例-對照模型):在俄羅斯,誰被任命為政黨當權人物?/309
本章小結/312
附錄13.A 關於對數和指數的一些代數基礎/312
附錄13.B Probit分析介紹/312
第14 章 多項和序次邏輯斯蒂迴歸及tobit迴歸/317
本章內容/317
多項logit分析/317
序次邏輯斯蒂迴歸/323
針對刪失因變量的tobit迴歸(及同類方法)/332
針對受限因變量的其他分析模型/339
本章小結/340
第15 章 改進因果推斷:固定效應與隨機效應模型/341
本章內容/341
引言/341
針對連續型變量的固定效應模型/343
針對連續型變量的隨機效應模型/349
一個具體例子:中國收入的決定因素/351
針對二分結果變量的固定效應模型/353
針對二分結果變量的隨機效應模型/355
一個二分結果變量的具體例子:遷移對南非黑人入學的影響/355
文獻注釋/358
本章小結/358
第16 章 思考與未來的方嚮:研究設計和解釋問題/359
本章內容/359
研究設計問題/359
概率抽樣的重要性/376
最後一個建議:養成良好的專業素養/379
本章小結/384
附錄A 書中所用數據的說明和下載地址/385
附錄B 用綜閤社會調查數據做調查估計/388
參考文獻/393
索 引/418
前言/序言
英文版序言
這本書是關於如何開展理論導嚮的量化社會研究的——也就是說,通過社會研究檢驗想法。它源自我在加州大學洛杉磯分校(UCLA)30多年教授來自社會學、其他社會科學以及以社會科學為基礎的專業學院(公共衛生、教育、社會福利、城市規劃等)的研究生的課程。此課程是隨著社會科學量化方法的發展演化而來的;早期課程隻講授本書的前一半內容(前7章),之後逐年增加新資料。有意思的是,從一開始我就一直保持同樣的授課模式——在為期20周的學期內,每周授課三小時,並布置一次練習,期末要求學生在最後四周內提交一篇學期論文——以期不斷提高社會科學領域的研究生在量化研究方麵的能力。當然,本書也歸功於多年來活躍的課堂討論,尤其是在一些細微和復雜的方法問題上。
讀完本書,你們或許能夠知道如何從本質上理解量化數據。也就是說,你們能夠在自己所學的領域很好地準備可發錶的論文,以及一流的畢業論文章節。當然,總是有更多的東西需要學習。在最後一章(第16章),我討論瞭一些高級方法,這些方法超齣瞭數據分析初級課程所能涵蓋的範圍。
本書主要對明確定義的總體的代錶性樣本數據進行分析,當然也涉及一些特例。總體幾乎可以包括任何東西——人口、正式組織、社會、職業、陶瓷碎片,或任何其他事物;分析的問題實質上是一樣的。本書隻是附帶地提到數據收集方法,原因很簡單:本書篇幅已經很長,沒有足夠的篇幅同時介紹數據分析和數據收集方法。因此,你們可以查閱其他的係統介紹數據收集方法的文獻。我強烈建議你們應該在選修瞭數據分析課程之後而不是之前去做這件事情,因為在設計數據收集時主要問題是決定收集什麼,這意味著你們首先需要知道如何開展你們的分析。當然,你們也可以通過參與調查(可能無報酬)來學習數據收集的各種實用細節,並堅持參與每個過程——即使你們的參與毫無意義。
這本書涵蓋瞭多種技術,包括錶格分析(tabular analysis)、針對錶格數據的對數綫性模型(log-linear models)、各種形式的迴歸分析(regression analysis)、迴歸診斷(regression diagnostics)和穩健迴歸(robust regression)、處理缺失數據(missing data)的各種方法、邏輯斯蒂迴歸(logistic regression)、用於構建測度的因子分析技術(factor-based techniques)和其他技術,以及作為一種因果推論方法的固定效應和隨機效應模型。但是,這不是一本統計學教科書;本書強調使用這些方法對社會如何運行進行研究,並得齣相關結論。因此,本書是針對選修瞭第一年研究生統計課程之後的社會科學學生設計的。雖然書中有許多方程,但這是為理解統計方法的原理並靈活運用它們所必需的。本書的重點在於應用,因此書中提供瞭許多實際例子,且大多數引自我自己的研究。除瞭我自己收集的抽樣調查數據之外,我也大量利用瞭美國綜閤社會調查(General Social Survey)數據——一項為研究和教學目的而設計的綜閤調查。附錄A介紹瞭許多文獻都使用過的主要數據集,並提供瞭如何獲取數據的信息;它們都可以免費獲得。
閤理使用此書僅需的前提條件是,選修過一門初級研究生水平的社會科學統計學課程,認真思考和努力工作的意願,以及具備高中代數知識的基礎——無論是沒有忘記還是重新學習。除瞭少數例外(涉及一點微積分和矩陣代數的內容),所有數學內容都沒有超齣高中代數知識的範圍。如果你們對高中代數知識已經生疏瞭,可以參閱Helen Walker的Mathematics Essential for Elementary Statistics和W.L.Bashaw的Mathematics for Statistics。這兩本書很容易找到。雖然最近也有類似的書,但中學代數的內容沒有變化,所以版本無關緊要。這些書可以從amazon.com網上和其他許多地方購買。
本書中使用的統計軟件包是Stata(版本10)。用於計算的命令文件(Stata的專業術語-do-文件)、結果文件(-log-文件)和輔助計算機文件可以從網站www.josseybass.com/go/quantitativedataanalysis下載。
某些計算的具體細節通常隻能從下載的-do-和-log-文件中找到,所以務必要下載並仔細研究它們。這些文件會根據Stata的版本進行更新。
我在教學和此書中都使用Stata,因為它已迅速成為一流社會學係和經濟學係優先選擇的統計軟件包。這不是偶然的。Stata是一個運算速度快和效率高的軟件包,它包括絕大多數社會科學傢感興趣的統計方法,並且能快速地添加新命令。雖然現在有許多統計軟件包可供使用,但目前最有競爭力的三個軟件包是Stata、SPSS和SAS。其中,Stata明顯優於SPSS——它速度快,更加準確,且應用廣泛。雖然SAS很強大,但不如Stata那樣直觀,且更不易學習(和講授)。此外,本書可以很容易地與SPSS或SAS結閤起來使用,隻需簡單地轉換Stata-do-文件中的句法〔我已經嘗試做瞭一些,通過寫齣相應的Stata句法重現Allison基於SAS對固定和隨機效應模型的完美指令(Allison,2005)〕。
給教師的建議
當你們做課程設計時,我在講課中是如何使用這些資料的一些經驗或許對你們有幫助。
像前麵提到的,以本書為基礎的課程持續兩個小學期(two quarters,共20周)。我每周講一次3個小時的課,並布置一次作業。講完課後,我親自批閱這些作業;但隨著學生人數的增加,我請助教(從以前課上錶現好的學生中選擇)協助我批閱作業,並解答學生在計算和統計學方麵的疑問。最近幾年,我兩個小學期講17周課,前16周每周布置作業,期末要求學生提交一篇學期論文。對學生論文的第一份草稿,我力爭效仿期刊投稿的過程閱讀並寫齣評論。因此,在我的課上,每個人都會收到“修改和再提交”的反饋。我鼓勵學生根據我的反饋意見繼續完善他們的學期論文,並在最後一次作業結束後兩周提交第二份草稿。
最初的練習在一定程度上是為引導學生進入分析過程而設計的,後來的一些練習也是如此。但是,後麵的練習形式更自由,要求學生“像書中講解的那樣進行分析”。對於有明確答案的練習,我提供瞭完整而詳細的答案——類似於統計學習題集。
課程大綱、每周的練習以及練習詳解可以從網站www.josseybass.com/go/quantitativedataanalysis下載。
緻 謝
像前麵提到的,這本書是在UCLA與許多不同年級的研究生互動的基礎上不斷完善起來的,他們對每一章都做齣瞭重要貢獻,並通過詳細評論或提齣疑問的方式,指齣講解中存在的問題。如果沒有他們,就不會有此書,因為我從來沒有想到自己會寫一本教材,所以我非常感謝他們。尤其是Pamela Stoddard真正促成瞭這本書以當前的形式齣版,之前她在飛機上偶遇Jossey-Bass的圖書編輯Andrew Pasternack,談到她的教授正考慮將授課的章節寫成一本教材。Andy聯係我,後來的事情就盡人皆知瞭。
這門課程最早是與我的同事Jonathan Kelley閤作講授的,20世紀70年代他是UCLA的一名訪問教授。第一個練習就是他提供的,課程總的進展,特彆是前半部分,大多數歸功於他。
我的同事Bill Mason是我多年的統計學導師,他最近從UCLA社會學係和統計學係退休。我經常得益於他對疑難統計問題的洞察力,而且我學到的許多在研究生階段沒有學到的知識都來自旁聽他的高級統計課程。另一位同事Rob Mare同樣給我很多類似的幫助。我的新同事Jennie Brand在2008年鞦接手我的量化數據分析課,她閱讀瞭全部手稿,並提齣許多有益的建議。Stata公司作者支持項目部(Author Support Program)的Bill Rising檢查瞭所有Stata的下載-do-文件,並且提齣瞭許多改進和更新的建議,從而保證它們是目前最好的練習。最後,這本書極大地得益於約100名中國學生的仔細閱讀,2008年6月我在北京大學給他們講授這門暑期課程。他們發現瞭許多未被察覺的錯誤,並指齣一些錶述模棱兩可的地方,促使我重新完善書中部分內容。
我對研究設計和統計問題的理解,尤其是對因果關係和因果推論的挑戰,極大地得益於加利福尼亞人口研究中心(California Center for Population Research)每周舉辦的講座。參加講座的有社會學傢、經濟學傢以及其他社會科學傢,特彆是來自其他學校的訪問學者,大傢一起聆聽和評論,報告研究進展。這種生動的、跨領域的討論有幾分流動研討班的味道,我想這應該就是我所想象的學術生活可能和應該的樣子。
最後,我的妻子Judith Herschman一直錶現齣無盡的耐心,隻是偶爾問我:“你何時齣版你的方法書?”
中文版序言
在過去的15年裏,我一直緻力於對中國社會的研究。我與中美兩國的同事一起在中國大陸組織瞭兩次全國性的概率抽樣調查:一次是在1996年,關注中國大陸居民生命曆程中所遭遇的不平等情況;另一次是在2008年,關注的是中國國內人口遷移的原因、過程與結果(本書中的許多研究實例都來自1996年的調查數據)。我和一些同事目前正著手計劃在中國進行第三次調查,主題是遷移對兒童的影響。自1995年以來,隨著訪問中國的次數日漸增多,我對中國文化的理解和與中國學生的交往日漸加深。2008年7月,我以本書為教材在北京大學—密歇根大學學院授課,正是在那裏我認識瞭本書的譯者任強教授。此後在2010年鞦,我在香港科技大學再次用此書授課。兩次授課使用的都是本教材的英文版。
有瞭在北京以及在香港麵嚮中國學生的授課經曆,當任強教授提議將這本教材翻譯為中文時,我真的非常高興。這次與任強教授的閤作也相當愉快,在此我錶示衷心的感謝。同時,我還要感謝香港科技大學的一些研究生(李駿、李蘭、宋曦、葉華、張卓妮和鄭冰島),他們校對瞭全部譯稿並在中文措詞方麵提齣瞭很好的修改意見。雖然我自己不懂中文,但是熟悉漢語的朋友告訴我,在任強教授和這幾位同學的辛勤工作之下,翻譯工作相當齣色。
本書的英文版填補瞭美國研究生定量社會研究方法齣版物中的一個重要空白。盡管在美國,針對社會科學研究的統計教科書很多,但大多數都集中講述統計的數理基礎,很少關注如何在實踐中運用這些統計方法來做研究。本書的宗旨就在於彌補這一缺憾,它所麵嚮的是那些已經學習瞭統計學的入門課程並想將這些統計知識應用到嚴謹的實證研究中的學生。以前由於缺乏這樣的書籍,所以我就自己為學生寫講義材料,後來將這些講義擴充為一些章節,最後就形成瞭本書。
我希望本書在中國也會起到同樣的作用,使學生作為社會科學研究者掌握或提高定量研究的方法和分析技術。由於中國學生的數學訓練比美國學生好,此外,同歐洲的大學一樣,中國的大學在本科生
量化數據分析:通過社會研究檢驗想法 下載 mobi epub pdf txt 電子書