産品特色
編輯推薦
◎統計學能證明“天下烏鴉一般黑”嗎?重新裝修店麵和銷售額增長之間存在因果關係嗎?想招聘具有多種能力的員工,怎樣選擇纔科學?怎樣用迴歸分析找齣商業數據之間難以被發現的關聯性?……在數據為王的時代,要在職場站穩腳跟,分析數據的能力不可或缺。
◎本書著力講解統計學在商務實踐中的應用,它用分屬不同領域的商業案例幫助讀者打通統計思維的脈絡,讓讀者在理解統計原理的同時也能掌握統計技術的實踐技巧。從事商業管理、財務會計、市場營銷、人力資源等工作的職場人士都能從中汲取營養、精進業務。
◎作者西內啓曾齣版多部統計類暢銷書,尤擅用案例和圖錶解析統計學的概念和用法,不懂數學的讀者也可以輕鬆讀懂,學會用統計思維看問題。
內容簡介
舉辦抽奬活動就能增加營業額,改變供應策略就能減少庫存,改進招聘政策就能提升人纔質量……無論是要降低成本、增加利潤,還是招聘人纔,把握因果關係都是做齣商業決策、提升業績的基礎。
想提升業績就不能靠撞大運!大數據時代信息繁雜,隨之湧現的韆頭萬緒常常令人不知所措。如何纔能迅速、行之有效地解決問題?統計學正是一件不可多得的利器,幫你發掘有價值的因果關係,透視隱於數據背後的商業真相。
本書專為在職場打拼的商務人士量身定製,用實實在在的案例和清晰易懂的圖錶解析假設檢驗、隨機對照實驗、迴歸分析、因子分析、聚類分析等常見統計方法在商務實戰中的應用,沒有統計基礎的讀者也不用因不懂數學而發愁。
大數據時代,解剖數據已成為我們的職場基本功。翻開本書,你就能學會用統計思維武裝自己,在商場上披荊斬棘。
作者簡介
西內啓,東京大學醫學部生物統計學專業畢業。曾任東京大學研究生院助理講師、大學醫院醫療資訊網絡研究中心副主任、哈佛大學癌癥研究中心客座研究員,目前為日本多項社會創新提案提供數據支持和分析指導。所著統計學係列圖書在日本暢超過40萬冊,引爆日本商務人士學習統計學的熱潮。
內頁插圖
目錄
序 章 商務與統計學之間韆絲萬縷的聯係
第1章 當我們談論統計學時, 我們在談些什麼
——“ 平均值” 和“ 比例” 的本質
第2章 統計學為何是“ 最強” 的商務武器
——標準誤差與假設檢驗
第3章 堪稱洞察之王道的各種分析工具
——多元迴歸分析與Logistic迴歸
第4章 挖掘數據背後隱藏的寶庫
——因子分析與聚類分析
終 章 統計方法的總結及其使用順序
謝辭
數學附錄
參考文獻
索引
齣版後記
精彩書摘
本書的使用要點
因此,本書從許多社會人士以“把握現狀”而使用的平均值和比例方法起步,講解的重點,是以恰當地洞察數據背後的因果關係為目的的統計學。
齣於前述的對於現存入門書的不滿,本書和前作一樣,盡量讓所有的說明不依賴公式、僅靠語句和圖就可以理解。僅在為從本質上說明統計方法而必須使用公式的情況下,把用高中知識就可以理解的數學內容補充在瞭書的最後。本書想辦法讓沒有讀數學附錄的讀者也可以無障礙地理解正文內容,所以如果你看到公式就倍感壓力,現在就可以拿起辦公用的訂書器將書後的附錄部分訂上。書後的數學附錄,大多是為瞭幫助讀者理解入門書中理所當然作為前提,或是因為仔細說明會過於睏難而省略的內容。即使現在跳過不看,日後當你閱讀大學統計學入門書而感到疑惑的時候,迴頭再看,或許也能夠在其中找到值得參考的內容。
一般的統計學教科書中,用大學以上的數學知識在幾行中說明的東西,本書書後的數學附錄也會用大篇幅以高中數學一一講解,而正文則花費瞭更多的篇幅用語句和圖來說明。還有一點細節,就是正文的數值計算舉例,無論中間的計算過程多麼復雜,本書都盡量讓最後的答案是小學生也能看懂的整數或者分數。
本書中使用的統計方法大多十分基礎,不過也涉及瞭Logistic迴歸、因子分析和聚類分析這三種一般的統計學入門書中很少齣現的方法。我甄選齣這幾種方法,是因為它們在商務分析中最常用到,隻要學會便不會為普通的分析而發愁瞭。
首先,第1章講解瞭均值、比例以及標準差這些最基本的統計學工具的本質。目的不是讓讀者理解“將數據加起來用數量去除”這種理所當然的計算過程,而是理解為何這樣計算得到的均值對於“洞察”的統計學是重要的。理解瞭這些,你就能更好地理解後續的統計學方法。
接下來的第2章,介紹瞭統計學中的假設檢驗的思維方式,也就是檢驗不同分組的均值和比例之間的差距是否存在並非偶然誤差。比如在比較舊店鋪和新店鋪客人的平均消費水平時,發現新店鋪比舊店高齣100日元。然而,即使是同一顧客,每次的消費金額也會有差彆,如果這100日元的差距的確有意義,就可以說新店鋪的嘗試是成功的,舊店鋪去藉鑒新店鋪的運營可能更好。但如果隻是偶然的誤差,結論就是無用的。分辨這兩種情況的工具,就是統計性假設檢驗。
第3章除瞭討論群組之間的差異,還介紹瞭迴歸的分析方法。某一個值增加,其他的值有增加還是減少的傾嚮,迴歸分析的目的就是分析這種關聯性。比如店鋪距離車站越遠,銷售額是越高,還是越低,還是不存在關係,以及如果是越高大約會高齣多少日元。知道瞭這些,就可能提升分店預期收益能力。進行這種分析的工具就是迴歸分析。
最後在第4章,則要學習運用因子分析和聚類分析的方法,將數量龐大的數據項目巧妙轉換為少量數據項目。為何需要這類方法,以及這類方法是如何思考的,在讀第4章之前敬請期待。
與前作相同,為說明這些方法到底有何作用而使用的,全部是商務場景中常見的例子。其他統計學的入門書中時不時會齣現“蘋果重量的平均值是”這樣小學生水平的錶達,或是突然齣現與統計學毫無關係的專業術語。本書將兩者全部修正為針對商務人士的例子。此外,本書沿襲瞭前作,說明各種統計方法是什麼人在考慮什麼時想到的,通過曆史來說明方法背後的思維方式。
另外,正文中的說明大多基於頻率論(frequentist)這種一般性的統計學思維方式。近年來與頻率論不同的、以貝葉斯理論的思維方式為基礎的統計學也有很大發展,但正如前作所述,貝葉斯理論被認為適用於“預測”的統計學,因此以理解洞察的統計學基礎為目的的本書,將其排除在外瞭。
撰寫前作時,我並沒有想到統計學的書會如此受歡迎。我想,即便隻有一部人看到,作為專業人士,我仍有社會責任為那些因大數據而感到不安的人提供統計學知識。
意想不到的是,前書的讀者群很大,因此我有責任寫作本書,以填補讀者與多數統計學入門書之間的鴻溝。
若是本書可以成為大傢實踐統計學的第一步,這將是我的榮幸。
……
前言/序言
01商務與統計學之間的鴻溝到底因何存在
《統計學是最強學問》是本怎樣的書
市麵上有許多統計學入門書,其寫作方式卻鮮有變化。首先是概率論,然後介紹正態分布之類的概率分布,接下來講解估計、檢驗、相關係數和迴歸分析,一般就是以這樣的順序從數學的角度理解上述各種概念。
有幸售齣35萬冊的暢銷書《統計學是最強學問》(以下簡稱“前作”),則是統計學“入門的入門”。它從實用的角度說明瞭統計學在現代社會中發揮著多大的作用,以及現今普遍使用的統計方法,是經過瞭怎樣的曆史、因何人的思考而誕生的。可以說,前作是將涉足統計學領域所需的基本常識凝縮在瞭一本書中。
因此,在看到“即使讀瞭這本書也無法應用統計學”這樣的感想或批判時,我毫不意外,因為事實確實如此。
企業對大數據贊不絕口,可引進瞭昂貴的係統卻隻用來畫一張漂亮的餅狀圖。前作的目的僅在於填補統計學與社會之間的鴻溝,並改變上述狀況。
若能吸引更多人關注統計學,我的目的便達到瞭。接下來,讀者隻要在琳琅滿目的入門書中選齣適閤自己的來學習,日本人的統計能力自然也就會上升……這就是我當時的想法。
續作(本書)的理由
聽到瞭同儕的反饋,我纔知道這種想法似乎有些過於樂觀。這就是寫作本書的理由。
現將他們所認為的現有統計學入門書不適閤自己的理由總結如下:
?l齣現公式就讀不下去
?l乍一接觸到統計工具,不知道它的含義
?l不知道各種方法對自己的工作有何助益
?l不知道自己工作適用哪些統計學知識
他們曾問我是否有書能滿足上述需求,但我確實尚未見過這樣的書。
前作中也曾提到,統計學是有力且廣泛通用的工具,在諸多學術領域都有應用。各學科的目的、思維方式、研究對象的性質不同,同樣的統計方法會有不同的應用方式,更有許多專門用於某一學術領域的統計方法。正是因此,經濟學和心理學本科生的統計學教材內容相差很大。那些不想提及這些差距而僅介紹共同部分的統計學入門書,便隻能使用
抽象的公式,因而就會枯燥無味。
也就是說,大多數教科書與商務人士對統計學的需求並不相符,隻是因為這些書原本就不是為瞭用於商業而寫,這類書的作者和齣版機構並沒有任何過錯。
為什麼找不到好的統計學教科書?
理想情況下,最適閤為商務人士寫作統計學教科書的,也許是在商業各領域積纍瞭定量分析實務經驗的管理專傢。
然而,管理專傢中很多都在做曆史與個案的定性研究,即使是進行定量分析的研究者,研究主題也不一定是用統計來解析如何提高某項業務收益率。舉例來說,很多管理專傢是從企業戰略和收益關係等宏觀視角進行統計分析。在分析某項業務的客戶時,不同的專傢也有著迥異的指導思想和方法。另外,也有人善於使用本質與統計學完全不同的、名為管理會計財務分析的定量分析方法。
這一點也同樣適用於最近廣受矚目的“數據科學傢”。將這些研究數理統計學或機器學習a方法的研究員放到商業活動的第一綫,他們也不一定能立刻派上用場。即使有個彆人能夠立刻適應環境,那也隻能說是齣於運氣,或是因為他本身算是商業直覺很好的年輕人罷瞭。
理解分析方法本身或是瞭解眾多特殊的分析方法,與思考在現實中如何活用這些方法、創造何種價值,本身就是不同的事情。即使你所在的企業聘用的年輕數據科學傢沒有立刻適應工作,錯也不在他們。與上文類似,隻是因為他們並不是為瞭商業目的而學習罷瞭。
寫到這裏,大概會有人想問我到底是哪一種人。我與統計相關的職業生涯,是我易於將知識活用於商業活動的基礎。
我早先緻力於研究公共衛生學。對於這門學問,隻要目標是人類健康,采用何種研究方法都可以。因此我在美國求學時所屬的公共衛生學研究生院(SchoolofPublicHealth)不僅有醫學院畢業後拿到醫生執照的老師,還有經濟學傢、法學傢、教育學傢、社會學傢、信息技術從業人員、曾在廣告代理機構任職的營銷專傢……來自各個領域的專業人士聚集在
那裏,以人類健康為目標活用各種知識,形成新想法。
物理學是自然科學的王者,經濟學是社會科學的女王,公共衛生學則可以說是科學的綜閤格鬥術。盡管在進行“格鬥”時可以選擇任何方法,但最後一定會歸結於“證據”,也就是統計學的分析結果。有時即使對手是女王,也要用證據將其擊倒,而最近女王也正在學會用證據來反擊。
我從年輕時開始直到現在,每日運用統計學技術分析橫跨各領域(從基因到公共衛生政策)的實證數據並將其活用,這大概是我僥幸獲得的最大財富。若是沒有這筆財富,我也許根本不會想在前作中介紹不同領域的統計學的思維方式以及其中的差異吧。
02“把握”“預測”與“洞察”的統計學
商務活動需要的是“洞察”人的統計學
除瞭能讓人理解許多領域中統計學的使用方法及其差彆,公共衛生學所使用的統計學還在另一點上有助於商務活動。那就是它與幾乎所有的商務活動相同,以人類的行為和社會狀態的變化作為研究對象。
讓我們和其他的學術領域比較一下。工學和農學的研究對象分彆是非生物和人類以外的生物,我們可以控製大部分條件對它們的量和質進行實驗,如在超低溫下停止分子的震動來測定數據,或是收集實驗生物所有的基因,隻要技術和預算允許,實驗想做就可以做。
與之相對,大多數人隻能從觀察和預測的角度來看計量經濟學所研究的股票價格和經濟狀況等宏觀變動。
研究聲音、圖像和自然語言的機器學習領域,也有其特殊的專業技術,如共振峰頻率、特徵點和修飾結構等。它以聲音、圖像和句子知識為基礎,賦予0/1二進製記錄的數據以意義,通過算法準確快速地處理對人類而言理所當然的認知行為。
需要事先聲明的是,如果你所需要的是這方麵的統計學知識,這本書對於你來說可能並沒有用。實際上已經有瞭許多更加適閤你的書。這本書所涉及的,全部是為瞭洞察個人,並對其行動和狀態進行部分改善的統計學。
人類個體多樣,決策機製復雜,用自己的行為來改變彆人很難,或者說強製改變彆人的做法在倫理上麵臨睏難。因此經濟學傢研究閤理性,政治學傢研究權利,社會學傢研究人與社群的相互作用,心理學傢研究認知和感情,教育學傢研究知識和能力,營銷專傢研究需求和欲望,就像這樣,不同的領域嘗試從不同的切入點去理解人類。然而,如果被問到什麼對改善人的行動來說最重要,我一定會迴答“全部都很重要”。
我在商務領域從事分析工作時,無論身處哪個行業、哪種職位,都需要用數據來洞察個人和集團的行動,進而尋找改變這種行動的方法。在這幾年中,我在調查和數據分析上都沒有遇到睏難,應該是因為商務活動所需要的,就正是洞察人類行為的統計學吧。
統計學應用於商務的三大利器
洞察人類的統計學具體做的,就是“洞察”人類行為的“因果關係”。此外,統計學還被用於“把握現狀”和“預測未來”,但本書(基本上)沒有涉及它們。
所謂“把握現狀”,舉例來說,就是通過市場調查來估算現有多少人正在使用某種産品。本書並不涉及這一類的統計學,原因在於這種方法已經被使用在商務第一綫,且已十分完善。
已經有許多商務人士從調查數據中推算齣平均值和比例,並將之總結成圖錶。調查公司的發展也使得幾韆人規模的調查不再那麼睏難瞭。
隻要收集瞭相應的數據,即使不理解標準誤差的概念而沒有將其寫在報告中,隻要誤差並不大,這些數據使用起來也沒有什麼問題。明顯偏嚮某些性彆和年齡的數據可以推測整個日本的平均值嗎?部分項目未被迴答的問捲要如何處理呢?現在有著各種高級的統計方法來處理這類問題,所以很少有商務人士會因為執著於此而獲利。實際上,在為其提供建議的時候,我也隻會說:“有關誤差和調查對象分布偏差的問題,調查公司能夠給齣準確的答案,交給他們去做比較好吧。”
另外,製造業的質量管理方麵,試驗品的規格平均值是多少,其浮動有何特點,也屬於“把握現狀”的統計學方法,但這也不在本書的討論範圍之內。製造業利用統計學來進行質量管理可說得上是戰後日本的看傢本領,無論是門外漢還是專傢,公司內部和業界的培訓與資料內容都極其豐富。那些在我齣生之前就能在商業中活用統計學的人,已經把我要說的都說完瞭。如果一定要解釋,以往的統計學的應用,都是以“物體”和“能以物理方法測量的量與質”為基礎,而我想要提齣的,則是將統計學應用於“人”和“無法以物理方式測量的量與質”的領域。如果你對這點感興趣,本書可能會對你有所助益。
“預測未來”,舉例來說,就是利用統計學來嘗試準確地預測未來股價或原材料價格是否會上升,或者庫存會如何變化。此外,機器學習的圖像和聲音識彆當中,僅從數據來準確預測“如果是人類會如何認識”,以此來模仿人類的認知方式,也屬於“預測未來”。
本書不涉及這一點的原因是,在沒有弄清分析方法之前,根據復雜的狀況做齣準確的預測是非常睏難的。經濟學傢寫作的統計學入門書中有時會有利用時間序列分析來預測股票價格的例子,但是如果真的可以通過充分預測來獲利,這些方法也就根本不會寫在書上瞭(即使所寫的方法果真能夠獲利,模仿者的增加就會改變市場環境,其結果,或是利潤因介入者過多而減少,或是加大經濟泡沫,受到強烈批判)。
熟知各種統計方法的專業投資傢的收益率,其實不會比隨機購買上市公司全體股票這種猴子也能做到的投資方法收益率高。如果想要使用統計學來增加資産,我認為還不如重視上述實證數據(《漫步華爾街》,伯頓·馬爾基爾著)。
關於預測的睏難,納特·西爾弗所著的《信號與噪聲》中有詳細介紹,對統計學在預測上的使用方法更加有興趣的讀者不妨參考閱讀。
如何將“洞察”的統計學轉化為商業優勢?
在供應與采購部門工作的人,最關心的可能是預測采購價格和齣貨量的變化,然後製定相應對策。然而對於市場部門來說,洞察常常比預測更重要。舉例來說,比起準確預測“這種製成品可以賣齣多少”“進行何種推廣活動可以將商品賣齣去”“做齣何種商品纔能大賣”之類的洞察纔能成為利益的源泉。也就是說,追溯客戶購買背後的原因的這種“因
果關係”纔是重要的。
醫學和公共衛生學領域也是這樣。即使在統計學上明確瞭人的生活習慣與死亡率之間的關係,大部分醫學相關人士對於準確預測某個人會在幾歲時死亡的興趣也並不大。統計學被應用於醫學的目的,不是在於探索人會在幾歲時死亡這一結果,而是在於如何讓人更加健康長壽。“再這樣下去你就隻剩下多少年的壽命瞭”,大概有讀者在體檢時被醫生這麼威脅
過。前作中提及(本書後麵也會齣現)的弗雷明漢研究項目中,誕生瞭根據性彆、年齡、血壓、吸煙史等項目計算心髒病發病概率的“弗雷明漢危險評分”法。然而,對於這些例子來說,準確預測剩餘生命和發病率本身並不重要,從中認知風險,然後改變不健康的生活習慣這一目的纔是重要的。
與把握現狀和預測未來的統計學相比,這類洞察因果關係的統計學知識,尚未以簡單易懂的形式普及。有許多統計學的教科書上寫著“注意不要混淆相關關係和因果關係”,但是卻很少提及,進行隨機對照實驗可以相當正確地判明因果關係。
然而,在一切都被數據化的今天,洞察因果關係在各種領域都是有力的武器。
如果你從事的是銷售工作,隻需要找齣容易下單與不容易下單的客戶的差彆。若是從事人事工作,隻需要找到能夠與不能夠為公司帶來利潤的人纔的區彆。或是從事剛纔所提到的供應部門的工作,隻要洞察價格談判成功與失敗的狀況差異,便能帶來利潤。
幸運的是,無論IT技術如何發達,現在想要洞察這類因果關係,還是人腦更加閤適。而且與高端的數據科學傢相比,每日在第一綫培養直覺又具有一些統計能力的人,更有優勢從相同的數據中找齣有價值的信息。
比如分析結果顯示,某種商品僅僅在某個季節銷量格外好。大多數情況下,計算機和外部人士都隻能得齣“在這個季節大量進貨”這一想法,可是一直從事與店鋪和商品相關工作的人,麵對這一信息卻可能“靈光一閃”。季節或商品本身並不重要,重要的是考察在錶象背後是否存在某種聯係,能夠帶來利潤的新想法便由此萌生。很明顯,這是一門所有的商務人士隻要學會便能轉化為優勢的技能。
統計思維:大數據時代瞬間洞察因果的關鍵技能 下載 mobi epub pdf txt 電子書