发表于2024-12-27
從1開始――數據分析師成長之路 pdf epub mobi txt 電子書 下載 2024
《從1開始——數據分析師成長之路》從簡單的製作報錶開始和大傢一起學習數據分析的五大模塊:報錶BI係統、異常數據分析、解決數據需求、項目性數據分析以及數據建模,為大傢全方位、體係化地呈現數據分析到底是什麼。
數據分析行業就像所有新興行業初期一樣,伴隨著混亂和盲目,一方麵市場上培訓機構巧立名目頒發證書,另一方麵也有許多國外的著作被生搬硬套過來供自學者學習。本書是**本結閤國內公司實際狀況和作者多年數據分析經驗,係統而又詳盡地介紹數據分析工作的作品。相較於使用Excel進行數據統計工作更加專業化、係統化,相較於數據挖掘與編程算法更加易於理解和貼閤業務。從簡單的製作報錶開始和大傢一起學習數據分析的五大模塊:報錶BI係統、異常數據分析、解決數據需求、項目性數據分析以及數據建模,為大傢全方位、體係化地呈現數據分析到底是什麼。
張旭東,江蘇宿遷人,數據科學傢。先後就讀於蘇州大學與中國人民大學數學專業。2010年至今總計發錶各類文獻百萬餘字,詣在推行數學語言簡易化、通俗化、平民化。
通俗易懂,數據分析入門的不二之選。
——Wenny Zhong Soochow University Statistics Researcher
循序漸進的引導,帶領大傢逐漸領略數據分析的魅力。
——張俊 中國平安 大數據研究員
數據分析道路上的指引明燈。
——張鵬飛 中國平安 高級數據分析師
第1章 數字、數據、數學 1
1.1 數字的起源 2
1.2 數據 4
1.3 數字與數據 6
1.4 數學 8
1.5 統計學 13
第2章 分析、邏輯與思維 18
2.1 描述、概括、分析 19
2.2 邏輯思維 26
第3章 大數據到底是什麼 32
3.1 時代的現狀 33
3.2 大數據與傳統數據 35
3.3 大數據在說什麼 40
第4章 數據分析與數據挖掘 43
4.1 分析與挖掘 44
4.2 選擇自己的路 46
第5章 如何做好數據分析 50
5.1 數據分析 51
5.2 製作報錶 52
5.3 異常數據分析 62
5.4 MySQL查詢語言 72
5.5 數據需求處理 77
5.6 進行項目分析 88
5.7 數據分析的結構化梳理 99
第6章 數據分析師進階 101
6.1 思維與態度 102
6.2 軟件升級:R or Python 107
6.3 數據分析師的格局 109
第7章 數據分析實戰 115
7.1 報錶係統 116
7.2 發現異常 129
7.3 數據需求 135
7.4 項目分析 144
第8章 初識R語言 160
8.1 安裝與編輯器 161
8.2 數據讀取 163
8.3 數據處理 165
8.4 經典算法 167
第9章 行業的未來 170
9.1 市場需求 171
9.2 重要性、必要性 176
9.3 大數據,下一個風口 183
第10章 數據分析測試題與答案 187
10.1 MySQL測試題 188
10.2 邏輯題 189
描述、概括、分析
大傢在日常生活中經常會聽到這些詞匯:描述、概括、分析、知道、認識、瞭解、熟悉、掌握等。這些似乎意思差不多的詞匯,粗略看起來並沒有什麼區彆,但是許多時候是說者有心而聽者無意,數據分析尤其如此。我們需要描述一個事件還是分析一個事件?這兩者中間大有區彆,為瞭便於大傢理解先來講個故事吧。
慵懶的下午,你坐在咖啡館裏看窗外人來人往,這時突然有一位美女闖入瞭你的眼簾,驚艷瞭時光,叨擾瞭歲月。在你的注視中美女就那麼徐徐地走瞭,而你仍舊久久不能忘懷,難得這樣的心動時刻,你需要把它記錄下來:
2015年10月21日,星期三,天氣如同心情一樣好,邂逅一美女,撰文以記之。
她就那麼突然地闖入我的視綫,像一隻驕傲的貓,帶著比肩的短發,蠶眉冷艷,眼波流轉;鼻梁不高但棱角分明,唇不紅艷自帶一份雅緻;黑色的小皮鞋輕快地敲打著地磚,頎秀的兩條腿包裹在粉色的絲襪中傲嬌而不媚俗;白色毛衣披風就那麼搭在肩上欲滑將落……
她就那麼徐徐地走著,帶著獨特地隱藏在優雅中的俏皮,伴隨著一絲倔強和傲氣,輕快又不顯急躁地走著……
矯健的步伐配閤著搖曳的臂擺透漏瞭內心的快樂與活力,讓人不禁想象這個女孩不管在工作中還是生活中應該都是樂觀的吧,平時應該比較愛笑,周圍朋友也會很多,應該會很好相處吧!我能不能成為她的朋友呢?
親愛的朋友,能不能從上麵的一段矯情的日記裏麵說齣哪裏是“描述”哪裏是“概括”哪裏是“分析”呢?
描述
抽象來說,描述就是對事物或是對象的直接描寫,就好像上文中這個姑娘眼睛、鼻子、嘴唇長什麼樣,這是對這個對象的客觀印象,就好像畫畫時選擇的顔色,我選擇紅色顔料來描繪他的嘴唇。 如果我們把描述這樣一個概念對應到數據上可以理解為這一堆數據“長什麼樣”,按照這樣一個標準我們嘗試著描述一堆數據。通過對數據的描述能夠讓彆人通過這些描述的話語感受到數據的真實麵貌。
對於對人體外貌的描述再詳細生動都不如直接看到被描述的這個人,或者給這個人拍一張照片也能直觀地反映其外貌。而對於數據來說,直接看數據可能什麼都看不齣來,而通過對數據的描述反而能讓我們更加清晰地看到數據真實的麵貌。在瞭解此間差異之前我們不妨先熟悉幾個描述性的統計變量:平均數、眾數、中位數、方差、極差、四分位點,這些指標就好像一堆數據的“鼻子”、“眼睛”、“嘴唇”。平均數不用介紹大傢都知道,下麵介紹下其他幾個數據指標:
眾數:數據中齣現頻率最高的數值,比如“麵條”就可以算做小明數據中的眾數。
中位數:將數據從小到大排列,位置處於中間的數值。
方差:每個數據與平均值的差值的平方,再取平均值。
極差:最大數減去最小數。
上/下四分位點:將數據從大到小排列,位置處於前1/4或是後1/4的數值。
例如
下麵數據記錄瞭小明參加射箭俱樂部時擊中的環數:
1 1 2 2 3 5 5 5 6 7 7
上述數據的各項指標如下:
平均數=44/11=4
眾數=5(5齣現3次)
中位數=5
方差=4
極差=7-1=6
上四分位點=6
下四分位點=2
我們一般會用上述的6個指標來描述一組數據的“長相”,平均值用來展示整體的平均水平,眾數用來展示數據點主要集中的範圍,中位數用來與平均數進行對比判斷數據是否平滑,方差用來判斷數據波動情況。
到這裏,我們發現通過對一組數據的平均數、眾數、中位數、方差、極差、四分位點進行解讀,很容易對這一批數字有具體的認識,而直接看數字可能就感受不到這些信息。不僅如此,我們在數學統計的過程中常常麵臨著成韆上萬的數字,如果把這些數字全部羅列在屏幕上可能很難看齣什麼名堂來,而通過上述6個指標能讓這些龐大繁雜的數據一目瞭然,雖不見數據卻也知道數據長什麼樣,這就是描述性統計變量。
隨著大數據這個概念被越來越多的人提起,數據分析與數據挖掘這兩個詞匯頻繁地齣現在人們的視野中,越來越得到大傢的重視和青睞。從事數據分析工作的這些年,身邊不斷有人問起數據分析如何入門或是如何做好數據分析,市場也有各類“速成數據分析”或是“零基礎數據分析”等培訓課程,頗有當年人人都去做産品經理的勢頭。與此同時在一些問答類網站上齣現瞭許多諸如這樣的問題:
“文科生如何轉行數據分析?”
“數學基礎不好能做數據分析嗎?”
“聽瞭某某專傢的演講覺得數據分析很棒,如何入門?”
……
問題下麵往往有很多因各種各樣的原因推薦的書籍、教程、公眾號……內容乏善可陳的同時太容易誤導新人,看著著實心痛。
與此同時,通過這些年來的瞭解和熟悉,身邊有太多“盲目”的數據分析從業人員,隻是瞭解瞭Excel中相關圖錶與統計的功能,在從事分析工作時也有許多的不嚴謹和漏洞。在一些社區或是平颱經常遇到一些人把原始數據直接掛在網上,問該怎麼分析數據甚至是通過這些數據能得齣什麼結論。現在想一想,他們真的適閤做數據分析嗎?數據保密性的職業素養不說,不經大腦思考地貼數據要結果的分析員真的能勝任這份工作嗎?
寫這本書最大的願望就是能夠通過簡單的描述讓大傢對數據分析有一個簡單的瞭解,對自己是否適閤這個職位有一個概念,不要盲目從眾,能有自己的判斷。市場上從零開始入門的教程魚龍混雜,在入門之前大傢首先要考慮這扇門真的適閤你嗎?
這本書寫在數據分析入門之前,會嚮讀者們簡單地介紹究竟什麼是數據分析,重點放在這個崗位有怎樣的要求和特質以及如何纔能達到這樣的標準,也會簡單介紹數據分析崗位未來的職業發展,希望對有誌於從事數據分析工作的你有所幫助。
作 者
書內容還可以,沒有一定R語言不適用,內容跳躍性太大,另外,最大的缺點就是部分章節沒我數據,導緻無法練習。
評分代碼在r裏漢字部分無法識彆 還沒仔細閱讀 後續繼續評價
評分字跡清晰,質量不錯,發貨速度很快。
評分還沒看,不過挺好的書,送貨也快,滿意!
評分最近準備仔細學習的,希望有用
評分看完瞭,不過作者有點偏離主題,項目管理有專門的書
評分媽媽從小教育我,人長得醜就一定要多讀書!
評分R語言預測,很熱門的語言學一下
評分在意彆人對自己說一個月光中心主任!你
從1開始――數據分析師成長之路 pdf epub mobi txt 電子書 下載