數據挖掘與應用/北京大學光華管理學院教材 [Data mining and its application]

數據挖掘與應用/北京大學光華管理學院教材 [Data mining and its application] pdf epub mobi txt 电子书 下载 2025

張俊妮 著
想要找书就要到 求知書站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 北京大学出版社
ISBN:9787301152393
版次:1
商品编码:10153986
包装:平装
丛书名: 北京大学光华管理学院教材
外文名称:Data mining and its application
开本:16开
出版时间:2009-06-01
用纸:胶版纸
页数:185
字数:220000
正文语种:

具体描述

內容簡介

  《數據挖掘與應用》全麵地介紹瞭數據挖掘的相關主題.包括數據理解與數據準備、關聯規則挖掘、多元統計中的降維方法、聚類分析、神經網絡、決策樹方法、模型評估等內容。全書體係完整,文字精煉,注重對數據挖掘方法的直覺理解及其應用:同時,保持瞭一定的嚴謹性,為學生理解和運用這些方法提供瞭堅實的基礎。
  《數據挖掘與應用》實例豐富,並附有相應SAS程序,以便於學生盡快理解相關內容並用以解決實際問題。
  《數據挖掘與應用》配有教輔,可以免費提供給任課教師使用。如需要,歡迎填寫書後的“教師反饋及課件申請錶’索取。

作者簡介

  張俊妮,美國哈佛大學統計學博士,現為北京大學光華管理學院商務統計及經濟計量係副教授。研究領域包括因果推斷、貝葉斯分析、濛特卡洛方法、數據挖掘。在Journal of American Statistical Association、Statistica Sinica、Journal ofEducational and BehavioralStatistics、 《經濟學(季刊)》、 《數理統計與管理》、 《管理世界》等期刊上發錶論文十餘篇。

內頁插圖

目錄

第一章 數據挖掘概述
1.1 什麼是數據挖掘
1.2 數據挖掘的應用
1.3 數據挖掘方法論
第二章 數據理解和數據準備
2.1 數據理解
2.2 數據準備
2.3 使用SAS進行數據理解和數據準備:FNBA信用卡數據
第三章 關聯規則挖掘
3.1 關聯規則的實際意義
3.2 關聯規則的基本概念及Apriori算法
3.3 負關聯規則
3.4 序列關聯規則
3.5 使用SAS進行關聯規則挖掘
第四章 多元統計中的降維方法
4.1 主成分分析
4.2 探索性因子分析
4.3 多維標度分析
第五章 聚類分析
5.1 距離與相似度的度量
5.2 k均值聚類法
5.3 層次聚類法
第六章 預測性建模的一些基本方法
6.1 判彆分析
6.2 樸素貝葉斯分類算法
6.3 k近鄰法
6.4 綫性模型與廣義綫性模型
第七章 神經網絡
7.1 神經網絡架構及基本組成
7.2 誤差函數
7.3 神經網絡訓練算法
7.4 提高神經網絡模型的可推廣性
7.5 數據預處理
7.6 使用SAS建立神經網絡模型
7.7 自組織圖
第八章 決策樹
8.1 決策樹簡介
8.2 決策樹的生長與修剪
8.3 對缺失數據的處理
8.4 變量選擇
8.5 決策樹的優缺點
第九章 模型評估
9.1 因變量為二分變量的情形
9.2 因變量為多分變量的情形
9.3 因變量為連續變量的情形
9.4 使用SAS評估模型
第十章 模型組閤與兩階段模型
10.1 模型組閤
10.2 隨機森林
10.3 兩階段模型
參考文獻

精彩書摘

  對於定序自變量,最常用的一種轉換是按各類彆的序號直接將該變量轉換為數值自變量。對於名義自變量,最常用的轉換是將該變量轉換為啞變量。例如,對於性彆而言,可以生成一個二元啞變量,取值1錶示“女”,0錶示“男”。對於有多個取值的名義自變量,可以生成一係列二元啞變量。例如,中國內地有31個省、自治區和直轄市,可以據此生成30個啞變量。但是,如果一個名義自變量取值過多,生成過多的啞變量容易造成過度擬閤。一個簡單而有效的方法是隻針對包含觀測比較多的類彆生成啞變量,而將剩餘的類彆都歸於“其他”這個大類彆。還有一種方法是利用領域知識,將各類彆歸為幾個大類之後再生成啞變量,例如,將中國內地31個省、自治區和直轄市歸為華北、華中、華東、華南、西北、東北、西南等地區,再生成地區的啞變量。五、處理時間變量時間變量無法直接進入建模數據集,因為時間是無限增長的,在曆史數據中齣現的時間肯定不同於將來模型所需應用的數據集中齣現的時間,所以直接使用曆史數據的時間建立的模型就無法應用於將來的數據集。如果要在建模過程中考慮時間變量,就必須對其進行轉換。常用的轉換有如下幾種:
  1.轉換為距某一基準時間的時間長短,例如,“距離××年××月××日的天數”、“距離下一次春節的周數”等。
  2.轉換為季節性信息,例如,一年中第幾季度或第幾個月,每個季度或月對應於一個二元啞變量。
  很多情形下可以考慮對時間進行多種轉換,把所有可能影響因變量的時間信息都放人建模過程中。例如,對於某些食品的購買量而言,不僅存在節日效應,也存在季節性效應,這時就需要同時使用上述兩種轉換。
  六、異常值
  自變量的異常值對一些模型會産生很大影響。在圖2.2 的示例中,大部分數據點的,值都分布在-2.2 和2.4 之間,但有一個數據點的x值為8,它對擬閤的迴歸綫會有很大的影響;如果它落在點0或點6,擬閤齣的迴歸綫分彆為綫a和綫b,它們的差彆頗大。
  因變量的異常值同樣可能對模型有很大影響,在這裏不贅述。
  第五章將介紹的聚類算法可以用來發現異常值,如果少數幾個觀測自成一類,它們很有可能是異常值。發現異常值後需要查看它們為什麼異常。

前言/序言

  教材建設是大學人纔培養和知識傳授的重要組成部分。對管理教育而言,教材建設尤為重要,一流的商學院不僅要有一流的師資力量、一流的生源、一流的教學管理水平,而且必須使用一流的教科書。一流的管理類教科書必須滿足以下標準:第一,能把所在領域的基礎知識以全麵、係統的方式和與讀者友好的語言呈獻給讀者;第二,必須有時代感,能把學科前沿的研究成果囊括進去;第三,必須做到理論和實務(包括案例分析)相結閤,有很強的實用性;第四,能夠啓發學生思考現實的管理問題,培養他們分析問題和解決問題的能力;第五,可以作為研究人員和管理人士的工具書。
  中國的管理教育是伴隨改革開放而産生的。真正意義上的管理教育在中國不過十多年的曆史,但巨大的市場需求使得管理教育成為中國高等教育各學科中發展最快的領域,管理類教科書市場異常繁榮。但總體而言,目前國內市場上管理類教科書的水平仍不能令人滿意。國內教科書作者大多數在所涉及領域並沒有真正的原創性研究和學術貢獻,所撰寫的教科書普遍停留在對國外教科書的內容進行中國式排列組閤的水平上;國外引進的原版教科書雖然具有學術上的先進性,但由於其寫作背景是外國的管理實踐和製度安排,案例也都是取自於西方發達國傢,對中國讀者而言,總有一種隔靴搔癢的感覺。如何寫齣一流的中國版的管理類教材,是中國管理教育發展麵臨的重要任務。
  北京大學光華管理學院一直重視教材建設工作。1999年夏,我們曾與經濟科學齣版社簽約,以每本20萬元的稿酬,嚮全國徵集MBA教科書作者。這個計劃公布之後,我們收到瞭十幾本教科書的寫作方案。



用户评价

评分

快递很给力,包装很精心。

评分

书很棒,物流很给力。 工作之余,人们或楚河汉界运筹帷幄,或轻歌曼舞享受生活,而我则喜欢翻翻书、读读报,一个人沉浸在笔墨飘香的世界里,跟智者神游,与慧者交流,不知有汉,无论魏晋,醉在其中。我是一介穷书生,尽管在学校工作了二十五年,但是工资却不好意思示人。当我教训调皮捣蛋的女儿外孙子们时,时常被他们反问:“你老深更半夜了,还在写作看书,可工资却不到两千!”常常被他们噎得无话可说。当教师的我这一生注定与清贫相伴,惟一好处是有双休息日,在属于我的假期里悠哉游哉于书香之中,这也许是许多书外之人难以领略的惬意。好了,废话不多说。在我还没有看这本书的时候,我丝毫不怀疑它是一本好书,很符合80后读者的口味。很难想象一本图书会被我看得像郭德纲的相声书一样,在地铁上都如饥似渴地手不释卷。人都说《红楼梦》是一部罕见的奇书,是人生的镜子,那么对于这部书,在某种意义上也令我感到了丝丝“找出心中所想”的意味,因为我不仅从中看出大论的味道,更是以一种看搞笑图书的心情在愉悦自己,事实上这本书确实不失幽默,在大论了一把之后确实愉悦了广大读者,在此之前,我从来没想过会像一本幽默小说一样去看这本书,因为多年来这类书的泛滥使我对其十分不屑。宝贝非常不错,和图片上描述的完全吻合,丝毫不差,无论色泽还是哪些方面,都十分让我觉得应该称赞较好,完美! 书是正品,很不错!速度也快,绝对的好评,下次还来京东,因为看到一句话 女人可以不买漂亮衣服不买奢侈的化妆品但不能不看书,买了几本书都很好 值得看。现在,京东域名正式更换为JDCOM。其中的“JD”是京东汉语拼音(JING DON|G)首字母组合。从此,您不用再特意记忆京东的域名,也无需先搜索再点击,只要在浏览器输入JD.COM,即可方便快捷地访问京东,实现轻松购物。名为“Joy”的京东吉祥物我很喜欢,TA承载着京东对我们的承诺和努力。狗以对主人忠诚而著称,同时也拥有正直的品行,和快捷的奔跑速度。太喜爱京东了。|给大家介绍本好书《我们如何走到这一步》自序:这些年,你过得怎么样我曾经想过,如果能时光穿梭,遇见从前的自己,是否可以和她做朋友。但我审慎地不敢发表意见。因为从前的自己是多么无知,这件事是很清楚的。就算怀着再复杂的爱去回望,没准儿也能气个半死,看着她在那条傻乎乎的路上跌跌撞撞前行,忍不住开口相劝,搞不好还会被她厌弃。你看天下的事情往往都是一厢情愿。当然我也忍住了各种吐槽,人总是要给自己留余地的,因为还有一种可能是,未来的自己回望现在,看见的还是一个人。好在现在不敢轻易放狠话了,所以总算显得比年轻的时候还有一分从容。但不管什么时候的你,都是你。这时间轴上反复上演的就是打怪兽的过程。过去困扰你的事情,现在已可轻易解决,但往往还有更大的boss在前面等你。“人怎么可能没有烦恼呢”——无论是你初中毕业的那个午后,或者多年后功成名就那一天,总有不同忧伤涌上心头:有些烦恼是钱可以解决的,而更伤悲的是有些烦恼是钱解决不了的。我们曾经在年少时想象的“等到什么什么的时候就一切都好起来了”根本就是个谬论。所以,只能咬着牙继续朝前走吧。

评分

唯一有点用的是里面提到的数据集,可以找来分析。

评分

一个朋友推荐的书,初步看了,觉得很好。

评分

质量很好,速度也很快,还会继续光顾,内容很喜欢

评分

数据挖掘与应用教材用书。

评分

很不错的商品,一直在京东购买,信任京东~

评分

OKOKOKOKOKOKOKOKOKOKOKOK

评分

唯一有点用的是里面提到的数据集,可以找来分析。

相关图书

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有