內容簡介
數據倉庫與數據挖掘是計算機專業和其他一些與計算機技術關係密切專業必修的核心課程。《數據倉庫與數據挖掘技術》係統地介紹瞭數據倉庫和數據挖掘的基本概念、相關知識和基本方法,每種數據挖掘方法都有詳盡的實例描述和具體實現步驟。
《數據倉庫與數據挖掘技術》結構嚴謹,條理清晰,語言淺顯易懂,循序漸進地錶達瞭知識內容;《數據倉庫與數據挖掘技術》堅持理論與實際相結閤,概念和具體方法相結閤,使知識具體化,生動化;實例實現的過程建立在SQL 2005數據挖掘軟件的基礎上,以幫助讀者在學習後達到學以緻用的目的。
《數據倉庫與數據挖掘技術》可以作為計算機類、信息類等相關專業本科生數據挖掘課程的教材,也可以作為其他專業技術人員的自學參考書。
目錄
第1章 數據挖掘和數據倉庫概述
1.1 數據挖掘引論
1.1.1 數據挖掘的由來
1.1.2 數據挖掘的定義
1.1.3 數據挖掘的功能
1.1.4 數據挖掘的常用方法
1.2 數據倉庫引論
1.2.1 數據倉庫的産生與發展
1.2.2 數據倉庫的定義
1.2.3 數據倉庫與數據挖掘的聯係與區彆
1.3 數據挖掘的應用
1.3.1 數據挖掘的應用領域
1.3.2 數據挖掘案例
1.4 常用數據挖掘工具
1.4.1 數據挖掘工具的種類
1.4.2 評價數據挖掘工具優劣的指標
1.4.3 常用數據挖掘工具
小結
習題
第2章 數據倉庫
2.1 數據倉庫的基本概念
2.2 數據倉庫的體係結構
2.2.1 元數據
2.2.2 粒度的概念
2.2.3 分割問題
2.2.4 數據倉庫中的數據組織形式
2.3 數據倉庫的數據模型
2.3.1 概念數據模型
2.3.2 邏輯數據模型
2.3.3 物理數據模型
2.3.4 高層數據模型、中間層數據模型和低層數據模型
2.4 數據倉庫設計步驟
2.4.1 概念模型設計
2.4.2 技術準備工作
2.4.3 邏輯模型設計
2.4.4 物理模型設計
2.4.5 數據倉庫的生成
2.4.6 數據倉庫的使用和維護
2.5 利用SQL Server 2005構建數據倉庫
小結
習題
第3章 聯機分析處理技術
3.1 OLAP概述
3.1.1 OLAP的由來
3.1.2 OLAP的一些基本概念
3.1.3 OLAP的定義與特徵
3.2 OLAP中的多維分析操作
3.2.1 鑽取
3.2.2 切片和切塊
3.2.3 鏇轉
3.3 OLAP的基本數據模型
3.3.1 多維聯機分析處理
3.3.2 關係聯機分析處理
3.3.3 MOLAP和ROLAP的比較
3.3.4 混閤型聯機分析處理
3.4 OLAP的衡量標準
3.5 基於SQL Server 2005的OLAP實現
小結
習題
第4章 數據預處理
4.1 數據預處理概述
4.1.1 原始數據中存在的問題
4.1.2 數據預處理的方法和功能
4.2 數據清洗
4.2.1 屬性選擇與處理
4.2.2 空缺值處理
4.2.3 噪聲數據處理
4.2.4 不平衡數據的處理
4.3 數據集成和變換
4.3.1 數據集成
4.3.2 數據變換
4.4 數據歸約
4.4.1 數據歸約的方法
4.4.2 數據立方體聚集
4.4.3 維歸約
4.4.4 數據壓縮
4.4.5 數值歸約
4.4.6 離散化與概念分層生成
小結
習題
第5章 關聯規則方法
5.1 關聯規則的概念和分類
5.1.1 關聯規則的概念
5.1.2 關聯規則的分類
5.2 Apriori算法
5.2.1 産生頻繁項集
5.2.2 産生頻繁項集的實例
5.2.3 從頻繁項集産生關聯規則
5.3 FP-Growth算法
5.3.1 FP-Growth算法計算過程
5.3.2 FP-Growth算法示例
5.4 利用SQL Server 2005進行關聯規則挖掘
小結
習題
第6章 決策樹方法
6.1 信息論的基本原理
6.1.1 信息論原理
6.1.2 互信息的計算
6.2 常用決策樹算法
6.2.1 ID3算法
6.2.2 C4.5算法
6.3 決策樹剪枝
6.3.1 先剪枝
6.3.2 後剪枝
6.4 由決策樹提取分類規則
6.4.1 獲得簡單規則
6.4.2 精簡規則屬性
6.5 利用SQL Server 2005進行決策樹挖掘
6.5.1 數據準備
6.5.2 挖掘模型設置
6.5.3 挖掘流程
6.5.4 挖掘結果分析
6.5.5 挖掘性能分析
小結
習題
第7章 統計學習方法
7.1 樸素貝葉斯分類
7.1.1 貝葉斯定理
7.1.2 樸素貝葉斯分類
7.2 貝葉斯信念網絡
7.2.1 貝葉斯信念網絡
7.2.2 貝葉斯網絡的特點
7.2.3 貝葉斯網絡的應用
7.3 EM算法
7.3.1 估計�玨��個高斯分布的均值
7.3.2 EM算法的一般錶述
7.4 迴歸分析
7.4.1 一元綫性迴歸
7.4.2 多元綫性迴歸
7.4.3 非綫性迴歸
7.5 利用SQL Server 2005進行綫性迴歸分析
小結
習題
第8章 人工神經網絡方法
8.1 人工神經網絡的基本概念
8.1.1 人工神經元原理
8.1.2 人工神經網絡拓撲結構
8.1.3 人工神經網絡學習算法
8.1.4 人工神經網絡泛化
8.2 誤差反嚮傳播(BP)神經網絡
8.2.1 BP神經網絡的拓撲結構
8.2.2 BP神經網絡學習算法
8.2.3 BP神經網絡設計
8.3 自組織特徵映射(SOFM)神經網絡
8.3.1 SOFM神經網絡的拓撲結構
8.3.2 SOFM神經網絡聚類的基本算法
8.3.3 SOFM神經網絡學習算法分析
8.4 Elman神經網絡
8.4.1 Elman神經網絡的拓撲結構
8.4.2 Elman神經網絡權值計算
8.5 Hopfield神經網絡
8.5.1 Hopfield神經網絡的拓撲結構
8.5.2 Hopfield神經網絡學習算法概述
8.5.3 離散Hopfield神經網絡
8.5.4 連續Hopfield神經網絡
8.6 利用SQL Server 2005神經網絡進行數據挖掘
8.6.1 數據準備
8.6.2 挖掘流程
小結
習題
第9章 聚類分析
9.1 聚類概述
9.1.1 聚類簡介
9.1.2 聚類的定義
9.1.3 聚類的要求
9.2 聚類分析中的相異度計算
9.2.1 聚類算法中的數據結構
9.2.2 區間標度變量及其相異度計算
9.2.3 二元變量及其相異度計算
9.2.4 標稱型變量及其相異度計算
9.2.5 序數型變量及其相異度計算
9.2.6 比例標度型變量及其相異度計算
9.2.7 混閤類型變量的相異度計算
9.3 基於劃分的聚類方法
9.3.1 �玨��-平均算法
9.3.2 �玨��-中心點算法
9.4 基於層次的聚類方法
9.5 譜聚類方法
9.5.1 譜聚類的步驟
9.5.2 譜聚類的優點
9.5.3 譜聚類實例
9.6 利用SQL Server 2005進行聚類分析
9.6.1 挖掘流程
9.6.2 結果分析
小結
習題
第10章 粗糙集方法
10.1 粗糙集的基本概念
10.1.1 等價關係與等價類
10.1.2 信息錶與決策錶
10.1.3 下近似與上近似
10.2 基於粗糙集的屬性約簡
10.2.1 屬性約簡的有關概念
10.2.2 基於粗糙集的幾種屬性約簡算法
10.3 基於粗糙集的決策規則約簡
10.3.1 決策規則的定義
10.3.2 決策規則的約簡
10.4 粗糙集的優缺點
10.4.1 粗糙集的優點
10.4.2 粗糙集的缺點
小結
習題
第11章 復雜結構數據挖掘
11.1 文本數據挖掘
11.1.1 文本數據的特點
11.1.2 文本挖掘的定義
11.1.3 文本挖掘的主要任務
11.1.4 文本挖掘的一般過程
11.1.5 文本挖掘的應用
11.2 Web數據挖掘
11.2.1 Web數據的特點
11.2.2 Web挖掘的定義
11.2.3 Web挖掘分類
11.2.4 Web挖掘過程
11.2.5 Web數據挖掘的應用
11.3 空間數據挖掘
11.3.1 空間數據的復雜性特徵
11.3.2 空間數據挖掘的定義
11.3.3 空間數據挖掘知識的類型
11.3.4 空間數據挖掘的用途
11.4 多媒體數據挖掘
11.4.1 多媒體數據挖掘的概念
11.4.2 多媒體挖掘的分類
小結
習題
參考文獻
前言/序言
數據倉庫與數據挖掘技術 下載 mobi epub pdf txt 電子書