內容簡介
《現代物理基礎叢書·典藏版:實驗數據多元統計分析》介紹實驗或測量數據的多元統計分析方法,內容包括:貝葉斯決策、綫性判彆方法、決策樹判彆、人工神經網絡、近鄰法、概率密度估計量法、H矩陣判彆、函數判彆分析、支持嚮量機法等,以及不同判彆方法的比較。此外,還簡要介紹瞭將多種多元統計分析方法的計算機程序匯集在一起的程序包TMVA(toolkit for multivariate data analysis),並分析瞭粒子物理實驗數據分析中應用多元統計分析方法的一些實例。
《現代物理基礎叢書·典藏版:實驗數據多元統計分析》可供實驗物理工作者和大專院校相關專業師生、理論物理研究人員、工程技術人員及從事自然科學和社會科學的數據測量和分析研究人員參考。
內頁插圖
目錄
前言
第一章 緒論
1.1 模式和模式識彆
1.2 模式識彆係統
1.2.1 原始數據獲取
1.2.2 原始數據的預處理
1.2.3 特徵提取和選擇
1.2.4 分類決策
1.3 數據矩陣與樣本空間
1.3.1 數據矩陣與樣本空間
1.3.2 模式的相似性度量
1.3.3 樣本點的權重和特徵嚮量數據的預處理
1.4 主成分分析
1.4.1 主成分分析的基本思想
1.4.2 主成分分析算法
1.4.3 降維處理及信息損失
第二章 貝葉斯決策
2.1 基於最小錯誤率的貝葉斯決策
2.1.1 決策規則
2.1.2 錯誤率
2.1.3 分類器設計
2.2 Neyman-Pearson決策
2.3 正態分布時的貝葉斯決策
2.4 分類器的效率和錯誤率
2.4.1 分類器的效率、錯誤率和判選率矩陣
2.4.2 錯誤率的上界
2.4.3 利用檢驗樣本集估計判選率矩陣和錯誤率
2.4.4 訓練樣本集和檢驗樣本集的劃分
2.4.5 利用判選率矩陣估計各類“真實”樣本數
2.4.6 分類器判定的“信號”樣本中錯判事例的扣除
2.5 討論
第三章 綫性判彆方法
3.1 綫性判彆函數
3.1.1 綫性判彆函數的基本概念
3.1.2 廣義綫性判彆函數
3.1.3 綫性分類器的設計
3.2 Fisher綫性判彆
3.3 感知準則函數
3.3.1 幾個基本概念
3.3.2 感知準則函數
3.4 最小錯分樣本數準則函數
3.5 最小平方誤差準則函數
3.5.1 平方誤差準則函數及其MSE解
3.5.2 MSE準則函數的梯度下降算法
3.5.3 隨機MSE準則函數及其隨機逼近算法
3.6 多類問題
第四章 決策樹判彆
4.1 超長方體分割法
4.1.1 超長方體分割法的基本思想
4.1.2 超長方體分割法中闡值的確定
4.1.3 超長方體分割法的優缺點及其改進
4.1.4 超長方體分割法用於高能物理實驗分析
4.2 決策樹法
4.2.1 決策樹法的基本思想
4.2.2 信號/本底二元決策樹的構建
4.2.3 決策樹的修剪
4.3 決策樹林法
4.3.1 決策樹林的構建
4.3.2 決策樹林對輸入事例的分類
4.3.3 重抽樣法構建決策樹林
第五章 人工神經網絡
5.1 概述
5.1.1 生物神經元和人工神經元
5.1.2 人工神經網絡的構成和學習規則
5.2 感知器
5.2.1 單輸齣單元感知器
5.2.2 多輸齣單元感知器
5.3 多層前嚮神經網絡和誤差逆傳播算法
5.3.1 BP網絡學習算法
5.3.2 BP網絡學習算法的改進
5.4 Hopfield神經網絡
5.4.1 離散Hopfield網絡
5.4.2 連續Hopfield網絡
5.4.3 Hopfield網絡在優化計算中的應用
5.5 隨機神經網絡
5.5.1 隨機神經網絡的基本思想
5.5.2 模擬退火算法
5.5.3 Boltzmann機及其工作規則
5.5.4 Boltzmann機學習規則
5.5.5 隨機神經網絡小結
5.6 神經網絡用於粒子鑒彆
5.6.1 用於帶電粒子鑒彆的特徵變量
5.6.2 帶電粒子鑒彆的神經網絡的架構
5.6.3 網絡的訓練和粒子鑒彆效果
第六章 近鄰法
6.1 最近鄰法
6.2 k近鄰法
6.3 剪輯近鄰法
6.3.1 兩分剪輯近鄰法
6.3.2 重復剪輯近鄰法
6.4 可作拒絕決策的近鄰法
6.4.1 具有拒絕決策的k近鄰法
6.4.2 具有拒絕決策的剪輯近鄰法
第七章 其他非綫性判彆方法
7.1 概率密度估計量方法
7.1.1 基本思想
7.1.2 總體概率密度的非參數估計
7.1.3 投影似然比估計
7.1.4 多維概率密度估計
7.1.5 近鄰體積中樣本數的確定
7.1.6 概率密度估計法與神經網絡的性能對比
7.2 H矩陣判彆
7.3 函數判彆分析
7.4 支持嚮量機
7.4.1 最優分類麵
7.4.2 廣義最優分類麵
7.4.3 支持嚮量機
第八章 不同判彆方法的比較
8.1 不同判彆方法的特點
8.2 多元統計分析程序包TMVA簡介
參考文獻
前言/序言
復雜大係統的科學研究往往都需要收集和處理大量反映係統特徵和運行狀態的數據信息,這類原始數據集閤由於樣本數量巨大,刻畫係統特徵的指標變量眾多,並且帶有隨機性質,以緻於形成瞭規模宏大、復雜難辨的數據海洋。利用統計學和數學方法對多維復雜數據集閤進行科學的分析,挖掘齣隱藏在復雜海量數據中的規律和信息,就是多元統計分析研究的基本內容。
大型高能物理實驗就是典型的復雜大係統的科學研究工作。20世紀80年代末北京正負電子對撞機(BEPC)和北京譜儀(BES)的建成,是中國高能加速器實驗物理的真正開端。在北京譜儀上進行實驗工作的研究組是以譜儀的名稱(Beijing Spectrometer)命名的,簡稱BES閤作組,它是由多國物理學傢組成的國際閤作研究組,我國物理學傢在其中占有主導性的地位。北京譜儀成功地運行到2004年,獲取瞭τ-粲能區海量的高能物理實驗數據。在此基礎上,應用多元統計分析方法對實驗數據進行分析,獲得瞭大量居於當時世界領先水平的物理成果。其中,τ輕子質量的精確測量、2-5GeV能區R值的精確測量、共振態X(1835)的實驗觀察、α粒子的實驗確定,‘更是引起當時國際高能物理界廣泛矚目的重大成就。
為瞭保持和發展我國在高能物理τ粲能區實驗研究的領先地位,我國政府又撥巨資對北京正負電子對撞機和北京譜儀進行升級改進,稱為BEPCII和BESIII。BEPCII的設計指標是産生粒子反應的強度約為原對撞機的100倍,BESIII的性能則比原北京譜儀有大幅度的提高。目前,BEPCII和BESIII已經完成安裝,並在2008年開始實驗取數。有理由期望,利用升級改進後的BESIII,可以獲得比原北京譜儀更多、更精細、更重要的物理成果。為瞭達到這一目標,應用比原北京譜儀數據分析更為精細、更為有效的多元統計分析方法成為一個十分重要和急迫的任務。事實上,多元統計分析方法應用於高能物理實驗數據分析近年來已經成為國際高能物理界的一種普遍趨勢。
本書對於實驗數據分析中,特彆是高能物理實驗數據分析中涉及的多元統計分析方法作一概略的介紹。重點討論統計識彆的基本原理以及進行統計識彆的具體方法;對於復雜的數學理論,隻介紹其結果,而不作深奧的證明。目的是希望讀者能夠通過本書掌握多元統計分析的方法並將其付諸實施,特彆是能在BESIII的數據
現代物理基礎叢書·典藏版:實驗數據多元統計分析 下載 mobi epub pdf txt 電子書