发表于2024-11-22
異構信息網絡挖掘:原理和方法 pdf epub mobi txt 電子書 下載 2024
本書介紹瞭異構信息網絡挖掘的原理和方法,包括基於排名的聚類與分類、基於元路徑的相似性搜索和挖掘、關係強度感知挖掘,以及若乾有前景的研究方嚮。本書是伊利諾伊大學香檳分校數據挖掘高級課程的參考教材,適閤作為數據挖掘方嚮的研究生教材,也適閤數據挖掘研究人員和專業技術人員參考。
YizhouSun擁有伊利諾伊大學厄巴納-尚佩恩分校計算機係博士學位,師從著名數據挖掘科學傢JiaweiHan(韓傢煒)教授。目前是西北大學計算機和信息科學學院副教授。
JiaweiHan(韓傢煒)伊利諾伊大學厄巴納-尚佩恩分校計算機科學係Bliss教授。由於在數據挖掘和數據庫係統領域卓有成效的研究工作,他曾多次獲得各種榮譽和奬勵,其中包括2004年ACMSIGKDD頒發的佳創新奬,2005年IEEEComputerSociety頒發的技術成就奬,2009年IEEE頒發的W.WallaceMcDowell奬。他是ACM和IEEE會士。
叢書前言
譯者序
摘要和關鍵詞
第1章引言
1��1異構信息網絡是什麼
1��2為什麼異構網絡挖掘是一項新的挑戰
1��3本書的內容組織
第一部分基於排名的聚類和分類
第2章基於排名的聚類
2��1概述
2��2RankClus算法
2��2��1排名函數
2��2��2從條件排名分布到新的聚類度量
2��2��3聚類中心和距離測量
2��2��4RankClus算法總結
2��2��5實驗結果
2��3NetClus算法
2��3��1排名函數
2��3��2NetClus算法框架
2��3��3網絡聚類中目標對象生成模型
2��3��4目標對象和屬性對象的後驗概率
2��3��5實驗結果
第3章異構信息網絡的分類
3��1概述
3��2GNetMine
3��2��1分類問題定義
3��2��2基於圖的正則化框架
3��3RankClass
3��3��1RankClass框架
3��3��2基於圖的排名
3��3��3調整網絡
3��3��4後驗概率計算
3��4實驗結果
3��4��1數據集
3��4��2準確性研究
3��4��3案例研究
第二部分基於元路徑的相似性搜索和挖掘
第4章基於元路徑的相似性搜索
4��1概述
4��2PathSim:基於元路徑的相似性度量
4��2��1網絡模式和元路徑
4��2��2基於元路徑的相似性框架
4��2��3PathSim:全新的相似性度量
4��3單一元路徑的在綫查詢處理
4��3��1單一元路徑的連接
4��3��2基準算法
4��3��3基於共同聚類的剪枝
4��4多重元路徑的組閤
4��5實驗結果
4��5��1有效性
4��5��2效率對比
4��5��3Flickr網絡的案例研究
第5章基於元路徑的關係預測
5��1概述
5��2基於元路徑的關係預測框架
5��2��1基於元路徑的拓撲特徵空間
5��2��2監督式關係預測框架
5��3閤著關係預測
5��3��1閤著關係預測模型
5��3��2實驗結果
5��4帶時間的關係預測
5��4��1麵嚮作者引用關係預測的基於元路徑的拓撲特徵
5��4��2關係建立時間預測模型
5��4��3實驗結果
第三部分關係強度感知挖掘
第6章不完全屬性的關係強度感知聚類
6��1概述
6��2關係強度感知聚類的問題定義
6��3聚類框架
6��3��1模型綜述
6��3��2屬性生成建模
6��3��3結構一緻性建模
6��3��4統一模型
6��4聚類算法
6��4��1聚類優化
6��4��2鏈接類型強度學習
6��4��3整閤:GenClus算法
6��5實驗結果
6��5��1數據集
6��5��2有效性研究
第7章通過元路徑選擇的用戶引導聚類
7��1概述
7��2用戶引導聚類的元路徑選擇問題
7��2��1元路徑選擇問題
7��2��2用戶引導的聚類
7��2��3問題定義
7��3概率模型
7��3��1關係生成建模
7��3��2用戶引導建模
7��3��3對元路徑選擇的質量權重建模
7��3��4統一模型
7��4學習算法
7��4��1給定元路徑權重優化聚類結果
7��4��2給定聚類結果優化元路徑權重
7��4��3PathSelClus算法
7��5實驗結果
7��5��1數據集
7��5��2有效性研究
7��5��3元路徑權重的案例研究
7��6討論
第8章研究前沿
參考文獻
叢書前言陳寅恪先生說:“一時代之學術,必有其新材料與新問題。取用此材料,以研求問題,則為此時代學術之新潮流。治學之士,得預於此潮流者,謂之預流(藉用佛教初果之名)。其未得預者,謂之未入流。”對今天的信息技術而言,“新材料”即為大數據,而“新問題”則是産生於“新材料”之上的新的應用需求。
當下大數據技術發展變化日新月異,大數據應用已經遍及工業和社會生活方方麵麵,原有的數據管理理論體係與大數據産業應用之前的差距日益加大,而工業界對於大數據人纔的需求卻極劇增加。大數據專業人纔的培養是新一輪科技較量的基礎,高等院校承擔著大數據人纔培養的重任。因此大數據相關課程將逐漸成為國內高校計算機相關專業的重要課程。近來越來越多的院校急切地開設大數據方麵的人纔培養計劃,以求占得“先機”。但縱觀大數據人纔培養課程體係尚不盡如人意,多是已有課程的“冷拼盤”,頂多是加點“調料”,原材料沒有新鮮感。現階段無論多麼新多麼好的人纔培養計劃,都隻能在六七十年代編寫的計算機知識體係上施教,無法把當下的大數據帶給我們的新思維方式和知識體係傳導給學生。
為此我們意識到,缺少基礎性工作和原始積纍,就難以培養符閤工業界需要的大數據復閤型和交叉型人纔。因此急需在思維和理念方麵進行轉變,為現有的課程和知識體係按大數據應用需求進行延展和補充,加入新的可以因材施教的知識模塊。每一位學者都有責任和義務去為此“增磚添瓦”。
在此背景下,我們策劃和組織瞭這套大數據管理叢書,希望能夠培養數據思維的理念,對原有數據管理知識體係進行完善和補充,麵嚮新的技術熱點,提齣新的知識體係/知識點,拉近教材體係與大數據應用的距離,為受教者應對現代技術帶來的大數據領域的新問題和挑戰,掃除障礙。現時要求學者編寫大部頭著作費時費力,不太現實。這使我們想到二十世紀八九十年代風靡一時的“五角叢書”,它短小精湛,題材豐富,選題新穎,恰到好處地迎閤瞭那個時代人們對新知識的渴望,因此成為瞭那個時代的共同記憶。所以我們受此啓發,選擇瞭這種更容易實現的“五角叢書”的形式,促使學者們力所能及地把各自工作中的積纍呈現給大傢,為大數據人纔培養的“大廈”增磚添瓦。我們相信,假以時日,這些小部頭的著作匯溪成河,必將對未來大數據人纔培養起到“基石”的作用。
叢書定位:麵嚮新形勢下的大數據技術發展對人纔培養提齣的挑戰,旨在為學術研究和人纔培養提供可供參考的“基石”。雖然是一些不起眼的“磚頭瓦塊”,但可以為大數據人纔培養積纍可用的新模塊(新素材),彌補原有知識體係與應用問題之前的鴻溝,力圖為現有的數據管理知識查漏補缺,聚少成多,最終形成適應大數據技術發展和人纔培養的知識體係和教材基礎。
叢書特點:叢書藉鑒Morgan&ClaypoolPublishers;齣版的SynthesisLecturesonDataManagement,特色在於選題新穎,短小精湛。選題新穎即麵嚮技術熱點,彌補現有知識體係的漏洞和不足(或延伸或補充),內容涵蓋大數據管理的理論、方法、技術等諸多方麵。短小精湛則不求係統性和完備性,但每本書要自成知識體係,重在闡述基本問題和方法,並輔以例題說明,便於施教。
叢書組織:叢書采用國際學術齣版通行的主編負責製,為此特邀中國人民大學孟小峰教授(email:xfmeng@ruc�眅du�眂n)擔任叢書主編,負責叢書的整體規劃和選題。責任編輯為機械工業齣版社華章分社姚蕾編輯(email:yaolei@hzbook�眂om)。
在此期望有誌於大數據人纔培養並具有豐富理論和實踐經驗的學者和專業人員能夠加入到這套書的編寫工作中來,共同為中國大數據研究和人纔培養貢獻自己的智慧和力量,共築屬於我們自己的“時代記憶”。歡迎讀者對我們的齣版工作提齣寶貴意見和建議。
叢書即將齣版書目大數據管理概論孟小峰主編2017年2月齣版異構信息網絡挖掘:原理和方法[美]孫藝洲(YizhouSun)韓傢煒(JiaweiHan)著;段磊硃敏唐常傑譯2017年1月齣版大規模元搜索引擎技術[美]孟衛一(WeiyiMeng)於德(ClementT�盰u)著;硃亮譯2017年1月大數據集成[美]董欣(XinLunaDong)戴夫士·斯裏瓦斯塔瓦(DiveshSrivastava)著;王鞦月杜治娟王碩譯2017年2月短文本數據理解王仲遠編著2017年2月個人數據管理李玉坤孟小峰編著2017年3月位置大數據隱私保護潘曉霍崢孟小峰編著2017年3月移動大數據挖掘連德富張富崢王英子袁晶謝幸編著2017年3月雲數據管理挑戰與機遇[美]迪衛艾肯特·阿格拉沃爾(DivyakantAgrawal)蘇迪皮托·達斯(SudiptoDas)阿姆魯·埃爾·阿巴迪(AmrElAbbadi)著;馬友忠等譯2017年3月流數據管理[加]盧卡斯·戈拉布(LukaszGolab)[德]M·塔納·顧茲敘(M�盩amer�Zzsu)著;禹曉輝譯2017年3月
京東客服態度和辦事積極性、力度都叫人颱心寒,日後是不敢買京東自營圖書啦。。。
評分數據分析理論多多,最近剛有這套書,買來學習學習
評分看上去還行,物流快。
評分公式錯誤,錯彆字,還不如之前下的論文,多給一分都是多的,不建議買
評分數據分析理論多多,最近剛有這套書,買來學習學習
評分大數據係列的書,比較新的選題,但不夠新
評分全是理論性的闡述,不知道是不是東抄抄西抄抄,機械工業齣版社的書又薄又貴,內容還未知。有點垃圾
評分學習一下大數據的知識,條理很清晰。
評分還行吧。書的質量一般般,內容感覺也是東拼西湊的。
異構信息網絡挖掘:原理和方法 pdf epub mobi txt 電子書 下載