社交網站的數據挖掘與分析

社交網站的數據挖掘與分析 pdf epub mobi txt 电子书 下载 2025

Matthew A. Russell
圖書標籤:
想要找书就要到 求知書站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
前言1
第1章绪论:Twitter 数据的处理9
Python 开发工具的安装9
Twitter 数据的收集和处理11
小结24
第2章微格式:语义标记和常识碰撞26
XFN 和朋友27
使用XFN 来探讨社交关系29
地理坐标:兴趣爱好的共同主线37
(以健康的名义)对菜谱进行交叉分析41
对餐厅评论的搜集43
小结45
第3章邮箱:虽然老套却很好用47
mbox:Unix 的入门级邮箱48
mbox+CouchDB= 随意的Email 分析54
将对话线程化到一起70
使用SIMILE Timeline 将邮件“事件”可视化79
分析你自己的邮件数据82
小结84
第4章Twitter :朋友、关注者和Setwise 操作85
REST 风格的和OAuth-Cladded API86
干练而中肯的数据采集器90
友谊图的构建108
小结116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
笔PK 剑:和tweet PK 机枪(?!?)118
对tweet 的分析(每次一个实体)121
并置潜在的社交网站(或#JustinBieber VS #TeaParty)144
对大量tweet 的可视化155
小结163
第6章LinkedIn :为了乐趣(和利润?)将职业网络聚类164
聚类的动机165
按职位将联系人聚类167
获取补充个人信息183
从地理上聚类网络188
小结192
第7章Google Buzz:TF-IDF 、余弦相似性和搭配194
Buzz=Twitter+ 博客(???)195
使用NLTK 处理数据198
文本挖掘的基本原则201
查找相似文档208
在二元语法中发Buzz 215
利用Gmail 221
在中断之前试着创建一个搜索引擎……225
小结226
第8章博客及其他:自然语言处理(等)228
NLP :帕累托式介绍228
使用NLTK 的典型NLP 管线231
使用NLTK 检测博客中的句子234
对文件的总结237
以实体为中心的分析:对数据的深层了解245
小结256
第9章Facebook :一体化的奇迹257
利用社交网络数据258
对Facebook 数据的可视化274
小结294
第10 章语义网:简短的讨论296
发展中的变革296
人不可能只靠事实生活297
期望301
· · · · · · (收起)

具体描述

Facebook、Twitter和LinkedIn産生瞭大量寶貴的社交數據,但是你怎樣纔能找齣誰通過社交媒介正在進行聯係?他們在討論些什麼?或者他們在哪兒?這本簡潔而且具有可操作性的書將揭示如何迴答這些問題甚至更多的問題。你將學到如何組閤社交網絡數據、分析技術,如何通過可視化幫助你找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用信息。

每個獨立的章節介紹瞭在社交網絡的不同領域挖掘數據的技術,這些領域包括博客和電子郵件。你所需要具備的就是一定的編程經驗和學習基本的Python工具的意願。

•獲得對社交網絡世界的直觀認識

•使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn之類的社交網絡API中的數據

•學習如何應用便捷的Python工具來交叉分析你所收集的數據

•通過XHTML朋友圈探討基於微格式的社交聯係

•應用諸如TF-IDF、餘弦相似性、搭配分析、文檔摘要、派係檢測之類的先進挖掘技術

•通過基於HTML5和JavaScript工具包的網絡技術建立交互式可視化

用户评价

评分

评分

评分

##内容不难,直接看英文版吧

评分

##地铁纸质书刷完。。。。

评分

评分

评分

评分

##读晚了……twitter API 更新到很不友好的地步了……

评分

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有