出版社: Cambridge University Press
出版年: 2011-12-30
页数: 326
定价: USD 65.00
装帧: Hardcover
ISBN: 9781107015357
内容简介 · · · · · ·
The popularity of the Web and Internet commerce provides many extremely large datasets from which information can be gleaned by data mining. This book focuses on practical algorithms that have been used to solve key problems in data mining and which can be used on even the largest datasets. It begins with a discussion of the map-reduce framework, an important tool for paralleli...
The popularity of the Web and Internet commerce provides many extremely large datasets from which information can be gleaned by data mining. This book focuses on practical algorithms that have been used to solve key problems in data mining and which can be used on even the largest datasets. It begins with a discussion of the map-reduce framework, an important tool for parallelizing algorithms automatically. The authors explain the tricks of locality-sensitive hashing and stream processing algorithms for mining data that arrives too fast for exhaustive processing. The PageRank idea and related tricks for organizing the Web are covered next. Other chapters cover the problems of finding frequent itemsets and clustering. The final chapters cover two applications: recommendation systems and Web advertising, each vital in e-commerce. Written by two authorities in database and Web technologies, this book is essential reading for students and practitioners alike.
Mining of Massive Datasets的创作者
· · · · · ·
作者简介 · · · · · ·
Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马 逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David Ullman 美国国家工程院院士,计算机科学家,...
Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马 逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David Ullman 美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人Sergey Brin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
王斌 博士,中国科学院计算技术研究所博士生导师。中国科学院信息工程研究所客座研究员。主要研究方向为信息检索、自然语言处理和数据挖掘。《信息检索导论》译者。主持国家973、863、国家自然科学基金、国际合作基金、国家支撑计划等课题20余项,发表学术论文120余篇。现为ACM会员、中国中文信息学会理事、中文信息学会信息检索专委会委员、《中文信息学报》编委、中国计算机学会高级会员及计算机学会中文信息处理专委会委员。自2006年起在中国科学院研究生院(现改名“中国科学院大学”)讲授《现代信息检索》研究生课程,选课人数累计近千人。2001年开始指导研究生,迄今培养博士、硕士研究生30余名。
喜欢读"Mining of Massive Datasets"的人也喜欢的电子书 · · · · · ·
喜欢读"Mining of Massive Datasets"的人也喜欢 · · · · · ·
Mining of Massive Datasets的书评 · · · · · · ( 全部 18 条 )
真正讲“大数据”处理思路的书
书名应该改成<Algorithm Analysis: A Data Mining Perspective>
> 更多书评 18篇
论坛 · · · · · ·
MOOC同名课程,由作者讲课 | 来自Zoe | 1 回应 | 2015-02-24 17:28:18 |
这本书的其他版本 · · · · · · ( 全部7 )
-
人民邮电出版社 (2012)7.8分 429人读过
-
人民邮电出版社 (2015)7.3分 28人读过
-
Cambridge University Press (2014)8.8分 18人读过
-
Cambridge University Press (2020)暂无评分 4人读过
以下书单推荐 · · · · · · ( 全部 )
- data science (雪地里的水煮蛋)
- 数据挖掘与个性化推荐 (刘未鹏pongba)
- 数据挖掘、统计、机器学习 (大米粒)
- 机器学习-数学理论与实际领域应用入门进阶 (xiaoliable)
- eldar (挑灯看剑)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有532人想读,手里有一本闲着?
订阅关于Mining of Massive Datasets的评论:
feed: rss 2.0
0 有用 Lillian 2014-09-01 14:42:35
真心感觉很好的入门教材啊。。
0 有用 飞翔的蘑菇🍄 2023-02-14 00:13:21 北京
作者对大数据的定义是,如何使用合适的数据结构和信息处理方法处理海量的数据。第二章很多内容在介绍分布式mapreduce,后续章节内容都很有价值,推荐!
0 有用 大啸 2019-03-22 12:36:40
已经有第二版了
1 有用 nobodyknows 2011-10-10 17:16:21
Big Data is all the rage now!
1 有用 大米粒 2016-08-22 22:33:42
数据挖掘 经典图书
0 有用 Draven@ 2024-02-13 18:26:43 广东
研究生算法课参考书之一,是数据挖掘基础算法很全面的入门书。
0 有用 飞翔的蘑菇🍄 2023-02-14 00:13:21 北京
作者对大数据的定义是,如何使用合适的数据结构和信息处理方法处理海量的数据。第二章很多内容在介绍分布式mapreduce,后续章节内容都很有价值,推荐!
0 有用 Tinn 2021-12-17 05:32:07
大数据处理涉及的基础算法,可以作为入门。很好的教材,配合斯坦福视频课程理解更佳。
0 有用 paracelsus 2020-12-28 21:34:02
4.5 清晰。简明。生动。13年时看得很爽的一本DS入门书。里面的聚类发现疾病cause至今记忆犹新。
0 有用 大啸 2019-03-22 12:36:40
已经有第二版了