作者:
[美] Toby Segaran
出版社: 电子工业出版社
副标题: 构建智能Web 2.0应用
原作名: Programming Collective Intelligence: Building Smart Web 2.0 Applications
译者: 莫映 / 王开福
出版年: 2015-3
页数: 356
定价: 79.00元
装帧: 平装
丛书: O'Reilly动物系列(中译本)
ISBN: 9787121254437
出版社: 电子工业出版社
副标题: 构建智能Web 2.0应用
原作名: Programming Collective Intelligence: Building Smart Web 2.0 Applications
译者: 莫映 / 王开福
出版年: 2015-3
页数: 356
定价: 79.00元
装帧: 平装
丛书: O'Reilly动物系列(中译本)
ISBN: 9787121254437
内容简介 · · · · · ·
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析 Web 上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从 Web 网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。
全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank 算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
本书是 Web 开发者、架构师、应用工程师等的绝佳选择。
集体智慧编程的创作者
· · · · · ·
-
Toby Segaran 作者
作者简介 · · · · · ·
Toby Segaran 是 Genstruct 的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。他还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,他还建立了几个免费的网站应用,包括流行的 tasktoy 和 Lazybase。他非常喜欢滑雪与品酒,其博客地址是 blog.kiwitobes.com,现居于旧金山。
目录 · · · · · ·
前言 viii
第1章 集体智慧导言 1
什么是集体智慧 2
什么是机器学习 3
机器学习的局限 4
真实生活中的例子 5
学习型算法的其他用途 5
第2章 提供推荐 7
协作型过滤 7
搜集偏好 8
寻找相近的用户 9
推荐物品 15
匹配商品 17
构建一个基于del.icio.us的链接推荐系统 19
基于物品的过滤 22
使用MovieLens数据集 25
基于用户进行过滤还是基于物品进行过滤 27
练习 28
第3章 发现群组 29
监督学习和无监督学习 29
单词向量 30
分级聚类 33
绘制树状图 38
列聚类 40
K-均值聚类 42
针对偏好的聚类 44
以二维形式展现数据 49
有关聚类的其他事宜 53
练习 53
第4章 搜索与排名 54
搜索引擎的组成 54
一个简单的爬虫程序 56
建立索引 58
查询 63
基于内容的排名 64
利用外部回指链接 69
从点击行为中学习 74
练习 84
第5章 优化 86
组团旅游 87
描述题解 88
成本函数 89
随机搜索 91
爬山法 92
模拟退火算法 95
遗传算法 97
真实的航班搜索 101
涉及偏好的优化 106
网络可视化 110
其他可能的应用场合 115
练习 116
第6章 文档过滤 117
过滤垃圾信息 117
文档和单词 118
对分类器进行训练 119
计算概率 121
朴素分类器 123
费舍尔方法 127
将经过训练的分类器持久化 132
过滤博客订阅源 134
对特征检测的改进 136
使用Akismet 138
替代方法 139
练习 140
第7章 决策树建模 142
预测注册用户 142
引入决策树 144
对树进行训练 145
选择最合适的拆分方案 147
以递归方式构造树 149
决策树的显示 151
对新的观测数据进行分类 153
决策树的剪枝 154
处理缺失数据 156
处理数值型结果 158
对住房价格进行建模 158
对“热度”评价进行建模 161
什么时候使用决策树 164
练习 165
第8章 构建价格模型 167
构造一个样本数据集 167
k-最近邻算法 169
为近邻分配权重 172
交叉验证 176
不同类型的变量 178
对缩放结果进行优化 181
不对称分布 183
使用真实数据——eBay API 189
何时使用k-最近邻算法 195
练习 196
第9章 高阶分类:核方法与SVM 197
婚介数据集 197
数据中的难点 199
基本的线性分类 202
分类特征 205
对数据进行缩放处理 209
理解核方法 211
支持向量机 215
使用LIBSVM 217
基于Facebook的匹配 219
练习 225
第10章 寻找独立特征 226
搜集一组新闻 227
先前的方法 231
非负矩阵因式分解 232
结果呈现 240
利用股票市场的数据 243
练习 248
第11章 智能进化 250
什么是遗传编程 250
将程序以树形方式表示 253
构造初始种群 257
测试题解 259
对程序进行变异 260
交叉 263
构筑环境 265
一个简单的游戏 268
更多可能性 273
练习 276
第12章 算法总结 277
贝叶斯分类器 277
决策树分类器 281
神经网络 285
支持向量机 289
k-最近邻 293
聚类 296
多维缩放 300
非负矩阵因式分解 302
优化 304
附录A:第三方函数库 309
附录B:数学公式 316
索引 323
· · · · · · (收起)
第1章 集体智慧导言 1
什么是集体智慧 2
什么是机器学习 3
机器学习的局限 4
真实生活中的例子 5
学习型算法的其他用途 5
第2章 提供推荐 7
协作型过滤 7
搜集偏好 8
寻找相近的用户 9
推荐物品 15
匹配商品 17
构建一个基于del.icio.us的链接推荐系统 19
基于物品的过滤 22
使用MovieLens数据集 25
基于用户进行过滤还是基于物品进行过滤 27
练习 28
第3章 发现群组 29
监督学习和无监督学习 29
单词向量 30
分级聚类 33
绘制树状图 38
列聚类 40
K-均值聚类 42
针对偏好的聚类 44
以二维形式展现数据 49
有关聚类的其他事宜 53
练习 53
第4章 搜索与排名 54
搜索引擎的组成 54
一个简单的爬虫程序 56
建立索引 58
查询 63
基于内容的排名 64
利用外部回指链接 69
从点击行为中学习 74
练习 84
第5章 优化 86
组团旅游 87
描述题解 88
成本函数 89
随机搜索 91
爬山法 92
模拟退火算法 95
遗传算法 97
真实的航班搜索 101
涉及偏好的优化 106
网络可视化 110
其他可能的应用场合 115
练习 116
第6章 文档过滤 117
过滤垃圾信息 117
文档和单词 118
对分类器进行训练 119
计算概率 121
朴素分类器 123
费舍尔方法 127
将经过训练的分类器持久化 132
过滤博客订阅源 134
对特征检测的改进 136
使用Akismet 138
替代方法 139
练习 140
第7章 决策树建模 142
预测注册用户 142
引入决策树 144
对树进行训练 145
选择最合适的拆分方案 147
以递归方式构造树 149
决策树的显示 151
对新的观测数据进行分类 153
决策树的剪枝 154
处理缺失数据 156
处理数值型结果 158
对住房价格进行建模 158
对“热度”评价进行建模 161
什么时候使用决策树 164
练习 165
第8章 构建价格模型 167
构造一个样本数据集 167
k-最近邻算法 169
为近邻分配权重 172
交叉验证 176
不同类型的变量 178
对缩放结果进行优化 181
不对称分布 183
使用真实数据——eBay API 189
何时使用k-最近邻算法 195
练习 196
第9章 高阶分类:核方法与SVM 197
婚介数据集 197
数据中的难点 199
基本的线性分类 202
分类特征 205
对数据进行缩放处理 209
理解核方法 211
支持向量机 215
使用LIBSVM 217
基于Facebook的匹配 219
练习 225
第10章 寻找独立特征 226
搜集一组新闻 227
先前的方法 231
非负矩阵因式分解 232
结果呈现 240
利用股票市场的数据 243
练习 248
第11章 智能进化 250
什么是遗传编程 250
将程序以树形方式表示 253
构造初始种群 257
测试题解 259
对程序进行变异 260
交叉 263
构筑环境 265
一个简单的游戏 268
更多可能性 273
练习 276
第12章 算法总结 277
贝叶斯分类器 277
决策树分类器 281
神经网络 285
支持向量机 289
k-最近邻 293
聚类 296
多维缩放 300
非负矩阵因式分解 302
优化 304
附录A:第三方函数库 309
附录B:数学公式 316
索引 323
· · · · · · (收起)
丛书信息
· · · · · ·
O'Reilly动物系列(中译本)(共317册),
这套丛书还有
《微服务与事件驱动架构》《情报驱动应急响应》《Erlang编程指南》《JavaScript权威指南》《零信任网络》
等
。
喜欢读"集体智慧编程"的人也喜欢 · · · · · ·
集体智慧编程的书评 · · · · · · ( 全部 48 条 )
from guwendong 《Programming Collective Intelligence》书评
来自guwendong的书评,贴上来供大家参考。 中国有句老话,叫做“知易行难”。 作算法的朋友应该更有体会,想把 paper 上的公式转变为可以运行的代码,这是件考验功力的事情。 Toby Segaran 写的这本《Programming Collective Intelligence》,是修炼此种功力的武林秘笈之一。 ...
(展开)
> 更多书评 48篇
论坛 · · · · · ·
这本书和普通的机器学习的书到底有啥区别 | 来自Enterprize | 2020-05-22 09:37:42 |
这本书的其他版本 · · · · · · ( 全部5 )
-
电子工业出版社 (2009)9.0分 1576人读过
-
O'Reilly Media (2007)8.9分 396人读过
-
东南大学出版社 (2008)8.9分 122人读过
-
オライリージャパン (2008)暂无评分
以下书单推荐 · · · · · · ( 全部 )
- 深度学习与人工智能 (lyb)
- 9分以上(软件开发相关) (博士奶爸)
- CDA Level III 数据科学家(2019.1) (168 Hours)
- 统计 经济 管理 (Protingas)
- 书籍列表 (十甫寸)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
订阅关于集体智慧编程的评论:
feed: rss 2.0
1 有用 想活成一部电影 2018-05-30 22:01:38
在AI和大数据大热的时代,真是一个晦涩的书名也许就会让大家错失一本优秀的书籍,想对“机器学习”与“计算统计”进行了解和实践的朋友推荐阅读,其中的应用场景很贴近生活(比如商品偏好推荐、房价预测,约会匹配、金融场景……),书中所附代码也是可以执行的……,只是理解此书中所附知识点估计还需阅读实践多遍,并进行大量拓展学习( ̄(●●) ̄)
0 有用 金羚 2020-05-21 23:12:05
感觉比较适合建模的时候看
0 有用 2222 2022-07-18 23:08:15
双十一买回家,以目前水平看不懂,以后再回来阅读和评价
2 有用 无情小猫咪🐈 2017-09-17 08:47:15
入门佳作
1 有用 塞之沙 2015-04-22 09:46:55
粗读了一遍,通过实例讲解理论,适合刚接触机器学习、数据挖掘方向的读者,很好的入门书籍,浅显易懂,很多细节看一遍看不懂,还需要再多看几遍
0 有用 2222 2022-07-18 23:08:15
双十一买回家,以目前水平看不懂,以后再回来阅读和评价
0 有用 想跑马拉松 2022-03-01 20:13:54
代码简约清晰,由繁化简,讲清楚了底层算法的原理;和生产生活结合,极大地增强知识点的印象。不失数据挖掘入门的好书
0 有用 George 2021-04-07 11:13:07
适合缺乏项目经验的同学学习,对理论和原理介绍的比较少。
0 有用 逍遥子 2021-04-01 11:24:13
算是理论与实际结合的过程看得明白了,就是有一些理论不太明白,需要自行查阅相关概念
0 有用 masterplan 2020-12-12 18:07:34
补标