出版社: 电子工业出版社
原作名: Programming Collective Intelligence
译者: 莫映 / 王开福
出版年: 2009-1
页数: 364
定价: 59.80元
装帧: 平装
丛书: O'Reilly动物系列(中译本)
ISBN: 9787121075391
内容简介 · · · · · ·
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
本书是Web开发者、架构师、应用工程师等的绝佳选择。
集体智慧编程的创作者
· · · · · ·
-
Toby Segaran 作者
作者简介 · · · · · ·
Toby Segaran是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,Toby Segaran还建立了几个免费的网站应用,包括流行的tasktoy和Lazybase。他非常喜欢滑雪与品酒,其博客地址是blog.kiwitobes.com,现居于旧金山。
目录 · · · · · ·
第1章 集体智慧导言
什么是集体智慧
什么是机器学习
机器学习的局限
真实生活中的例子
学习型算法的其他用途
第2章 提供推荐
协作型过滤
搜集偏好
寻找相近的用户
推荐物品
匹配商品
构建一个基于del.icio.us的链接推荐系统
基于物品的过滤
使用MovieLens数据集
基于用户进行过滤还是基于物品进行过滤
练习
第3章 发现群组
监督学习和无监督学习
单词向量
分级聚类
绘制树状图
列聚类
K-均值聚类
针对偏好的聚类
以二维形式展现数据
有关聚类的其他事宜
练习
第4章 搜索与排名
搜索引擎的组成
一个简单的爬虫程序
建立索引
查询
基于内容的排名
利用外部回指链接
从点击行为中学习
练习
第5章 优化
组团旅游
描述题解
成本函数
随机搜索
爬山法
模拟退火算法
遗传算法
真实的航班搜索
涉及偏好的优化
网络可视化
其他可能的应用场合
练习
第6章 文档过滤
过滤垃圾信息
文档和单词
对分类器进行训练
计算概率
朴素分类器
费舍尔方法
将经过训练的分类器持久化
过滤博客订阅源
对特征检测的改进
使用Akismet
替代方法
练习
第7章 决策树建模
预测注册用户
引入决策树
对树进行训练
选择最合适的拆分方案
以递归方式构造树
决策树的显示
对新的观测数据进行分类
决策树的剪枝
处理缺失数据
处理数值型结果
对住房价格进行建模
对“热度”评价进行建模
什么时候使用决策树
练习
第8章 构建价格模型
构造一个样本数据集
k-最近邻算法
为近邻分配权重
交叉验证
不同类型的变量
对缩放结果进行优化
不对称分布
使用真实数据——eBay API
何时使用k-最近邻算法
练习
第9章 高阶分类:核方法与SVM
婚介数据集
数据中的难点
基本的线性分类
分类特征
对数据进行缩放处理
理解核方法
支持向量机
使用LIBSVM
基于Facebook的匹配
练习
第10章 寻找独立特征
搜集一组新闻
先前的方法
非负矩阵因式分解
结果呈现
利用股票市场的数据
练习
第11章 智能进化
什么是遗传编程
将程序以树形方式表示
构造初始种群
测试题解
对程序进行变异
交叉
构筑环境
一个简单的游戏
更多可能性
练习
第12章 算法总结
贝叶斯分类器
决策树分类器
神经网络
支持向量机
k-最近邻
聚类
多维缩放
非负矩阵因式分解
优化
附录A:第三方函数库
附录B:数学公式
索引
· · · · · · (收起)
丛书信息
· · · · · ·
喜欢读"集体智慧编程"的人也喜欢的电子书 · · · · · ·
喜欢读"集体智慧编程"的人也喜欢 · · · · · ·
- 统计学习方法 8.9
- 机器学习 8.3
- UNIX编程艺术 9.0
- 利用Python进行数据分析 8.6
- 编程珠玑 9.1
- 程序员修炼之道 8.7
- 信息检索导论 9.1
- STL源码剖析 8.7
- Mahout in Action 8.1
- 深入理解计算机系统 9.5
集体智慧编程的书评 · · · · · · ( 全部 48 条 )
from guwendong 《Programming Collective Intelligence》书评
> 更多书评 48篇
论坛 · · · · · ·
集体智慧是Collective Intelligence专业术语吗 | 来自贝塔 | 4 回应 | 2022-04-01 23:58:26 |
对基于机器学习的量化投资策略研发有帮助吗? | 来自creacentblue | 2018-08-04 00:29:12 | |
请问有人有第三章中博客订阅源的文件么 | 来自null | 2018-01-24 19:43:24 | |
关于书中代码的问题 | 来自amy tse | 2 回应 | 2014-03-03 15:33:52 |
求一本这本书的二手,豆邮联系。 | 来自金正胖 | 2013-06-19 10:23:20 |
> 浏览更多话题
这本书的其他版本 · · · · · · ( 全部5 )
-
O'Reilly Media (2007)8.9分 394人读过
-
东南大学出版社 (2008)8.9分 122人读过
-
电子工业出版社 (2015)8.5分 93人读过
-
オライリージャパン (2008)暂无评分
以下书单推荐 · · · · · · ( 全部 )
- 豆瓣高分书2700本:千人打分不低于8分 (偶就是那个鬼)
- 豆瓣读书评分9分以上榜单 (无人的冬夜)
- 书单 | 千评9分书 (Sheryl)
- 技术派心理学 (欧阳)
- 团队分享 (Fenng)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
订阅关于集体智慧编程的评论:
feed: rss 2.0
0 有用 睡睡睡 2011-11-23 11:50:45
很实用
1 有用 dexteryy 2011-01-02 16:48:43
难怪算法工程师们都对此书很不屑嘛~
1 有用 忍者阿童木 2014-05-15 14:09:40
介绍了基本思想,入门极佳
9 有用 黄小虎 2013-01-10 18:13:02
这本书,前几章看着还可以,觉得学到了点东西,到了后面完全不知道在说什么了,只告诉你怎么做却不告诉你为什么要这样做,套公式
3 有用 汪杨 2017-06-16 20:53:54
很实用,内容有些过时
0 有用 张爱玲 2023-05-21 11:22:19 辽宁
这本书介绍了从头开始写机器学习算法,很了不起,因为现在网上很多介绍如何从头写决策树,大部分程序其实都是来自本书。
0 有用 pirate 2023-03-14 08:13:23 北京
副标题是“构建智能Web2.0”,名副其实,但随着互联网时代的结束,书的内容也多少有些过时。不过基于算法本身来说,书还是值得一看的。
0 有用 豆友76904650 2023-03-07 16:47:34 河南
书中提供的资源链接已不可用,复现麻烦,代码和结果经常有差距,导致排查问题的时间比理解函数和写代码时间都长。另外 python 代码的可读性是真的差。
0 有用 普林斯赖 2023-02-21 23:23:28 北京
这个读完忘了标记了,印象中还不错,有一定启发,二次读的时候再来补评论。
0 有用 乐与lv 2022-04-16 17:18:07
新人可以读读案例,知道什么算法大致适合什么类型的问题。举一反三,至于具体代码,我觉得还是去github上找现存的库学习更好!