内容简介 · · · · · ·
《集体智慧编程》将你带入机器学习和统计的世界,并且阐释了如何从你和他人每天收集的信息中获得关于用户体验、市场营销、个性品味及人类行为的结论。每个算法的描述都十分简明清晰,相关代码均可以立即用于你的网站、博客、Wiki或特定应用程序。本书讲解了下列主题:
可以让在线零售商推荐产品或媒体的协作过滤技术
用于在大数据集中发现同类项组的聚类方法
从数以百万计可能方案中选择问题最佳解决方案的最优化算法
贝叶斯过滤,用在基于单词类型和其他特征的... (展开全部) 想要探寻搜索排名、产品推荐、社会化书签和在线匹配背后的力量吗?这本颇具魅力的书籍向你展现如何创建Web 2.0应用程序,从参与性?Internet应用程序产生的大量数据中挖掘金矿。运用本书中介绍的先进算法,你可以编写聪明的程序,以访问其他网站那些有趣的数据集,从自有应用程序的用户中收集数据,或者分析和理解你所发现的数据。
《集体智慧编程》将你带入机器学习和统计的世界,并且阐释了如何从你和他人每天收集的信息中获得关于用户体验、市场营销、个性品味及人类行为的结论。每个算法的描述都十分简明清晰,相关代码均可以立即用于你的网站、博客、Wiki或特定应用程序。本书讲解了下列主题:
可以让在线零售商推荐产品或媒体的协作过滤技术
用于在大数据集中发现同类项组的聚类方法
从数以百万计可能方案中选择问题最佳解决方案的最优化算法
贝叶斯过滤,用在基于单词类型和其他特征的垃圾信息过滤中
支持向量(support-vector)机器,用于在线交友网站中的速配
用于问题解决的演化智能——计算机如何通过多次玩同样的游戏,改进自身代码并获得技能提升
每一章都包含了相关练习,可通过扩展使算法变得更强大。超越简单的数据库支持应用程序模式,让 Internet数据财富为你所用。
作者简介 · · · · · ·
豆瓣成员常用的标签(共49个) · · · · · ·
喜欢读"集体智慧编程"的人也喜欢 · · · · · ·
按有用程度 按页码先后 最新笔记
-
第98页
36° (仰望星空 脚踏实地)
/代码内容已省略/ 应该是 /代码内容已省略/ 原文在step=1的时候正确,当step>1时,则数组出界,+step的类似。 /代码内容已省略/ 应该改成 /代码内容已省略/ 交叉同理,python2.7中 rand()的定义 random.randint(a, b) Return a random integer N such that a &l... (更多)if random.random() < 0.5 and vec[i] > domain[i][0]: return vec[0:i] + [vec[i] - step] + vec[i+1:]应该是if random.random() < 0.5 and vec[i] - step >= domain[i][0]: return vec[0:i] + [vec[i] - step] + vec[i+1:]原文在step=1的时候正确,当step>1时,则数组出界,+step的类似。#Mutation c = random.rand(0,topelite)
应该改成#Mutation c = random.rand(0,topelite - 1)
交叉同理,python2.7中 rand()的定义
(收起)random.randint(a, b) Return a random integer N such that a <= N <= b.
2011-10-01 15:05:59 回应
-
第95页
36° (仰望星空 脚踏实地)
这里的模拟退火的接受概率公式似乎不太对。 原文是 p = exp((-highcost-lowcost)/temperature) 原因一:下文中As the temperature decreases,the difference between the high cost and the low cost becomes more important.也就是说这里应该是difference。 原因二:http://en.wikipedia.org/wiki/Simulated_annealing#Acceptance_probabilities_2 the acceptance probability function P(e,e',T) was defined as 1 if ... (更多)这里的模拟退火的接受概率公式似乎不太对。原文是 p = exp((-highcost-lowcost)/temperature)原因一:下文中
也就是说这里应该是difference。原因二:http://en.wikipedia.org/wiki/Simulated_annealing#Acceptance_probabilities_2As the temperature decreases,the difference between the high cost and the low cost becomes more important.
这里是wiki的原文。注意“otherwise”,也就是说是负的差值的绝对值。所以应该是p = exp((lowcost - highcost)/temperature),后面的the acceptance probability function P(e,e',T) was defined as 1 if e' < e, and exp((e − e') / T) otherwise.
p = pow(math.e,(-eb-ea)/T))
应该改为p = pow(math.e,(-eb+ea)/T))
(收起)2011-10-01 12:20:20 回应
-
第88页
36° (仰望星空 脚踏实地)
貌似这里的 out = flights[(origin,destination)][r[d]] ret = flights[(destination,origin)][r[d+ 1]] 应该是 out = flights[(origin,destination)][r[2 * d]] ret = flights[(destination,origin)][r[2 * d+ 1]] 因为是两个两个的一起的,而89页的数据也不对。 (更多)貌似这里的out = flights[(origin,destination)][r[d]]ret = flights[(destination,origin)][r[d+ 1]]应该是out = flights[(origin,destination)][r[2 * d]]ret = flights[(destination,origin)][r[2 * d+ 1]]因为是两个两个的一起的,而89页的数据也不对。 (收起)2011-09-29 23:56:40 回应
-
第88页
36° (仰望星空 脚踏实地)
貌似这里的 out = flights[(origin,destination)][r[d]] ret = flights[(destination,origin)][r[d+ 1]] 应该是 out = flights[(origin,destination)][r[2 * d]] ret = flights[(destination,origin)][r[2 * d+ 1]] 因为是两个两个的一起的,而89页的数据也不对。 (更多)貌似这里的out = flights[(origin,destination)][r[d]]ret = flights[(destination,origin)][r[d+ 1]]应该是out = flights[(origin,destination)][r[2 * d]]ret = flights[(destination,origin)][r[2 * d+ 1]]因为是两个两个的一起的,而89页的数据也不对。 (收起)2011-09-29 23:56:40 回应
-
第95页
36° (仰望星空 脚踏实地)
这里的模拟退火的接受概率公式似乎不太对。 原文是 p = exp((-highcost-lowcost)/temperature) 原因一:下文中As the temperature decreases,the difference between the high cost and the low cost becomes more important.也就是说这里应该是difference。 原因二:http://en.wikipedia.org/wiki/Simulated_annealing#Acceptance_probabilities_2 the acceptance probability function P(e,e',T) was defined as 1 if ... (更多)这里的模拟退火的接受概率公式似乎不太对。原文是 p = exp((-highcost-lowcost)/temperature)原因一:下文中
也就是说这里应该是difference。原因二:http://en.wikipedia.org/wiki/Simulated_annealing#Acceptance_probabilities_2As the temperature decreases,the difference between the high cost and the low cost becomes more important.
这里是wiki的原文。注意“otherwise”,也就是说是负的差值的绝对值。所以应该是p = exp((lowcost - highcost)/temperature),后面的the acceptance probability function P(e,e',T) was defined as 1 if e' < e, and exp((e − e') / T) otherwise.
p = pow(math.e,(-eb-ea)/T))
应该改为p = pow(math.e,(-eb+ea)/T))
(收起)2011-10-01 12:20:20 回应
-
第98页
36° (仰望星空 脚踏实地)
/代码内容已省略/ 应该是 /代码内容已省略/ 原文在step=1的时候正确,当step>1时,则数组出界,+step的类似。 /代码内容已省略/ 应该改成 /代码内容已省略/ 交叉同理,python2.7中 rand()的定义 random.randint(a, b) Return a random integer N such that a &l... (更多)if random.random() < 0.5 and vec[i] > domain[i][0]: return vec[0:i] + [vec[i] - step] + vec[i+1:]应该是if random.random() < 0.5 and vec[i] - step >= domain[i][0]: return vec[0:i] + [vec[i] - step] + vec[i+1:]原文在step=1的时候正确,当step>1时,则数组出界,+step的类似。#Mutation c = random.rand(0,topelite)
应该改成#Mutation c = random.rand(0,topelite - 1)
交叉同理,python2.7中 rand()的定义
(收起)random.randint(a, b) Return a random integer N such that a <= N <= b.
2011-10-01 15:05:59 回应
-
第98页
36° (仰望星空 脚踏实地)
/代码内容已省略/ 应该是 /代码内容已省略/ 原文在step=1的时候正确,当step>1时,则数组出界,+step的类似。 /代码内容已省略/ 应该改成 /代码内容已省略/ 交叉同理,python2.7中 rand()的定义 random.randint(a, b) Return a random integer N such that a &l... (更多)if random.random() < 0.5 and vec[i] > domain[i][0]: return vec[0:i] + [vec[i] - step] + vec[i+1:]应该是if random.random() < 0.5 and vec[i] - step >= domain[i][0]: return vec[0:i] + [vec[i] - step] + vec[i+1:]原文在step=1的时候正确,当step>1时,则数组出界,+step的类似。#Mutation c = random.rand(0,topelite)
应该改成#Mutation c = random.rand(0,topelite - 1)
交叉同理,python2.7中 rand()的定义
(收起)random.randint(a, b) Return a random integer N such that a <= N <= b.
2011-10-01 15:05:59 回应
-
第95页
36° (仰望星空 脚踏实地)
这里的模拟退火的接受概率公式似乎不太对。 原文是 p = exp((-highcost-lowcost)/temperature) 原因一:下文中As the temperature decreases,the difference between the high cost and the low cost becomes more important.也就是说这里应该是difference。 原因二:http://en.wikipedia.org/wiki/Simulated_annealing#Acceptance_probabilities_2 the acceptance probability function P(e,e',T) was defined as 1 if ... (更多)这里的模拟退火的接受概率公式似乎不太对。原文是 p = exp((-highcost-lowcost)/temperature)原因一:下文中
也就是说这里应该是difference。原因二:http://en.wikipedia.org/wiki/Simulated_annealing#Acceptance_probabilities_2As the temperature decreases,the difference between the high cost and the low cost becomes more important.
这里是wiki的原文。注意“otherwise”,也就是说是负的差值的绝对值。所以应该是p = exp((lowcost - highcost)/temperature),后面的the acceptance probability function P(e,e',T) was defined as 1 if e' < e, and exp((e − e') / T) otherwise.
p = pow(math.e,(-eb-ea)/T))
应该改为p = pow(math.e,(-eb+ea)/T))
(收起)2011-10-01 12:20:20 回应
-
第88页
36° (仰望星空 脚踏实地)
貌似这里的 out = flights[(origin,destination)][r[d]] ret = flights[(destination,origin)][r[d+ 1]] 应该是 out = flights[(origin,destination)][r[2 * d]] ret = flights[(destination,origin)][r[2 * d+ 1]] 因为是两个两个的一起的,而89页的数据也不对。 (更多)貌似这里的out = flights[(origin,destination)][r[d]]ret = flights[(destination,origin)][r[d+ 1]]应该是out = flights[(origin,destination)][r[2 * d]]ret = flights[(destination,origin)][r[2 * d+ 1]]因为是两个两个的一起的,而89页的数据也不对。 (收起)2011-09-29 23:56:40 回应
书评 · · · · · · (共29条) 我来评论这本书
热门评论 最新评论
实战性极强
-
- clickstone(http://hyb.im) 中国有句老话,叫做“知易行难”。 作算法的朋友应该更有体会,想把 paper 上的公式转变为可以运行的代码,这是件考验功力的事情。 Toby Segaran 写的这本《Programming Collective Intelligence》,是修炼此种功力的武林秘笈之一。 这本书最显著的特点是,实战性极强! ...... (13回应)2008-08-25 39/40有用来自 O'Reilly Media2007版
夸的人太多了,我来中和以下
-
- Chen_1st(民科(闭关中,请通过邮件联系)) 这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。 不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里...... (31回应)2010-11-22 37/37有用
把这些算法用熟,就能开发出非常好的应用程序来
-
- 叶卡(真诚恻怛,无欲则刚。) 好书,介绍一些常用算法的使用方法,如神经网络,支持向量机,模拟退火,遗传算法等.对普通读者已经够了.能将这些算法用熟,就能开发出非常好的应用程序来。 缺少当今最流行的小波和独立分量分析,当然不可能有最新的变分贝叶斯理论.对研究算法且用于应用开发的人来说可以是一个好实际东西,因算法书上和文章上都没有应用实例.从...... (9回应)2009-01-09 12/12有用来自 电子工业出版社2009版
集体智慧*人工智能
-
- catsky 上周50周年系庆的时候 张钹 院士说了这样一句话:”人工智能以前大多基于经验和领域知识,直到上万上亿的数据出现时,基于数据的人工智能更有了广阔的天空。”《集体智慧》就是这样一本告诉你如何从数据中挖掘金矿的经典之作。 由于现在所从事的是信息检索,文本挖掘方面的研究工作,有时候成堆的数据让我不知所措。我也常常看一些个......2008-12-03 9/10有用来自 电子工业出版社2009版
入门的好书
-
- yeahq 花了很长时间,终于断断续续地坚持把《Programming Collective Intelligence》给读完了。作者用非常直观的方式向读者展示了人工智能和机器学习中的大量经典的算法。更可贵的是,作者在展示算法时所使用的例子都是Internet中非常有代表性的场景,并且很多情况下还会结合一些实际运营的Web站...... (1回应)2009-04-13 11/11有用来自 O'Reilly Media2007版
书中网站del.icio.us数据实例指导
-
- zhou jimin 为了更好地学习本书,我从学习python开始到后来调试书中的网站实例。花了不少功夫,希望朋友们不要走弯路。这里提供了图文并茂的指导过程。请参考: http://blog.csdn.net/zjmwqx/article/details/7007438...... (1回应)2011-11-24 3/3有用来自 电子工业出版社2009版
不错的入门书籍
-
- onewaystreet(一切都莫不是……) 如果你从没接触过挖掘,推荐,搜索引擎的书,确实值得一读。 如果你懂python,那就更好了,还可以练练手。 不过理论上也没有太多的深入,比如搜索引擎一块,基本就是个小例子,前沿的东西是没有的,毕竟篇幅有限。......2012-02-11 来自 电子工业出版社2009版
一本好的导论书
-
- 刘想说(目前很好.) 这本书当做导论来看才比较适合。里面理论性的实在是很浅,价值大多都体现在实现上。 搞过数学建模的同学看到此书肯定特别亲切,好多理论都接触过,不少内容还用MATLAB实现过,而且还比书里边的研究得更为深入。 因此该书的意义绝不是在于对某某算法的深入研究。而是告诉你,在工程领域的具体实现上应该运用哪类算法。权当更......2011-12-21 来自 电子工业出版社2009版
安装python ide环境和执行书中实践网站del.icio.us...
-
- zhou jimin 为了更好地学习本书,我从学习python开始到后来调试书中的网站实例。花了不少功夫,希望朋友们不要走弯路。这里提供了图文并茂的指导过程。请参考: http://blog.csdn.net/zjmwqx/article/details/7007438......2011-11-24 来自 O'Reilly Media2007版
读吧,好书
-
- martin 的确是本实用,有深度,又浅显易懂的书。能够把复杂的问题写得如此简单的人肯定是位绝顶高手。特别是原来感觉比较深奥的问题,比如: 核方法(Kernal Trick)、模拟退火(Simulated Annealing)等这些困扰多年的问题。想当年为了弄清SVM的核方法,看了不少参考资料,有的厚厚的像块砖。几次一头扎进水......2011-08-21 来自 电子工业出版社2009版
"集体智慧编程"的论坛 · · · · · ·
在哪儿买这本书? · · · · · ·
- 查看1家网店价格 (51.30元起)
- 加入购书单 多本比价 批量购买 已在购书单
这本书的其他版本 · · · · · · ( 全部3 )
- 电子工业出版社版 2009年1月 / 509人读过 / 有售
- O'Reilly Media版 2007-8-23 / 228人读过 / 有售
以下豆列推荐 · · · · · · (全部)
谁读这本书?
喜欢这本书的人常去的小组 · · · · · ·

- 机器学习与模式识别 Readi... (1261)

- 个性化推荐 (396)

- InfoQ中文站 (1000)

- 分布式技术与系统软件 (679)

- 搜索引擎 (600)

- Pythonic (176)

- Python编程 (19020)

- 数据挖掘 (5000)
喜欢这本书的人关注的活动 · · · · · ·
订阅关于集体智慧编程的评论:
feed: rss 2.0











