《智能Web算法》试读:前 言

前 言 在读研究生时,我开始接触到机器学习,尤其是模式识别。我的工作主要是数学建模和数值模拟,但海量数据的模式识别其实在很多领域都有着广泛的应用。以前也未曾想到,这些年我会如此深入地进入机器学习领域。 1999年,我完成学业,开始进入企业工作。在我担任顾问的一个项目中,我们试图根据患者的心电图判断出他们患心脏病的概率。显然,对这种问题,不存在也不可能推导出一个精确的数学公式。现实中,心脏病专家已经对大量的患者患心脏病的风险做出了诊断,而我们建模所使用的方法要能从这些病历中学习如何预测患心脏病的风险。通俗地说,我们要寻找的是能从用户输入的数据中不断地“学习”新知识的方法。 同时,在20世纪90年代,各种因素汇聚在一起导致了一个新产业的飞速发展——网络变得无处不在!根据摩尔定律,CPU的运行速度变得更快,而且价格更便宜。RAM模组、硬盘等各种计算机硬件的性能变化也是日新月异的,而价格则是一降再降。随之而来的是,网络连接的带宽不断增长,价格也能被更多的人接受。此外,健壮的Web应用开发技术已经成熟,而各种开源项目的蓬勃发展更是促进了相关技术的进步。所有的这些因素构成了现在我们称为Web的庞大生态系统。 显然,作为软件工程师和Web开发人员,我们首要的任务就是为构建健壮、可扩展、美观的Web应用提供足够的技术保障。正是如此,在过去的十年里,人们为此做出了巨大的努力,也获得了可观的成绩。当然,没有最好,只有更好,我们依然有进步的空间。虽然我们一直在追求更健壮、可扩展性更好、更美观的Web应用,然而我们已经遇到了瓶颈。在我们看来,单调乏味的互联网应用已经成为过去,仅仅是聚合数据,简单地根据预定逻辑工作的用户请求/响应模型也已经走到了尽头。 现在,在某些应用中已经出现了一股新的浪潮,让人们对互联网应用有了新的认识。这就是本书中所说的智能应用(intelligent application)。不同于传统的应用,智能应用能根据用户的输入调整自己的行为,就像我那个能根据心电图预测患心脏病概率的建模软件。 最近五年,我渐渐地发现,对于大部分软件开发人员来说,构建智能应用的技术依然保持着神秘的面纱。在我看来,这是由两方面的原因造成的。一方面,这些技术潜在的商业价值可以带来巨大的经济回报。所以从经济方面考虑,对这些应用进行保护,隐藏其中的关键细节是可以理解的。另一方面,几乎所有的相关技术都源自学术研究,需要较强的数学背景才能理解。对于第一个原因,我们无能为力,但在随时能获取海量知识的今天,第二个原因依然是不可逾越的障碍吗?我可以简短而明确地回答“不是!”。如果想要详细地回答,那就阅读本书吧! 我决定写这本书,是为了说明这些技术是可以用算法来表示的,并不需要读者有很强的数学基础。本书的目的是让读者掌握一些有助于在应用中构建智能行为的技术,同时尽可能地降低掌握这些技术的数学门槛。代码以算法的形式包含了所有必要的数学知识。 最初,我想用开源的库来演示这些技术,但大部分的此类库都是为了解决具体问题而开发的,并不是为了演示底层的技术。因此,这些库的源代码通常都是冗长且晦涩难懂的。显然,如果能有清晰、带注释的代码,一定会让本书的读者获益更多。Dmitry就是在这个时候加入了本书的写作,并最终编写完成了本书中的大部分代码。 尽管增长缓慢,但关于这个激动人心的新领域的书籍肯定将逐渐增多。本书只是一本有关这个依然在迅速增长的大领域的入门书籍。所以,本书所涉及的算法是很有限的,对算法的解释也比较简要。我的目标是选择并探讨一些有代表性的话题,而不是写一本代码手册或是有可能让读者晕头转向,内容包罗万象的书。 我希望能通过以下四个方面来实现我的目标: • 集中精力关注清晰易懂的例子。 • 使用高级脚本语言来演示算法的使用,就像读者在自己的应用中使用这些算法一样。 • 通过大量的ToDo事项让读者有机会尝试并思考这些代码。 • 编写高水平的、易读的代码。 那么,端着您最喜爱的热饮,坐好,来试试这些聪明的应用吧!它们就在本书中! HARALAMBOS MARMANIS
1人

>智能Web算法

智能Web算法
作者: Haralambos Marmanis, Dmitry Babenko
原作名: Algorithms of the Intelligent Web
isbn: 7121139197
书名: 智能Web算法
页数: 374
译者: 阿稳, 陈钢
定价: 65.00元
出版社: 电子工业出版社
装帧: 平装
出版年: 2011-11