《搜》试读:搜索同用户界面

人工智能是目前人类面临的最棘手的难题之一。搜索是有希望解决这个难题的许多尝试的催化剂。实质上,搜索是整个计算机科学领域最具挑战性、最有趣的问题。许多专家宣称更进一步地探索搜索的奥秘,我们就能发现一条万灵咒语,解决目前人工智能研究在商务和学术领域里遇到的各种难题,从而使我们可以创造出无论以任何标准衡量,其行为模式都与人类别无二致的计算机。 简而言之,搜索的发展很可能会引发超级电脑哈尔(Hal)的出现。哈尔是斯坦利·库布里克的电影《2001:太空漫游》中那个高智能但是行动迟缓的电脑幽灵。或者,如果这个可能性不能使你夜不能寐的话,就把搜索想像成《终结者》系列电影,或者假想一下反乌托邦的《黑客帝国》三部曲中管理世界的人工智能体系的基础。我们被人类同机器对话这个创意深深吸引,而它则主导了我们的文化景观。要把上述这些可能性中的任何一个变成现实,搜索是最有前途的途径。你大可以把我叫成妄想狂(至少有许多人和我想的一样),但是,仅凭这一点,搜索就值得我们去了解。 搜索还会改变我们同政府之间的关系。这确实是个引人侧目的说法,但是在这个说法背后有足够的证据支持。在我还没有把话题扯得太远之前,我需要先声明,尽管我已经这样描绘了人类意图数据库,它其实并不存在于现实世界。尽管约翰·波因德克斯特曾试图构建这样一个个人档案数据库,但并没有一个巨大数据库来追踪我们在网络上所有的行动。我们的点击流,也就是我们全部的线上生活,分散在一片由形形色色的互联网网站和个人电脑构成的广袤的领域内。其中的绝大多数都没有被收集和整理,一直保持沉默。 但是,这个局面正在迅速改变。就在10年之前,带宽还是稀缺资源,信息存储的成本非常高。互联网的使用还远未普及,文件还很小,大部分网络公司也不会保存他们的工作记录文档,因为保存数据太贵了。在过去几年间,我们的大部分以数字为媒体的行为都转移到了网络上,不管是电子邮件、搜索,还是我们与他人的关系。 为什么会这样呢?储存每兆比特的成本已经迅速大幅下降,而且会继续降到几乎不需要什么成本的地步。与此同时,带宽也大大加宽,人们的互联网使用率也大幅增加。现在,互联网已经成为大多数美国家庭和各种工作场所必备的设施。本质上,我们已经把过去生活中暂时的、日常的部分都变成了永恒的行为,比如,平时我们习惯同谁谈话,我们寻找什么,购买什么。这就好像我们每天都在描摹一张像乔伊斯小说那样复杂的图,记录下我们世俗而又特别的人生轨迹。而绘图的行为是在我们与互联网的互动过程中完成的,不管我们使用个人电脑,电话还是音乐播放器。这种互动还包括我们同商业机构进行的在线或店堂内交易。(毕竟,杂货店的会员卡信息一定得存储在什么地方,不是吗?) 让我们回头看看前网络时代,也就是1985~1995年的个人电脑时代。在那个计算机革命的时期,对于通过计算机键盘进行的交流和发现的行为,我们形成了一些习惯性的假设。我们(也许正确,也许错误地)以为,我们在计算机上的行为是不会被长期记录的。我们认为我们在硬盘,或者后来的局域网和广域网上仔细搜查的时候我们留下的数字足迹,也就是我们的点击流,就像电话谈话一样转瞬即逝。不然又能怎么样呢?除了通过它们而实现的行为之外,点击流毫无价值,不过是为了实现找到某个文档或者传递某个信息这些目的而采取的手段罢了。 对于电子邮件,我们也抱有同样的想法。确实,我们知道邮件会短暂停留于服务器上。但是,多年以来,我们始终相信它们都是我们的电邮,无论是网络服务提供商还是我们赖以传递它们的网络都无权检查和利用它们,更不用说拥有它们了。(事实上,1986年美国通过的《电子通信隐私法案》也已经把这种观点纳入法律保护,至少对私人电子邮件来说是这样的。)目前,我们当中一些更世故的电子邮件用户渐渐认识到,在一个公司国家的环境下,这样的臆测是多么的愚昧。然而,电子邮件是瞬时性的媒介这个想法仍然受到普遍认可。弗兰克·奎特隆是技术领域最有影响的银行家之一,肯定不能说是个计算机盲。可是,2003年,他却被这种自以为是的想法害了—在一场受到广泛关注的官司里,暗示他有罪的电子邮件被当做对他不利的证据使用。   然而,对我们大多数人来讲,出现这样的负面后果的机率微乎其微,我们仍然相信电子邮件是一种极端隐私和暂时性的通讯方式。即使当这些电邮储存在雅虎、Hotmail或者Gmail网站的服务器上时,情况也是如此。 最后,在个人电脑时代,我们自以为是地认为,毫无疑问,我们同他人的关系(我们的社会关系网)或者我们同商品和服务之间的关系(我们的商业活动网)都是暂时性的。没有互联网的存在,又怎么会有别的可能性呢?的确,长期来讲,偶然有人会得到你的电话卡、你的备忘录,或是你的信用卡交易凭条。只有在这些时候,你的隐私和安全才会受到威胁。但是如果使用电子邮件,出现类似情况的机会就少到完全可以忽略不计。在像Linked In或者Frindster这类基于互联网的人际关系服务① 兴起之前,人际关系网仅仅是你的个人联系数据库中的记录。 简而言之,在网络出现之前,我们以数字为媒介的行为,比如查找硬盘,查收电子邮件,或者检查合同,都是暂时性的,仅为我们自己所知道的,而且很快就被忘记。 但是如今,我们生活的许多细节都被记录和保留在各种东西中,它们中大部分都是商业性的。产生这种转变的原因很简单:充满创意的公司通过解释点击流的样式,找到了提供基于网络的优质服务的方法(碰巧,这些服务都很赚钱)。像大多数物质文明产物一样,点击流正在成为一种资产。对个人而言是这样,对网络行业来说就更是如此了。 有些公司,通过计算点击流的样式来开发这项资产,比如Google的页面序列等级(PageRank)算法;另外一些公司采取的是更直接的方式,比如支持亚马逊公司推荐体制的算法体系。最显而易见的一点,就是所有的搜索引擎都试图通过显示与你表达出来的意图相匹配的广告而利用点击流赚钱。 从一个消费者的角度来看,这样的转化也有很简单却令人信服的理 由—搜索、推荐系统,还有电子邮件都使我们的生活变得更加简单、快捷和方便。至少到目前为止,我们还很愿意用我们的隐私来交换便利、服务和力量。 亚马逊A9搜索引擎的首席执行官尤迪·曼比指出:“作为一项课题,目前只有5%的搜索问题得到了解决。”只有区区5%,但是搜索业务已经发展成为价值数十亿美元的产业。搜索引发点击流,而点击流推动利润的产生。这是点击流被永久保留的最重要的原因。 当我们发掘全球化信息空间的时候,搜索就成为我们手中的铁锹,成为我们探寻和发现的利器。空白的搜索框和闪烁的光标预设了你的搜索产生的数字产品。你的鼠标在众多的链接上游移不定,而这些链接都在等待你的点击将它转化成这个时代的永恒索引中的一笔。

>

搜
作者: (美)约翰·巴特利
isbn: 7508605667
书名:
页数: 290
译者: 张岩, 魏平
定价: 35.00元
出版社: 中信出版社
出版年: 2006-1
装帧: 简裝本
又名: The Search