第137页 第三章 思维的革命
- 章节名:第三章 思维的革命
- 页码:第137页
即对于不同的搜索关键词,用户们都点击了哪些搜素结果(网页)。比如对于“虚拟现实”这个查询,用户有3100次点击了网页A1500次点击了网页B,11000次点击了网页C…在这种情况下网页A应该被排在第一位,但是如果搜素排序算法不好,有可能出现它没有被排在第一位的情况。这时搜素引擎的设计者就面临一个选择,是采用通过研究改进原有的排序算法,还是干脆相信用户的点击结果,或者是将它们结合在一起。如果单纯改进排序算法,这个周期特别长。如果相信用户点击的结果,其实就是用相关性取代罗果关系,当然这里面有两个风险:首先是用户点击容易形酸马太效应,排在前面的结果即使不是很相关,也容易获得更多的点击; 次是单纯依靠点击,搜索结果的排名容易被一些使用者操纵。因此,比较稳妥的办法是对用户的点击数据建立一个简单的模型,作为搜素排序算法的一部分。 今天,各个搜索引擎都有一个度量用户点击数据和搜索结果相关性的模型,通常被称为点击模型”随着数据量的积累,点击模型对搜索结果排名的预测越来越准确,它的重要性也越来越大。今天,它在搜索排序中至少占709%~80%的权重,也就是说素算法中其他所有的因素加起来都不如它重要。换句适 今天的搜素引擎中,因果关系已经没有数据的相关性重要一 ①各家搜素引擎对点击模型的依赖权重虽然有大有小,但是都在60%以上。 引自 第三章 思维的革命
36人阅读
随风对本书的所有笔记 · · · · · ·
-
第124页 第三章 思维的革命
最大嫡原理要比任何人为假定的理论更有效,因此它被广泛地于机器学习。最大熵原理实际上已经...
-
第90页 第三章 思维的革命
<原文开始>思维方式決定科学成就:从欧几里得、托勒密到牛顿 机械思维的形成可以追溯...
-
第137页 第三章 思维的革命
-
第141页 第三章 思维的革命
在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我偵...
> 查看全部4篇
说明 · · · · · ·
表示其中内容是对原文的摘抄