第82页 简单之美——布尔代数和搜索引擎的索引
- 章节名:简单之美——布尔代数和搜索引擎的索引
- 页码:第82页
世界上不可能有比二进制更简单的技术方法了,它只有两个数字:0和1.从单纯数学的角度讲,它甚至比我们的十进制更合理。但是我们人有十个手指,使用起来比二进制(或者八进制)方便得多,所以在进化和文明发展过程中人类采用了十进制。二进制的历史其实也很早,中国古代的阴阳学说可以认为是最早二进制的雏形。而二进制作为一个计数系统,公元前2-5世纪时由印度学者完成,但是他们没有使用0和1计数。 二进制除了是一种计数的方式外,它还可以表示逻辑的“是”与“非”。这第二特征在索引中非常有用。布尔运算是针对二进制,尤其是二进制第二个特性的计算,它很简单,可能没有比布尔运算更简单的运算了。尽管今天每个搜索引擎都宣称自己如何聪明、多么智能(这个词非常忽悠人),其实从根本上讲都没有逃出布尔运算的框框。 读者也许会问这么简单的理论能解决什么问题。和布尔同时代的数学家们也有同样的疑问。事实上,在布尔代数提出后80多年里,它确实没有什么像样的应用,直到1938年香农在他的硕士论文中指出用布尔袋鼠来实现开关电路,才使得布尔代数成为数字电路的基础。所有的数学和逻辑运算,加、减、乘、除、乘方、开方等等,全都能转换成二值的布尔运算。 Google有一道面试产品经理的考题,就是“如何向你的奶奶节解释搜索引擎”。大部分候选人都是试图从互联网、搜索等等产品的技术层面给出解释,这道题基本通不过。好的回答是拿图书馆的索引卡片做类比。每个网站就像图书馆里的一本书,我们不可能在图书馆书架上一本本地找,而是要通过搜索卡片找到他的位置,然后直接去书架上拿。 引自 简单之美——布尔代数和搜索引擎的索引
93人阅读
Reborn对本书的所有笔记 · · · · · ·
-
第8页 文字和语言vs数字和信息
几乎所有的文明都采用了十进制,那么是否有文明采用二十进制呢?答案是肯定的,这就是玛雅文...
-
第59页 信息的度量和作用
一条信息的信息量和它的不确定性有着直接的关系。比如说,我们要搞清楚一件非常非常不确定的...
-
第82页 简单之美——布尔代数和搜索引擎的索引
> 查看全部3篇
说明 · · · · · ·
表示其中内容是对原文的摘抄