第44页第七课处理大规模数据的基础知识

tonight

章节名：第七课处理大规模数据的基础知识
页码：第44页 2013-02-03 17:08:07

处理大规模数据的三个重点------写程序的技巧

       1、“能在内存中完成多少？”。为什么必须在内存中完成？如前所述，磁盘寻道次数极大地影响着可扩展性和性能。因此，应在最大限度减少磁盘寻道次数的意义上灵活运用内存。此外，还应充分利用局部性的分布式。

       2、“使用能应对数据量增加的算法”。单纯使用线性搜索的话，1000万条数据就要计算1000万次，而使用对数据级的算法，只需几十次就可以完成。例如：线性搜索--->二叉树搜索； O(n)--->O(log n)

       3、有时可以利用数据压缩和搜索等技术。通过压缩等方法缩小数据，以减少寻道次数，使磁盘读取次数降到最低，而且更容易缓存到内存中。太大的数据无法放入内存，就算保存到磁盘上，读取也要花费时间，所以压缩十分重要。引自 第七课 处理大规模数据的基础知识

34人阅读

> tonight的所有笔记（533篇）

tonight对本书的所有笔记 · · · · · ·

第11页第1章大规模Web服务的开发定位

成长为大规模服务之后，一个人负责开发和运维当然是很困难的，所以要由多名技术人员分担。人...
第28页第五课大规模数据处理的难点------内存和磁盘

首当其冲的就是“无法在内存中计算”。为什么说无法在内存中计算是难点呢？因为内存中放不下...
第44页第七课处理大规模数据的基础知识
第102页第十三课 MySql的横向扩展和Partitioning

以Partitioning为前提进行设计避免JOIN，利用where...in...
第269页第十三章保证冗余性和系统的稳定化

稳定性措施一、维持适当的余量（buffer） 1、内存容量、CPU负载--->使用到极限的7成二、...

> 查看全部5篇

说明 · · · · · ·

表示其中内容是对原文的摘抄

第44页 第七课 处理大规模数据的基础知识

tonight

tonight对本书的所有笔记 · · · · · ·

第11页 第1章 大规模Web服务的开发定位

第28页 第五课 大规模数据处理的难点------内存和磁盘

第44页 第七课 处理大规模数据的基础知识

第102页 第十三课 MySql的横向扩展和Partitioning

第269页 第十三章 保证冗余性和系统的稳定化

说明 · · · · · ·

第44页第七课处理大规模数据的基础知识

第11页第1章大规模Web服务的开发定位

第28页第五课大规模数据处理的难点------内存和磁盘

第44页第七课处理大规模数据的基础知识

第102页第十三课 MySql的横向扩展和Partitioning

第269页第十三章保证冗余性和系统的稳定化