作者:
赵成
出版社: 电子工业出版社·博文视点
副标题: 运维技术变革与实践探索
出版年: 2018-5-20
页数: 273
定价: 59.00
装帧: 平装
ISBN: 9787121338854
出版社: 电子工业出版社·博文视点
副标题: 运维技术变革与实践探索
出版年: 2018-5-20
页数: 273
定价: 59.00
装帧: 平装
ISBN: 9787121338854
内容简介 · · · · · ·
本书依托作者在电信和互联网行业多年的从业经历,结合一线实际工作实践,从应用生命周期的视角,全面详细地介绍了分布式架构体系下,应用运维体系建设的方方面面,涵盖了体系建设方法论指导、持续交付体系建设思路和实践、稳定性体系规划建设,以及故障的科学管理方法等内容,视角新颖且独特,换一个角度看运维,能够带给读者不一样的思考方式。
本书是各行业运维工程师和运维架构师了解新时代运维趋势的必不可少的学习材料,同时也是业务架构师、开发、测试等技术人员以及技术经理、总监等管理人员用来丰富技术视角的、不可多得的宝贵参考书。
作者简介 · · · · · ·
赵成,美丽联合集团技术服务经理,公众号“Forrest 随想录”作者,极客时间专栏作者。多届ArchSummit 运维专题明星讲师和优秀出品人,目前专注于云计算和人工智能时代的运维转型和提升。
曾在华为工作7年,经历过开发、测试、运维以及一线客户服务等诸多岗位。具备全面思考的意识和能力,十年的从业经历也积累了丰富的电信和互联网业务研发及运维经验。
目录 · · · · · ·
第1章 运维的本质
1.1顶级公司的运维定义/ 2
1.1.1没有运维的Netflix / 2
1.1.2 Netflix是如何成为行业典范的/ 3
1.1.3总结/ 7
1.2运维体系建设的核心概念:应用/ 7
· · · · · · (更多)
1.1顶级公司的运维定义/ 2
1.1.1没有运维的Netflix / 2
1.1.2 Netflix是如何成为行业典范的/ 3
1.1.3总结/ 7
1.2运维体系建设的核心概念:应用/ 7
· · · · · · (更多)
第1章 运维的本质
1.1顶级公司的运维定义/ 2
1.1.1没有运维的Netflix / 2
1.1.2 Netflix是如何成为行业典范的/ 3
1.1.3总结/ 7
1.2运维体系建设的核心概念:应用/ 7
1.2.1应用的起源/ 8
1.2.2应用模型及关系模型的建立/ 9
1.2.3微服务架构时代下为什么要以应用为核心/ 12
第2章 运维体系建设
2.1标准化体系建设基础/ 16
2.1.1标准化的原因和步骤/ 16
2.1.2基础设施层面的标准化/ 17
2.1.3应用层面的标准化/ 19
2.1.4总结/ 21
2.2标准化体系建设实践:基础架构标准化/ 22
2.2.1常见的分布式基础架构组件/ 23
2.2.2基础架构组件的选型问题/ 24
2.2.3基础架构的服务化/ 26
2.2.4运维的职责/ 27
2.3 应用运维体系建设:从生命周期的视角看 / 28
2.3.1 怎样理解生命周期 / 29
2.3.2 应用的生命周期分析 / 30
2.3.3 总结 / 33
第3章 配置管理数据库(CMDB)
3.1 CMDB的前世今生/ 36
3.1.1 CMDB源起/ 36
3.1.2传统运维思路下的CMDB / 37
3.1.3互联网运维体系下的CMDB / 39
3.1.4 CMDB进行时/ 40
3.2有了CMDB,为什么还需要应用配置管理/ 41
3.2.1 CMDB是面向资源的管理,是运维的基石/ 42
3.2.2应用配置管理是面向应用的管理,是运维的核心/ 43
3.2.3总结/ 45
3.3在CMDB中落地应用的概念/ 46
3.3.1如何有效组织和管理应用/ 46
3.3.2应用的集群服务分组建设/ 49
3.3.3 CMDB在基础服务体系中的核心位置/ 51
3.3.4总结/ 54
第4章 运维组织架构及模式
4.1运维组织架构和转型/ 56
4.1.1自助化运维能力的建设/ 56
4.1.2从价值呈现的角度看运维/ 57
4.1.3运维协作模式的改变/ 59
4.1.4运维的组织架构/ 61
4.1.5总结/ 62
4.2 Google SRE的运维模式/ 63
4.2.1 SRE岗位的定位/ 63
4.2.2 SRE岗位的职责/ 64
4.2.3如何借鉴和落地/ 67
4.3从Google CRE谈运维的服务意识/ 67
4.3.1 CRE产生的背景/ 68
4.3.2 CRE岗位的职责/ 69
4.3.3从CRE谈谈做运维为什么要有服务心态/ 70
4.4云计算和AI时代下的运维转型/ 73
4.4.1应用运维的转型/ 75
4.4.2云计算和AI带给我们的挑战/ 78
4.4.3总结/ 80
第5章 持续交付
5.1提升效率,为什么要先做持续交付/ 84
5.1.1什么是持续交付/ 85
5.1.2持续交付的关键点/ 86
5.2持续交付的第一关键点:配置管理/ 88
5.2.1版本控制/ 89
5.2.2依赖管理/ 90
5.2.3软件配置/ 91
5.3多环境配置管理/ 94
5.3.1多环境问题/ 94
5.3.2不同环境下的应用配置管理/ 95
5.3.3环境配置管理解决方案/ 96
5.3.4总结/ 100
5.4多环境建设/ 101
5.4.1环境分类/ 101
5.4.2线下环境分类建设/ 102
5.4.3环境建设上的关键技术点/ 106
5.4.4总结/ 109
5.5线上环境建设/ 110
5.5.1生产环境/ 110
5.5.2 Beta环境/ 112
5.5.3预发环境/ 113
5.5.4办公网生产环境/ 116
5.5.5总结/ 117
5.6流水线模式/ 118
5.6.1持续交付流水线简要说明/ 119
5.6.2项目需求分解/ 119
5.6.3提交阶段之开发模式选择/ 121
5.6.4开发模式的选型原则/ 123
5.7流水线软件构建/ 125
5.7.1构建环节/ 126
5.7.2几个关键问题/ 127
5.8流水线构建完成后的质量保障/ 131
5.8.1依赖规则限制/ 131
5.8.2功能测试/ 132
5.8.3非功能测试/ 133
5.8.4总结/ 135
5.9持续交付实践:根据业务场景找方案/ 136
5.9.1软件的持续部署发布/ 137
5.9.2发布策略/ 139
5.9.3持续交付体系的收益/ 141
5.9.4总结/ 141
第6章 稳定性保障
6.1极端业务场景下的稳定性保障/ 144
6.1.1我们所面对的极端业务场景/ 144
6.1.2技术上的挑战/ 146
6.1.3极端业务场景下的不确定因素/ 148
6.2稳定性实践/ 150
6.2.1容量规划/ 150
6.2.2限流降级/ 160
6.2.3开关和预案/ 167
6.2.4全链路跟踪系统/ 172
第7章 故障管理
7.1我对故障的理解/ 182
7.2故障定级和定责/ 186
7.2.1故障的定级标准/ 187
7.2.2故障的定责标准/ 189
7.3故障定责的目的/ 192
7.3.1关于定责和处罚/ 192
7.3.2目的是鼓励做事,而不是处罚错误/ 194
7.3.3处罚的“负”作用远超我们的想象/ 196
7.4故障应急和故障复盘/ 197
7.4.1故障应急/ 198
7.4.2故障复盘/ 201
7.4.3定期总结故障案例/ 203
7.4.4总结/ 204
第8章 云运维的技术选型
8.1为什么蘑菇街会选择上云/ 206
8.1.1我们所面临的问题/ 206
8.1.2纵观技术发展趋势/ 211
8.1.3没有银弹/ 212
8.2为什么混合云是未来云计算的主流形态/ 213
8.2.1关于混合云/ 213
8.2.2我们所经历的几个基础设施建设阶段/ 215
8.2.3总结/ 219
8.3面向应用层的云架构解决方案:Spring Cloud / 219
8.3.1 Spring Cloud框架中云的影子/ 220
8.3.2 CNCF / 223
8.3.3可以预见的技术发展趋势/ 224
8.4云计算时代的弹性伸缩/ 225
8.4.1弹性伸缩的主体是谁/ 225
8.4.2总结/ 228
第9章CDN
9.1从CDN和云存储来聊聊云生态的崛起/ 230
9.1.1 CDN和云存储/ 230
9.1.2云生态的优势/ 231
9.1.3总结/ 234
9.2页面静态化架构和二级CDN建设/ 235
9.2.1静态化架构建设的业务场景/ 235
9.2.2页面静态化架构/ 237
9.2.3静态化架构在大促场景中的应用/ 239
9.2.4二级CDN建设/ 240
9.2.5总结/ 241
第10章 运维人员的成长之路
10.1我是如何走上运维岗位的/ 244
10.1.1我是怎么开始做运维工作的/ 244
10.1.2我为什么会把运维当作职业发展的方向/ 247
10.1.3给我们的一点启发/ 251
10.2运维需要懂产品和运营吗/ 252
10.2.1运维的角色转变和价值体现/ 253
10.2.2技术产品/ 254
10.2.3技术运营/ 254
10.2.4总结/ 256
10.3从技术到管理,如何转身/ 257
10.3.1从员工离职说起/ 257
10.3.2关于员工离职的两个观点/ 258
10.3.3谈谈如何做好技术管理/ 259
10.3.4技术管理中引以为戒的一些反模式/ 261
10.3.5总结/ 262
10.4树立个人品牌意识/ 263
10.4.1对求职者的背景调查/ 263
10.4.2如何树立个人口碑/ 265
10.4.3要引以为戒的反例/ 266
10.4.4共勉/ 268
拓展阅读:运维与安全
· · · · · · (收起)
1.1顶级公司的运维定义/ 2
1.1.1没有运维的Netflix / 2
1.1.2 Netflix是如何成为行业典范的/ 3
1.1.3总结/ 7
1.2运维体系建设的核心概念:应用/ 7
1.2.1应用的起源/ 8
1.2.2应用模型及关系模型的建立/ 9
1.2.3微服务架构时代下为什么要以应用为核心/ 12
第2章 运维体系建设
2.1标准化体系建设基础/ 16
2.1.1标准化的原因和步骤/ 16
2.1.2基础设施层面的标准化/ 17
2.1.3应用层面的标准化/ 19
2.1.4总结/ 21
2.2标准化体系建设实践:基础架构标准化/ 22
2.2.1常见的分布式基础架构组件/ 23
2.2.2基础架构组件的选型问题/ 24
2.2.3基础架构的服务化/ 26
2.2.4运维的职责/ 27
2.3 应用运维体系建设:从生命周期的视角看 / 28
2.3.1 怎样理解生命周期 / 29
2.3.2 应用的生命周期分析 / 30
2.3.3 总结 / 33
第3章 配置管理数据库(CMDB)
3.1 CMDB的前世今生/ 36
3.1.1 CMDB源起/ 36
3.1.2传统运维思路下的CMDB / 37
3.1.3互联网运维体系下的CMDB / 39
3.1.4 CMDB进行时/ 40
3.2有了CMDB,为什么还需要应用配置管理/ 41
3.2.1 CMDB是面向资源的管理,是运维的基石/ 42
3.2.2应用配置管理是面向应用的管理,是运维的核心/ 43
3.2.3总结/ 45
3.3在CMDB中落地应用的概念/ 46
3.3.1如何有效组织和管理应用/ 46
3.3.2应用的集群服务分组建设/ 49
3.3.3 CMDB在基础服务体系中的核心位置/ 51
3.3.4总结/ 54
第4章 运维组织架构及模式
4.1运维组织架构和转型/ 56
4.1.1自助化运维能力的建设/ 56
4.1.2从价值呈现的角度看运维/ 57
4.1.3运维协作模式的改变/ 59
4.1.4运维的组织架构/ 61
4.1.5总结/ 62
4.2 Google SRE的运维模式/ 63
4.2.1 SRE岗位的定位/ 63
4.2.2 SRE岗位的职责/ 64
4.2.3如何借鉴和落地/ 67
4.3从Google CRE谈运维的服务意识/ 67
4.3.1 CRE产生的背景/ 68
4.3.2 CRE岗位的职责/ 69
4.3.3从CRE谈谈做运维为什么要有服务心态/ 70
4.4云计算和AI时代下的运维转型/ 73
4.4.1应用运维的转型/ 75
4.4.2云计算和AI带给我们的挑战/ 78
4.4.3总结/ 80
第5章 持续交付
5.1提升效率,为什么要先做持续交付/ 84
5.1.1什么是持续交付/ 85
5.1.2持续交付的关键点/ 86
5.2持续交付的第一关键点:配置管理/ 88
5.2.1版本控制/ 89
5.2.2依赖管理/ 90
5.2.3软件配置/ 91
5.3多环境配置管理/ 94
5.3.1多环境问题/ 94
5.3.2不同环境下的应用配置管理/ 95
5.3.3环境配置管理解决方案/ 96
5.3.4总结/ 100
5.4多环境建设/ 101
5.4.1环境分类/ 101
5.4.2线下环境分类建设/ 102
5.4.3环境建设上的关键技术点/ 106
5.4.4总结/ 109
5.5线上环境建设/ 110
5.5.1生产环境/ 110
5.5.2 Beta环境/ 112
5.5.3预发环境/ 113
5.5.4办公网生产环境/ 116
5.5.5总结/ 117
5.6流水线模式/ 118
5.6.1持续交付流水线简要说明/ 119
5.6.2项目需求分解/ 119
5.6.3提交阶段之开发模式选择/ 121
5.6.4开发模式的选型原则/ 123
5.7流水线软件构建/ 125
5.7.1构建环节/ 126
5.7.2几个关键问题/ 127
5.8流水线构建完成后的质量保障/ 131
5.8.1依赖规则限制/ 131
5.8.2功能测试/ 132
5.8.3非功能测试/ 133
5.8.4总结/ 135
5.9持续交付实践:根据业务场景找方案/ 136
5.9.1软件的持续部署发布/ 137
5.9.2发布策略/ 139
5.9.3持续交付体系的收益/ 141
5.9.4总结/ 141
第6章 稳定性保障
6.1极端业务场景下的稳定性保障/ 144
6.1.1我们所面对的极端业务场景/ 144
6.1.2技术上的挑战/ 146
6.1.3极端业务场景下的不确定因素/ 148
6.2稳定性实践/ 150
6.2.1容量规划/ 150
6.2.2限流降级/ 160
6.2.3开关和预案/ 167
6.2.4全链路跟踪系统/ 172
第7章 故障管理
7.1我对故障的理解/ 182
7.2故障定级和定责/ 186
7.2.1故障的定级标准/ 187
7.2.2故障的定责标准/ 189
7.3故障定责的目的/ 192
7.3.1关于定责和处罚/ 192
7.3.2目的是鼓励做事,而不是处罚错误/ 194
7.3.3处罚的“负”作用远超我们的想象/ 196
7.4故障应急和故障复盘/ 197
7.4.1故障应急/ 198
7.4.2故障复盘/ 201
7.4.3定期总结故障案例/ 203
7.4.4总结/ 204
第8章 云运维的技术选型
8.1为什么蘑菇街会选择上云/ 206
8.1.1我们所面临的问题/ 206
8.1.2纵观技术发展趋势/ 211
8.1.3没有银弹/ 212
8.2为什么混合云是未来云计算的主流形态/ 213
8.2.1关于混合云/ 213
8.2.2我们所经历的几个基础设施建设阶段/ 215
8.2.3总结/ 219
8.3面向应用层的云架构解决方案:Spring Cloud / 219
8.3.1 Spring Cloud框架中云的影子/ 220
8.3.2 CNCF / 223
8.3.3可以预见的技术发展趋势/ 224
8.4云计算时代的弹性伸缩/ 225
8.4.1弹性伸缩的主体是谁/ 225
8.4.2总结/ 228
第9章CDN
9.1从CDN和云存储来聊聊云生态的崛起/ 230
9.1.1 CDN和云存储/ 230
9.1.2云生态的优势/ 231
9.1.3总结/ 234
9.2页面静态化架构和二级CDN建设/ 235
9.2.1静态化架构建设的业务场景/ 235
9.2.2页面静态化架构/ 237
9.2.3静态化架构在大促场景中的应用/ 239
9.2.4二级CDN建设/ 240
9.2.5总结/ 241
第10章 运维人员的成长之路
10.1我是如何走上运维岗位的/ 244
10.1.1我是怎么开始做运维工作的/ 244
10.1.2我为什么会把运维当作职业发展的方向/ 247
10.1.3给我们的一点启发/ 251
10.2运维需要懂产品和运营吗/ 252
10.2.1运维的角色转变和价值体现/ 253
10.2.2技术产品/ 254
10.2.3技术运营/ 254
10.2.4总结/ 256
10.3从技术到管理,如何转身/ 257
10.3.1从员工离职说起/ 257
10.3.2关于员工离职的两个观点/ 258
10.3.3谈谈如何做好技术管理/ 259
10.3.4技术管理中引以为戒的一些反模式/ 261
10.3.5总结/ 262
10.4树立个人品牌意识/ 263
10.4.1对求职者的背景调查/ 263
10.4.2如何树立个人口碑/ 265
10.4.3要引以为戒的反例/ 266
10.4.4共勉/ 268
拓展阅读:运维与安全
· · · · · · (收起)
喜欢读"进化"的人也喜欢的电子书 · · · · · ·
支持 Web、iPhone、iPad、Android 阅读器
喜欢读"进化"的人也喜欢 · · · · · ·
- 匠艺整洁之道 8.0
- 深入理解 Flask 7.6
- 编程卓越之道(卷3):软件工程化 8.7
- 代码之外的功夫 6.9
- 性能之巅(第2版) 9.4
- BPF之巅 8.7
- 第一本Docker书(修订版) 7.9
- 程序设计实践 8.3
- 架构整洁之道 8.7
进化的书评 · · · · · · ( 全部 2 条 )
运维的过程就是个人进化的过程
前言 软件架构的目的,是将构建和维护所需的人力资源降到最低。 中间件开发、稳定性开发、工具开发、监控开发、IaaS或PaaS平台开发,甚至专注于底层基础架构的内核开发、网络开发、协议开发等。 Netflix带给我们的启示一:在微服务架构模式下,我们必须换一个思路来重新定义和...
(展开)
> 更多书评 2篇
论坛 · · · · · ·
在这本书的论坛里发言当前版本有售 · · · · · ·
购买二手书 · · · · · ·
以下书单推荐 · · · · · · ( 全部 )
- 37°暖书单(二) (37°暖)
- 我偶然看到2 (明生)
- 公司图书馆说要买技术书 (李斯特杨)
- T (dhcn)
- 书单|产品经理 (金台夕照)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有200人想读,手里有一本闲着?
订阅关于进化的评论:
feed: rss 2.0
0 有用 浴火重生 2022-06-05 08:33:46
运维实践,知识有点老了
0 有用 木鱼 2018-09-09 22:17:43
总结得不错
2 有用 hello 2018-05-23 21:30:51
个人觉得《微服务设计》是这本书的实现,这本书更像是接口
4 有用 黄云斌 2018-06-18 11:02:45
这本书是说运维的,看完却发现几乎没有任何运维细节,我觉得说的完全是架构的事情。运维要的是标准化,服务化,标准化的步骤是抽象出对象,对象属性,对象关系,对象场景,架构同理。运维的目标是稳定性,效率,减少成本,架构同理。保证稳定性,如果容灾,都是架构考虑的重点。很佩服的是作者通篇的思路观点都非常清晰,甚至把人员的离职类比技术的容灾,管理的技术化思维啊。文中强调一句话让我感触颇深:理解系统如何工作并不会... 这本书是说运维的,看完却发现几乎没有任何运维细节,我觉得说的完全是架构的事情。运维要的是标准化,服务化,标准化的步骤是抽象出对象,对象属性,对象关系,对象场景,架构同理。运维的目标是稳定性,效率,减少成本,架构同理。保证稳定性,如果容灾,都是架构考虑的重点。很佩服的是作者通篇的思路观点都非常清晰,甚至把人员的离职类比技术的容灾,管理的技术化思维啊。文中强调一句话让我感触颇深:理解系统如何工作并不会让你成为专家,调查系统为何不能正常工作才能。面向问题编程和架构或许是短期的工作重点,不断发现提出问题,解决问题。以应用为起点,找到价值点也是要考虑的地方。当然该书的第五章我是觉得写得不怎么样。 (展开)
0 有用 小恩小惠 2018-08-01 14:22:28
这本书改变了我对运维的认知!
0 有用 浴火重生 2022-06-05 08:33:46
运维实践,知识有点老了
0 有用 青空 2022-05-03 15:55:36
文章写得很赤诚,作者结合自身经验,把运维的所有领域都写到了,全面但是缺少新知识。 书里写到2018年蘑菇街全面上云,运维和IT基础设施的成本、效率、质量得到极大优化。然而2019年蘑菇街爆出技术部门裁员70%,运维只剩下3个人。 这个行业,终将被自己抛入历史的洪流中。
0 有用 狂气之瞳改 2021-06-25 23:49:07
netflix推
0 有用 向生活 2021-01-27 10:03:10
带来了一些运维视角的新思考,不过总体感觉水分过大,读起来比较无聊。
0 有用 jude_dourden 2019-12-19 18:31:18
优点:作者很真诚,以身传教,考虑的很全面,内容层次鲜明逻辑清楚。缺点:1.奈飞的运维架构很先进,值得学习,但是未必适合所有企业。2.全书的措辞段落衔接通篇更像是一份技术文档,而非一本书,这个应该问责编辑。3.缺少专有名词注释,初学者会看得一头雾水。4.有些问题,看似点到为止,实际上不是一笔带过就是含糊其辞没有再展开交待。总的来说,希望现实里多有作者这样的运维管理大佬来指引企业的运维,那真是广大运维... 优点:作者很真诚,以身传教,考虑的很全面,内容层次鲜明逻辑清楚。缺点:1.奈飞的运维架构很先进,值得学习,但是未必适合所有企业。2.全书的措辞段落衔接通篇更像是一份技术文档,而非一本书,这个应该问责编辑。3.缺少专有名词注释,初学者会看得一头雾水。4.有些问题,看似点到为止,实际上不是一笔带过就是含糊其辞没有再展开交待。总的来说,希望现实里多有作者这样的运维管理大佬来指引企业的运维,那真是广大运维人员的福音了。。。 (展开)