DevOps三十六计

DevOps三十六计

详情

内容简介

新型的DevOps涵括了从需求提出到软件发布的整个软件生命周期,是产品设计、项目管理、开发、测试和运维提升的必由之路,国内大型互联网企业已经做了很多探索,并将相关技能规范化、文档化、工具化、自动化甚至智能化。遗憾的是,这些宝贵经验往往仅在团队或公司内部分享,很多中小公司还在重复走着大公司走过的弯路。

为了促进先进经验在整个行业内分享和传播,DevOps时代社区和高效运维社区邀请了40位业界大咖,从精益、敏捷、开发、测试、运维、架构、安全等各个方面分享他们在Top互联网公司及领先的传统企业的多年智慧和经验结晶。本书共有36篇文章,1349条计策,其中很多计策都是在经历了刻骨铭心的事故后总结出来的,精选的115个案例则是对相关计策的解读。

本书旨在总结经验、交流共享,让国内互联网及传统企业缩短成长路径、避免无谓的反复踩坑,让技术人员更好地聚焦于业务目标和业务产出。

本书主编为萧田国和梁定安,欢迎提出宝贵意见和建议。

  

TOP作者简介

DevOps时代社区

DevOps时代社区是国内第1个真正有组织的DevOps领域技术社区,也是国际上早期的DevOps 标准体系之一“研发运营一体化能力成熟度模型”的主要组织方(该系列标准由云计算开源产业联盟牵头,已正式在工信部立项)。DevOps时代公众号创办于2017年3月,在不到一年的时间里,订阅用户数已达20 000+。DevOps时代社区正处于急速发展中,成员来自精益、敏捷、开发、测试和运维等领域。

高效运维社区

高效运维社区是国内第1个也是超大的运维领域垂直技术社区,截至2018年2月,高效运维公众号订阅用户数达到100 000+,创办两年多以来,文章阅读量累计6 000 000+人次,是国内运维行业升级转型的主力推手。

高效运维社区是国际上第1个AIOps标准及白皮书的主要组织方(该标准由云计算开源产业联盟牵头,正在工信部立项中),核心编写专家来自互联网优秀企业BATJ,以及金融、制造业、物流等众多领域的领头企业。


TOP目录

第一章  精益

精益产品开发三十六计  何勉/ 2

总说/ 2

三十六计/ 4

案例:影响地图应用实例/ 8

更多案例

  ◎ 看板可视化方案设计实例

精益看板三十六计  李智桦/ 13

总说/ 13

三十六计/ 14

案例:看板的系统思维/ 16

更多案例

  ◎ 运用看板引导会议的进行

第二章  敏捷

大规模敏捷三十六计  赵卫/ 24

总说/ 24

三十六计/ 27

案例:大规模敏捷变革管理/ 31

更多案例

  ◎ 大规模敏捷组织结构

  ◎ 敏捷需求

  ◎ 敏捷架构

  ◎ 大规模敏捷运作

敏捷Scrum 三十六计  方炜/ 申健/ 38

总说/ 38

三十六计/ 40

案例:采用Scrum of Scrum 方式提升多团队间的协作/ 47

更多案例

  ◎ 关注专注力培养仪式感,提升Scrum 活动的效果

  ◎ 采用“观察—导向—决定—行动”方式持续解决问题,

     打造优秀的Scrum 团队

敏捷项目管理三十六计  杨晓俊/ 52

总说/ 52

三十六计/ 54

案例:现场客户/ 57

更多案例

  ◎ 需求评估点

  ◎ 站立晨会

Jira 三十六计  何英华/ 61

总说/ 61

三十六计/ 64

案例:Jira 对敏捷和精益的落地支撑/ 69

更多案例

  ◎ 测试管理利器:Zephyr 插件

第三章  持续交付

持续交付三十六计  张乐/ 石雪峰/ 77

总说/ 77

三十六计/ 79

案例:大型复杂产品的持续交付/ 83

更多案例

  ◎ Facebook 的分支策略演进助力持续交付

  ◎ Preflight 持续集成为质量保驾护航

  ◎ 大型团队推广持续集成

Git 应用三十六计  石雪峰/ 91

总说/ 91

三十六计/ 95

案例:多重体系保证版本控制系统的安全和高可用/ 99

更多案例

  ◎ 分支间快速差异对比和代码合并

  ◎ 保留历史记录,进行版本控制库拆分

Jenkins 三十六计  景韵/ 雷涛/ 李华强/ 104

总说/ 104

三十六计/ 106

案例:企业级Jenkins 之构建环境标准化、

      集群化、弹性化/ 109

更多案例

  ◎ 企业级Jenkins 之插件推荐列表

  ◎ 企业级Jenkins 之数据备份方案

  ◎ 企业级Jenkins 之精细化权限管理

  ◎ 企业级Jenkins 之精准化通知

  ◎ 乐视EUI 持续集成案例

Docker 应用三十六计  谭用/ 114

总说/ 114

三十六计/ 116

案例:优雅地停止容器/ 119

更多案例

  ◎ 给镜像瘦身

  ◎ 管好2375 端口

SaltStack 运维三十六计  赵舜东/ 123

总说/ 123

三十六计/ 126

案例:SaltStack 灵活的目标选择方式/ 130

更多案例

  ◎ YAML 编写技巧三板斧

  ◎ 使用salt-cloud 进行混合云管理

第四章  开发架构与运维开发

微服务架构三十六计  王磊/ 陈俊良/ 139

总说/ 139

三十六计/ 141

案例:微服务不只是拆拆拆/ 145

更多案例

  ◎ 微服务的轻量级测试

  ◎ 微服务创业的快与慢

Python 开发技巧三十六计  郭宏泽/ 152

总说/ 152

三十六计/ 154

案例:开发一个简单的监控平台/ 156

更多案例

  ◎ 如何选择Python 版本

  ◎ 自己动手实现运维平台

第五章  监控与质量测试技术

容量管理三十六计  梁定安/ 163

总说/ 163

三十六计/ 165

案例:容量木桶原理的应用/ 167

更多案例

  ◎ 架构前进一小步,容量提升一大步

  ◎ 结合“容量考核”合理使用运营成本

自动化测试三十六计  汪珺/ 171

总说/ 171

三十六计/ 176

案例:批量执行自动化测试的策略改进/ 179

更多案例

  ◎ 自动化测试思维的变化

  ◎ 无法适应变更的“死”自动化测试脚本

测试方法三十六计  徐奇琛/ 潘晓明/ 万千一/ 183

总说/ 183

三十六计/ 185

案例:统一化持续集成、持续交付,收归风险提升效率 / 190

更多案例

  ◎ 未覆盖最终版本带来的巨大风险

  ◎ 用JMeter 构建可靠廉价的压力测试方案

  ◎ 利用MAT 分析定位Android 内存泄漏问题

  ◎ UI 式样检测工具让测试人员拥有火眼金睛

  ◎ 运营活动监控系统为线上运营活动提供有力保障

第六章  安全技术

业务安全运维三十六计  邓冬瑞/ 196

总说/ 196

三十六计/ 199

案例:技术不是万能的,但是离开技术是万万不能的/ 201

更多案例

  ◎ 提高运营效率,快速响应,各司其职

  ◎ 要及时检视策略并做出相应调整,否则会殃及正常用户

安全测试三十六计  宗良/ 项阳/ 205

总说/ 205

三十六计/ 208

案例:有目的有计划的事前信息采集可以让安全

      测试事半功倍/ 211

更多案例

  ◎ 没有考虑安全的设计就是没有防盗门的金库

  ◎ 仅仅发现问题,那是管杀不管埋

安全运维三十六计  韩方/ 216

总说/ 216

三十六计/ 217

案例:定期备份日志,还原入侵事件真相/ 221

更多案例

  ◎ 用多种认证手段提升安全防护等级

  ◎ 危险的匿名登录默认配置

第七章  大数据技术

数据质量三十六计  陈靖翔/ 226

总说/ 226

三十六计/ 229

案例:规范的企业主数据管理是数据质量的基石/ 233

更多案例

  ◎ 糟糕的数据处理架构会让数据异常处理付出更大的代价

  ◎ 精准的质量监控阈值会让运维工作更高效

大数据运维三十六计  范伦挺/ 236

总说/ 236

三十六计/ 238

案例:数据驱动精细化运维/ 241

更多案例

  ◎ 欲速则不达——直接删除惹的祸

  ◎ 数据驱动智能运维

  ◎ 离线作业监控平台的应用

第八章  日常运维

日常运维三十六计  梁定安/ 246

总说/ 246

三十六计/ 248

案例:从源头优化运维工作/ 250

更多案例

  ◎ 演习,为容灾策略保鲜

  ◎ 重点关注与保障不可逆操作的质量

Linux shell 三十六计  阿铭/ 254

总说/ 254

三十六计/ 255

案例:根据网卡名字输出对应的IP 地址/ 259

更多案例

  ◎ 自动封/ 解封IP

  ◎ 监控httpd 进程

  ◎ 备份数据库

  ◎ 监控磁盘使用

  ◎ 构建一个发布系统

网络运维三十六计  张永福/ 265

总说/ 265

三十六计/ 267

案例:利用自动化运维工具提升工作效率/ 270

更多案例

  ◎ 在网络排障中锻炼“抽丝剥茧”的能力

  ◎ 网络运维过程中团队合作的重要性

分布式存储运维三十六计  高向冉/ 275

总说/ 275

三十六计/ 277

案例:不及时回收删除的文件引发的成本问题/ 280

更多案例

  ◎ 微信存储应对节假日大规模突发事件

  ◎ 定期进行单点剔除演习的重要性

  ◎ 现网一定要干干净净

第九章  自动化运维

自动化运维三十六计  胥峰/ 285

总说/ 285

三十六计/ 286

案例:建设自动化运维体系/ 289

CMDB 三十六计  王津银/ 303

总说/ 303

三十六计/ 306

案例:应用CMDB 支撑更多的核心场景/ 309

更多案例

  ◎ 每个成功的CMDB 都离不开全员参与

  ◎ 面向新IT 的CMDB 模型管理新思路

第十章  运维管理

运维管理三十六计  涂彦/ 315

总说/ 315

三十六计/ 317

案例:运筹帷幄,解密远程管理/ 321

更多案例

  ◎ 运维管理者如何与年轻员工打成一片

  ◎ 用互联网产品思维管理远程团队

轻量ITSM 三十六计  闫林/ 328

总说/ 328

三十六计/ 332

案例:某大型银行大面积业务中断故障/ 338

更多案例

  ◎ 从5 万个网站宕机谈起

  ◎ 从2008 年北京奥运售票系统的崩溃谈起

第十一章  数据库运维

互联网数据库运维三十六计  周小军/ 341

总说/ 341

三十六计/ 342

案例:优化热记录与肥胖记录/ 344

更多案例

  ◎ 未经测试的数据搬迁工具引发的故障

  ◎ 节假日前的数据库容量规划

MongoDB 运维三十六计  周李洋/ 349

总说/ 349

三十六计/ 351

案例:MongoDB 执行计划分析——知其所以然/ 355

更多案例

  ◎ 由于滥用Schema less 导致的运营事故——

     Schema less 而非Schema free

  ◎ 提前排兵布阵,减少阵型调整带来的损耗——

     Sharding 架构下预分片

Oracle 运维三十六计  盖国强/ 361

总说/ 361

三十六计/ 363

案例:禁止远程DDL 和业务时间的DDL 操作/ 368

更多案例

  ◎ 有效的备份重于一切

  ◎ 测试和生产环境隔离

PostgreSQL 运维三十六计  周正中/ 375

总说/ 375

三十六计/ 377

案例:菜鸟末端轨迹项目中的面面判断/ 381

更多案例

  ◎ 共享充电宝实时经营分析系统的后台数据库设计

第十二章  数据中心运维

CDN 运维三十六计  高向冉/ 396

总说/ 396

三十六计/ 398

案例:应对CDN 各层级网络问题/ 400

更多案例

  ◎ NBA 直播总决赛突发场景应对

  ◎ 机房网络异常下的快速处理机制

数据中心运维节能三十六计  闫林/ 405

总说/ 405

三十六计/ 407

案例:某IT 企业高能耗大型数据中心的分析与改善/ 411

更多案例

  ◎ 某石化企业高能耗大型数据中心的分析与改善

  ◎ 某互联网公司大型数据中心的节能环保措施

IDC 运维三十六计  王莹/ 414

总说/ 414

三十六计/ 415

案例:inode 引发的业务中断/ 418

更多案例

  ◎ SAN 存储故障

  ◎ SAN 架构调整

致谢/ 423

    发表评论
    叁 加 壹 =
    评论通过审核后显示。