网络广告图片揭阳百度推广优化
news/
2025/9/23 15:31:52/
文章来源:
网络广告图片,揭阳百度推广优化,微信网站建设流程,wordpress兼职写在前面 最近花了一点时间阅读了《SRE Goolge运维解密》这本书#xff0c;对于书的内容大家可以看看豆瓣上的介绍。总体而言#xff0c;这本书是首次比较系统的披露Google内部SRE运作的一些指导思想、实践以及相关的问题#xff0c;对于我们运维乃至开发人员都有一定的借鉴…写在前面 最近花了一点时间阅读了《SRE Goolge运维解密》这本书对于书的内容大家可以看看豆瓣上的介绍。总体而言这本书是首次比较系统的披露Google内部SRE运作的一些指导思想、实践以及相关的问题对于我们运维乃至开发人员都有一定的借鉴意义。 书中的一些思想也令我印象深刻例如SRE工程师要保证投入50%的时间在项目上、错误预算、命运之轮、事故总结等等对于从业者有很大的启发。书中提到了很多思想也提到了很多工具我想不同的单位有不同的文化、制度背景这种指导思想未必能够执行但是书中提到的工具却有被其他人利用的可能。因此我就整理了书中提到的一些工具以及搜索是否有对应的开源工程整理成下面的列表供大家参考。 如果大家发现有不全的或者对于某个工具希望深入讨论的欢迎给我留言。 Google 技术栈 功能介绍产品对标的开源产品备注分布式共识系统、分布式锁服务Chubby 书中描述为强一致性存储系统ZooKeeper、Consul监控服务BorgmonPrometheus、Riemann、Heka、BosunPhoton分布式周期性任务系统Cron任务分发系统集群管理系统Borg分布式文件系统GFSMesos管理报警响应及升级规则Escalator故障跟踪工具被动收集监控系统发出的所有报警信息同时提供标记、分组和数据分析功能Outalator数据流水线MapReduce、Flume大规模数据处理WorkflowSpanner ?Incident Command System构建系统Bazel分布式文件系统GFSBorg 调度服务2003开源产品 Kubernetes Borg Name Service BNS 名称解析系统 Bigtable Blaze/Bazel 构建 Rapid 发布 Midas Pacakge Management MPM 打包 Sisyphus 发布自动化框架 Chubby 强一致性存储系统 Prober 端到端检测黑盒监控 Black Box Monitoring Protocol Buffer (Protobuf) Alert Manager 报警管理服务 Dapper 分布式组件跟踪工具 Incident Command System 应急事件管理 IRC机器人 Dagger 依赖注入(Dependency Injection)工具 Protocol Buffer 数据交换格式 Auxon 自动化容量规划 gRPC Google RPC 框架 Doorman 协作性分布式客户端节流系统 Zipking 业务流追踪 Stackdriver 两点吐槽 一、绕口的翻译 P158:一个测试系统可以检测出一个MTTR为0的Bug。 P253:这种设计类型在服务领头人的工作量是分片的。 P327:Google几乎没有处理大规模消费者产品运行不能直接控制的客户端代码的经验。 二、强大的客户端 全书各章节及小评 章节及名称感想1 介绍2 Google 生产环境SRE视角3 拥抱风险4 服务质量目标5 减少琐事6 分布式系统的监控7 Google 的自动化系统演进自动化的价值自动化的层次8 发布工程9 简单化10 基于时间序列数据进行有效报警11 on-call 轮值12 有效的故障排查手段13 紧急事件响应14 紧急事故管理15 事后总结从失败中学习16 跟踪故障17 测试可靠性18 SRE部门中的软件工程实践19 前端服务器的负载均衡不同数据中心之间的负载均衡策略最佳实践基本的方案有DNS、VIP网络负载均衡器 F520 数据中心内部的负载均衡系统从应用层面谈如何进行负载均衡如何让各台服务器的使用率更加均衡避免出现闲忙不均的情况。如何更准确的识别出后端的真实状态的方法跛脚鸭状态。21 应对过载22 处理连锁故障23 管理关键状态利用分布式共识来提高可靠性24 分布式周期性任务系统25 数据处理流水线26 数据完整性读写一致27 可靠地进行产品的大规模发布28 迅速培养SRE加入on-call29 处理中断性任务30 通过嵌入SRE的方式帮助团队从运维过载中恢复31 SRE与其它团队的沟通与协作32 SRE参与模式的演进历史33 其他行业的实践经验34 结语参考资料 1、Google Borgmon 2、Google使用Borg进行大规模集群的管理-2015 3、基于 Prometheus 的数据库监控 4、Prometheus 5、Google Protocol Buffer 的使用和原理 6、Doorman: Global Distributed Client Side Rate Limiting 7、SRE Book notes 8、Zipkin 9、morgue 事故总结工具 10、Incident management at Google 11、TerraForm 12、
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/912999.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!