网站开发流程分析灰系网站

news/2025/10/5 4:05:22/文章来源:
网站开发流程分析,灰系网站,湖州网站建设哪家好,石家庄开始二次感染了吗简介#xff1a; 尽管可以通过稳定性体系建设#xff0c;来避免出现生产系统故障。但是仍然无法彻底避免一点风险都不会产生#xff0c;当稳定性风险产生后#xff0c;怎么快速协调组织#xff0c;缩短故障时长#xff0c;科学的流程呢#xff1f; 作者 | 金喜 来源 | 阿…简介 尽管可以通过稳定性体系建设来避免出现生产系统故障。但是仍然无法彻底避免一点风险都不会产生当稳定性风险产生后怎么快速协调组织缩短故障时长科学的流程呢 作者 | 金喜 来源 | 阿里技术公众号 一 概述 尽管我们可以通过稳定性体系建设来避免出现生产系统故障。但是仍然无法彻底避免一点风险都不会产生当稳定性风险产生后怎么快速协调组织缩短故障时长科学的流程就非常重要了。 好在我们现在就开始思考的话我们还有充足的时间去设计各个环节并让参与的同学充分的锻炼从而做到训练有素为故障恢复争取宝贵的时间。 二 结构化问题解决 对于问题解决有很多结构化解决方法尤其是各种专业的咨询公司这些流程值得我们借鉴。结合软件系统的生产环境故障来描述的话一个典型的结构化问题解决步骤如下 问题定义清晰的描述问题现象、影响其中影响要尽量量化。例如xx时xx分开始xx服务异常成功率从99%下跌到90%。临时解决基于预案的临时解决方案和实施结果包括符合条件的预案执行或者应用发布过程中出现的异常后立即回滚。分析问题原因结合已知因素找到问题的根本原因。制定解决方案。实施解决方案。标准化解决方案将解决方案标准化举一反三避免同类问题继续发生。 生产环境中出现突发异常时候我们第一优先的是考虑怎么快速恢复服务因此本文中重点介绍上面流程中前面2个步骤。 另外问题解决里沟通是贯穿在整个流程里的。需要在各个环节都做好充分的沟通。 三 关键角色 突发异常的情况都各有不同很难有一个完全统一而且颗粒度很细的标准流程但是可以提前约定好几个关键角色定义角色的作用和关键动作来提升协作效率。 主要包括这些角色 指挥员负责组织和协调故障快速恢复、故障群里通报相关进展。通讯员负责收集、记录关键信息并在故障群等渠道跟相关团队沟通。快恢负责人根据故障现象、监控大盘决策并执行预案。问题诊断负责人定位故障根本原因当快恢不起作用的话该角色至关重要。 以下是各个角色的详细描述。 1 指挥员 指挥员的选择 第一接警人默认第一个收到告警、投诉反馈的技术人员作为指挥员。第一接警人判断是否能够指挥或者是否有自己熟悉且充分演练的预案可用如果可以则立即恢复服务否则联系专职指挥员接手。在专职指挥员接手之前第一接警人就是默认的指挥员。专职指挥员团队 Leader 和稳定性负责人是大多数风险的最佳指挥员当应急团队建立联系后指挥员可以交由 TL 或团队内的稳定性负责人。各级TL当故障时长和等级持续上升后根据实际情况会上升由更高层级 TL 接掌指挥员角色以协调更多资源加入。 指挥员关键动作 确认问题确定该次突发事件的现象、影响。确定角色确定参与该次事件处理的关键角色包括通讯员、快恢负责人、问题诊断负责人。向上沟通让组织中关键角色知晓该问题这样在需要时候可以更快的调动更多人员和资源参与进来。协调协助快恢负责人和问题诊断负责人解决问题在信息、领域专家等资源上给予支援。 对指挥员的要求 启动确定人员并通过视频会议、故障群等方式建立起应急小组。前期紧盯快恢负责人进展优先落地快恢而不是分析根本原因。当快恢不生效后也要继续探索可能的快恢手段例如回滚近期的变更等操作。过往的故障时长没有满足1-5-10的案例中大多数情况下都是指挥员在分析问题根本原因错失了快恢的最佳时机。中期尝试大量手段都无法恢复服务的话重心逐渐转移到问题诊断负责人这里找到根本原因。通常进入到这个阶段故障还没恢复的话就是大故障了1-5-10基本上是无法达标的。后期组织团队继续观察确认不会问题再复现。组织善后和复盘等工作。 2 通讯员 如果故障不能在第一时间通过预案恢复的话通讯员将会是仅次于指挥员的角色。高效组织信息收集、整理会让整个应急小组更快速度找到解方案。 通讯员选择 专职通讯员在团队内有一定稳定性认知然后通常又不是快恢负责人和问题诊断负责人第一人选的那个同学。其他不参与问题诊断和快恢的团队成员。 通讯员关键动作 持续确认问题和通报随着时间推移问题的现象、影响面也在动态变化需要定期通报故障群、电话会议等渠道前期要做到5分钟换一次通报随着时间推移后期可以改成15分钟、30分钟等间隔。信息收集按照标准模版为该问题建立一个统一的文档把文档链接放到群公告、故障群中。并持续将收集的关键信息更新进去。方便后续加入到应急小组的同学快速了解上下文。收集舆情这一点跟信息收集有重叠之所以特别强调出来是因为该环节通常容易被忽略技术同学容易陷入在技术指标中对于舆情缺乏关注。对外发声联系客服负责人与客服团队合作安抚客户。 对通讯员关键要求 前期要快快速收集关键信息黄金10分钟内要做到每分钟有信息更新并持续通报。通报及时好的信息通报是告知下次通报时间例如xx问题yy正在处理中目前情况是zzzxx分钟后将进行下一次通报。如果有可靠和及时的通报关注该问题的人只需持续留意信息通报即可避免非专业的插手影响应急小组快速反应。联系外部支援涉及到外部依赖方的时候例如OSS、MySQL等通过指挥员、应用Owner等渠道知晓外部接口人的时候及时组织外部接口人加入到应急小组中来并向对方通报问题上下文。 3 快恢负责人 我们的期望是所有的风险都能够通过快恢来解决如果不能的话也是第一时间探讨其他可行的快恢方案比如回滚等操作。 快恢负责人选择 应用Owner/核心骨干。执行过该应用预案的团队成员我们鼓励团队之间交叉执行预案当应用Owner联系不上的时候其他同学也可以通过预案来协助问题恢复。 快恢负责人关键动作 执行快恢预案根据问题现象找到预案大盘根据大盘上监控指标指引去执行相应的预案。制定其他候选恢复方案当已知快恢预案不生效时候分析可能的变更等因素通过回滚等方法尝试恢复。必要时候让指挥员协调更多人进来支持。 快恢负责人关键要求 以恢复服务为第一优先级问题根因分析请交给问题诊断负责人。既定预案不能快恢也要继续探索其他可能的恢复手段。 4 问题诊断负责人 通常我们不希望这个人出现在故障1-5-10的恢复环节但是当快恢失效并且短时间内缺乏有效手段恢复服务的话最后只能靠问题诊断负责人来找到根本原因并制定解决方案。 问题诊断负责人选择 应用Owner/骨干了解相关代码的人最适合去做问题诊断。领域专家比如网络问题可以从集团找到该领域专家协助参与进来。 问题诊断人关键要求 根据收集的信息找到问题根本原因。向指挥员、通讯员提出要求把外部支援邀请加入到应急小组中。 四 最后 故障应急响应是维持系统高可用的最后一个机会这个环节的不专业表现对于稳定来说是最后彻底的失守。因此跟预案演练一样故障应急也需要重点锻炼。一些可以锻炼的机会包括 真实的故障场景。红蓝对抗演习与SRE联动通过突袭方式模拟一次故障。常规报警升级TL或者稳定性负责人随机抽取一个短信告警人为将其升级为故障进入故障应急响应流程。 原文链接 本文为阿里云原创内容未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/927849.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎么创造自己的网站手机wap网站大全

前言 在现代的移动应用程序中,长连接是一种不可或缺的能力,包括但不限于推送、实时通信、信令控制等常见场景。在猫耳FM的直播业务中,我们同样使用了 WebSocket 长连接作为我们实时通信的基础。 在我们推进用户体验优化的工作中,…

传统企业如果建立网站福建省网站备案

介绍 方法的多态 多态是在继承,重载,重写的基础上实现的 我们可以看看这个代码 package b;public class main_ {public static void main(String[] args) { // graduate granew graduate(); // gra.cry();//这个时候,子类的cry方法就重写…

建设网站平台的用语wordpress网站静态页面生成

目录 登录AP产品 Console登录(只可以现场登录) Web/Telnet/SSH登录(可以现场、远程登录) 配置AP的管理地址 通过Web界面远程登录 通过Telnet、SSH等命令行的方式登录 登录AC产品 Console登录(只可以现场登录&a…

Python 在科学计算与工程模拟中的应用

一、引言 🔬 科学计算与工程模拟是现代科研和工程设计中不可或缺的环节。从流体力学到材料科学,从结构分析到天体物理学,科学家和工程师依赖计算机进行建模、仿真与分析。在众多编程语言中,Python 以其简洁的语法…

Python 在大数据与分布式计算中的应用

一、引言 📊 随着互联网、物联网和移动应用的普及,全球数据量呈指数级增长。据统计,每天产生的数据量已达数十亿 GB。如何高效存储、处理和分析这些海量数据,成为企业和科研机构的核心挑战。大数据与分布式计算技…

地图网站制作百度淘宝网

本文实例为大家分享了C实现贪吃蛇游戏的具体代码,供大家参考,具体内容如下刚学完了C语言,便尝试的写了贪吃蛇的代码,但是效果不佳,很多的bug,所以,这个学了C,便重新的写了这个小游戏…

Python 在教育与科研中的应用与价值

一、引言 🎓 随着信息技术的发展,教育与科研的方式正在发生深刻变化。传统的教育模式和科研方法逐渐与数字化、智能化结合,呈现出新的发展趋势。在这一过程中,Python 作为一种简洁、功能强大、生态丰富的编程语言…

深圳网站建设一尘互联苏州建设交通官方网站

一、第一题:壁画 解题思路:前缀和贪心枚举 仔细思考可以发现B值最大的情况是一段连续的长度为n/2上取整的序列的累加和 【Python程序代码】 import math T int(input()) for _ in range(1,1T):n int(input())s input()l math.ceil(len(s)/…

Python 在自动化测试与质量保障中的应用

一、引言 🧪 随着软件系统的规模日益庞大、复杂度不断提升,人工测试已经无法满足快速迭代和持续交付的需求。自动化测试成为保障软件质量、提高交付效率的关键手段。在自动化测试领域,Python 以其简洁的语法、丰富…

电子网站游戏网址试玩郴州新网最新招聘信息

题目描述 小易去附近的商店买苹果,奸诈的商贩使用了捆绑交易,只提供6个每袋和8个每袋的包装(包装不可拆分)。 可是小易现在只想购买恰好n个苹果,小易想购买尽量少的袋数方便携带。如果不能购买恰好n个苹果,小易将不会购买。输入描…

商城网站开发价整站优化推广品牌

简介: 本文由好未来资深数据平台工程师毛祥溢分享,主要介绍批流融合在教育行业的实践。内容包括两部分,第一部分是好未来在做实时平台中的几点思考,第二部分主要分享教育行业中特有数据分析场景。 1.背景介绍 好未来介绍 好未来是…

wordpress更改中文版后还是英文徐州百度seo排名

🚀个人主页:为梦而生~ 关注我一起学习吧! 💡专栏:机器学习 欢迎订阅!相对完整的机器学习基础教学! ⭐特别提醒:针对机器学习,特别开始专栏:机器学习python实战…

网站建设xml下载域名网站注册认证

中断 打断CPU执行正常的程序,转而处理紧急程序,然后返回原暂停的程序继续运行,就叫中断。 在确定时间内对相应事件作出响应,如:温度监控(定时器中断)。故障处理,检测到故障&#x…

如何建立自已的购物网站深圳网站开发团队

在云计算时代大环境的影响,各大企业也都企图将云计算融入企业业务中,智能化不只可以提高企业产能、提高服务效率,更能发掘更高的品牌价值。云计算不断深入企业内部,尤其在劳动密集型的产业中,优势更加明显。以电销为例…

1万网站建设费入什么科目个人网站html源码

目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性:…

域名注册好了如何做网站it公司排名

Java中常用的类,包,接口包名说明java.lang该包提供了Java编程的基础类,例如 Object、Math、String、StringBuffer、System、Thread等,不使用该包就很难编写Java代码了。java.util该包提供了包含集合框架、遗留的集合类、事件模型、…

城市绿化建设英文网站深圳航空公司官方网站

文章作者:代工 来源网站:NX CAM二次开发专栏 简介: UG\NX CAM二次开发 查询工序所在的几何组TAG UF_OPER_ask_geom_group 效果: 代码: void MyClass::do_it() { int count=0;tag_t * objects;UF_UI_ONT_ask_selected_nodes(&count, &objects);for (in…

php在网站开发中的应用高端网站建设熊掌号

图像是获取信息以及探知世界的重要媒介。近年来,传感科技与成像技术实现了跨越式发展,促使图像获取在质与量上均获得了显著提升。在多样化成像手段中,光谱成像技术是成像科技的重要组成部分,是人类借助光这一能量手段探测物质特性…

网站建设及维护费算业务宣传费企业融资方式有哪几种

回顾小夕在文章《逻辑回归》中详细讲解了逻辑回归模型,又在《Sigmoid与Softmax》中详细讲解了Sigmoid的实际意义(代表二类分类问题中,其中一个类别的后验概率)。至此,我们已经比较透彻的理解了逻辑回归模型假设函数(也…

wordpress.org 插件廊坊seo技巧

写简历的基本目的和策略 大部分情况下,写简历是找工作的第一步,考虑到第二步就是面试,那么简历就是敲门砖,为了让企业认识到你的价值,必须把自己的真实水平描述出来,展现出你有能力应对这份工作。甚至要体现…