设计原则

做好技术选型 面对众多的技术/工具选型,组织应参考长期技术演进路线、社区活跃程度、技术成熟度、安全性等几个主要方面进行判断和选型。例如在针对自动化工具和技术方案选型的过程中,可以从配置管理、不可变基础设施、过程性/声明性语言...

商米:DevOps转型实现精益开发与自动化运维

潜能发挥不出来 组长分配任务,技术演进容易推动 研发过程难以保证:研发过程中没有监管,验收阶段常常出问题 相同专业成员坐在一块技术交流方便 组长被高度依赖:组长要参与评审、分配任务、解决难题、审核代码、推动演进技术、成为最大...

石家庄掌讯:借助云效+SAE实现快速部署持续交付

先后承担多次技术攻坚及推动技术演进:前端混合开发技术落地,产品后端微服务化改造、服务自动化构建及容器化部署、云效CI/CD落地等。重要 本文内容非阿里云官方提供,如您发现本文档存在侵权内容或其他问题,请提供相应证明材料并在本页面...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

请 提工单 联系网络技术支持协助排查DNS服务器或NameServer故障原因。如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

查看ECS实例的操作记录

如果您在使用ECS实例的过程中遇到故障,可以通过查看ECS实例的操作记录识别可能的故障原因。背景信息 操作记录 以ECS实例为入口,对实例及其关联资源的所有操作进行操作审计,并且对操作记录的影响等级进行标注,在众多操作记录中高亮出...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

背景信息以及准备工作

DLA可以在不移动OSS日志文件的情况下读取并分析日志文件数据,定位服务故障原因等。对于一个服务而言,日志文件记录了服务运行的所有详细信息。在进行故障排除、状态监控或者预测告警时,都需要对日志文件进行查询分析。阿里云对象存储服务...

网站流量异常导致网站无法访问

解决方案 针对上述原因,您需要具体分析网站的访问情况,例如,了解网站访问量的变化趋势或分析网站运行中遇到的具体故障原因。本方案以建在Windows操作系统主机上的网站为例,主要介绍使用WebLog Expert Lite工具分析网站日志的方法。下载...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

操作系统迁移

操作系统因生命周期、第三方支持、开源计划演进原因将会停止技术支持,例如CentOS官方将停止维护CentOS 7/CentOS 8等Linux项目,Windows官方将停止维护Windows Server 2008/2012等Windows项目,这些进入到停止维护周期(EOL)的操作系统...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

专线连接类

排查物理专线故障原因,具体操作,请参见 故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备上测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向...

集群管理FAQ

journalctl-u kubelet 集群常见问题 下表罗列了一部分ACK集群常见的故障原因以及处理方法。故障场景 处理方法 API Server组件停止或Master组件停止:不能创建、停止、更新Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常...

如何查看云AP的MAC

概述 本文介绍如何查看云AP的MAC以及用途。详细信息 查看云AP MAC可通过两个途径 在云AP设备的背面标有MAC序列号。在云AP管理平台上查看AP状态信息时,会显示MAC。...云AP故障技术支撑时,MAC作为必须提供的设备信息之一。适用于 云AP

设计方案

在软件系统架构演进中不变的是系统的基本属性,包含存储、计算和网络,变的是存储、计算和网络的实现方式和规模,往大规模、高性能、高可靠、易扩展等方向迭代演进,所以对架构稳定性提出了更高的要求。系统可预见的稳定性风险包含软硬件...

中和农信:从传统研发走向云原生DevOps

先后承担多次技术攻坚及推动技术演进:私有部署CICD落地到升级云原生效能平台云效研发平台使用、单体服务器高可用使用到Kubernetes集群部署、微服务网格化改造,自研自动化运维平台等。重要 本文内容非阿里云官方提供,如您发现本文档存在...

概述

PolarDB 的无感秒切技术故障探测、切换速度和切换体验三个方面对切换场景进行了优化,包括计划内的切换,如集群升降配和小版本升级,以及计划外的容灾切换。整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk...

服务条款

阿里云为您提供7×24售后故障服务,提供有效的联系方式并保证能够联系到故障联系人,故障联系人在明确故障后及时进行反馈;3.2.2.2.阿里云提供7×24小时的在线工单服务系统,解答您在服务使用中的问题。3.2.3 阿里云仅负责服务网格的相关...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

东软案例

产品数字化导致应用结构愈加复杂,监控数据类型更加多样:技术方面,诸如混合云、数据分析、物联网、车联网、体域网等新技术的持续演进也使得应用结构愈加复杂,保障应用性能更加困难。据统计,超过一半(52%)的企业IT运维部门在监控管理...

归档存储服务等级协议

故障恢复能力 阿里云为付费用户的云服务提供7×24小时的运行维护,并以在线工单和电话报障等方式提供技术支持,具备完善的故障监控、自动告警、快速定位、快速恢复等一系列故障应急响应机制。2.11.网络接入性能 阿里云归档存储对用户不限制...

用云成本需求分析

这不光是对于云厂商通过自身技术迭代增加算力减少成本的要求,同时也是对企业自身IT系统技术演进的要求。成本优化的目标,也可以是在保持存量业务不变的情况下,减少10%的云资源使用。这些成本管理和优化的目标需求需要被识别,并在计划...

RPC

服务网格(Service Mesh)是蚂蚁集团下一代架构的核心,在蚂蚁集团当前的体量下,将现有的 SOA 体系快速演进至 Service Mesh 架构,犹如给奔跑的火车换轮子。本文以 RPC 层面的设计和改造方案为中心,分享蚂蚁集团在双十一大促面临大流量...

SOFAMesh 服务网格总体经济影响报告

对于积累了大量技术资产的传统企业甚至是互联网企业而言,云原生平台的构建都是一个混合演进的发展过程。在应用架构、基础架构和部署架构等不同维度,异构环境均将以常态化的混合形态长期存在,而仅仅采用容器、Kubernetes(K8s)与微服务...

业产技融合分层协作方案

随着企业产品线的演进和业务线的不断发展,很多企业都会形成独立的业务部门、产品管理部门、技术研发部门,由不同的主管分别管理。这三个部门的部分人员可能会形成虚拟团队进行项目协作,完成产品研发和业务交付。业产技分层协作方案就是...

Tair选型指南

选择容灾方案 图 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

关键技术竞争力

生产运维智能化:技术风险体系保障业务连续性 TRaaS(Tech Riskdefend as a Service)技术风险防控平台,以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,解决用户上云和分布式改造过程中所面临的可观测、故障应急、容灾、混沌工程、...

资源使用优化

云资源利用率不佳往往由于用云经验和技术债务等原因,比如传统企业数字化程度不高且经验不足,在面对云原生架构的引入时,缺乏有效的成本洞察和成本控制的手段;也或者由于云原生技术的一些不当使用而带来的技术债务,造成了成本增加。再者...

什么是多活容灾

多活容灾MSHA(Multi-Site High Availability)是在阿里巴巴电商业务环境演进出来的多活容灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供容灾架构建设能力。横向支持容灾架构的上线、运维、演练、切流,升级到下线。纵向支持...

云数据库Redis版产品选型必读

选择容灾方案 图 3.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用