监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

故障管理

由此生成一个故障等级定义的模板可以如下所示(实际使用中可适当精简,避免过于冗余故障等级定义制定好以后,需要得到技术负责人的审批,以及后续面向技术团队和上下游团队的公示。必要时需要进行宣讲。在运维事件中心可以录入对应的故障...

网络架构容灾

负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定性。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web服务器项目,在Nginx...

产品高可用

CLB系统的高可用 负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定性。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web...

图文生图

本服务⽣成的所有内容均由AI模型⾃动⽣成,我们在训练过程中已通过将训练数据持续过滤来提升 内容理解和⽣成的准确性,但仍不排除其中有部分信息存在⼀定的敏感性、不合理或导致理解歧义的 问题存在,可能会引发您的不适。您可以通过钉钉群...

使用API终止和恢复VBR来确认冗余物理专线

本文介绍本地IDC(Internet Data Center)通过冗余专线接入阿里云后,您如何使用白屏化的OpenAPI工具调用API来完成专线故障演练。背景信息 当本地IDC通过冗余物理专线正常接入阿里云后,您需要通过单条专线故障演练来确认冗余物理专线。您...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

云盒计算资源配置最佳实践

背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...

本地盘最佳实践

方式二:搭建冗余架构 搭建多节点冗余数据架构,降低本盘故障带来的影响。您可以购买云盘,并将本盘数据实时拷贝到云盘;或者,在其他可用区或地域购买ECS实例并部署应用作为灾备。使用部署集提高可用性 为保证数据的可用性,建议您在应用...

转换Bucket的存储冗余类型

随着您的业务对数据持久性和服务可用性要求的提高,采用单可用区的数据冗余存储机制的本地冗余存储已不再满足您的业务要求,您可以将Bucket的存储冗余类型从本地冗余存储转换为同城冗余存储,从而具备抵抗可用区级故障的能力。本文介绍如何...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

配置健康检查

在云企业网和本地数据中心存在冗余路由的场景下,健康检查探测到物理专线故障后支持自动切换到可用路由,保障流量传输不中断。背景信息 工作原理 在您为VBR实例配置健康检查后,阿里云默认每隔2秒从每个健康检查源IP地址向本地数据中心的...

本地IDC通过负载冗余专线连接上云

您可以使用两条物理专线通过负载冗余方式将本地数据中心IDC接入阿里云,从而提高网络的可靠性,并确保物理专线连接的高可用性。正常情况下,两条物理专线会同时转发流量。当阿里云检测到其中一条物理专线的网络连接不通时,该物理专线上的...

本地IDC通过主备冗余专线连接上云

健康检查探测到物理专线连接故障时,如果云企业网实例中存在冗余的路由,健康检查则会立刻触发路由切换使用可用链路。若您取消选中 是,则表示不开启健康检查的路由切换功能,健康检查仅执行链路探测功能。若健康检查探测到物理专线连接...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,会向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

InnoDB Physiological Logging

对于 INSERT、UPDATE 和 DELETE 等操作可以保证记录到页面级别,在故障恢复时,不需要重新执行Btree遍历找到页面就可以并行回放日志,从而加快故障恢复。PolarDB 针对当前InnoDB日志一些冗余的地方也做了改进。例如,增加了record长度信息...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

存储空间概述

✓×转换存储冗余类型 OSS支持将存储空间(Bucket)的存储冗余类型从本地冗余存储转换为同城冗余存储,从而具备抵抗可用区级别故障的能力。✓×OSS高防 OSS高防是OSS结合DDoS高防推出的DDoS攻击代理防护服务。当受保护的Bucket遭受大流量...

服务发布策略

蓝绿部署 蓝绿部署需要对服务的新版本进行冗余部署,一般新版本的实例规格和数量与旧版本保持一致,相当于该服务有两套完全相同的部署环境,只不过此时只有旧版本在对外提供服务,新版本作为热备。当服务进行版本升级时,只需将流量全部...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...

多活架构介绍

容灾架构对比 同城多活 异地双活 异地应用双活 拓展成本 开通新可用区 应用冗余部署 云产品、中间件升级到跨可用区主备、集群版本(例如RDS、Redis等)开通新地域 应用、中间件、数据库冗余部署 中间件、数据库数据双向同步 开通新地域 ...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

一键美化

排除类型 选中被排除的组件类型,该类组件无法配置二级标题样式,可选择排除 地图 和 数字翻牌器 两类组件;不选中组件,数据看板内所有组件统一配置二级标题样式。说明 除 地图 和 数字翻牌器 组件类别以外的组件都必须统一选择是否开启二...

一键美化

排除类型 选中被排除的组件类型,该类组件无法配置二级标题样式,可选择排除 地图 和 数字翻牌器 两类组件;不选中组件,可视化应用内所有组件统一配置二级标题样式。说明 除 地图 和 数字翻牌器 组件类别以外的组件都必须统一选择是否开启...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

存储冗余

日志服务 提供本地冗余存储和同城冗余存储两种存储冗余类型,覆盖从单可用区到多可用区的数据冗余机制,以保证数据的持久性和可用性。本地冗余存储(LRS)采用单可用区(AZ)内的数据冗余存储机制,将用户的数据冗余存储在同一个可用区内多...

同城冗余

为了实现实例数据的机房级容灾,表格存储 提供了同城冗余功能。通过创建使用同城冗余的实例存储数据,即使当由于断网、断电或者灾难事件导致某个机房不可用时,表格存储 仍能继续提供强一致性的服务。同城冗余功能确保了数据的高可用性和容...

产品优势

同时,OSS基于高可用架构设计,消除单点故障,确保数据业务的持续性。服务可用性最高可达99.995%。数据设计持久性最高可达99.9999999999%(12个9)。规模自动扩展,不影响对外服务。OSS会通过计算网络流量包的校验和,验证数据包在客户端和...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

数据安全

整个故障应急过程中,可以做到用户无感知、业务不中断、数据不丢失,满足关键业务系统对于恢复时间目标(RTO)以及恢复点目标(RPO)等于0的强需求。数据备份与恢复 表格存储支持通过云备份服务进行备份与恢复。数据备份可用于容灾备份、误...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...
共有163条 < 1 2 3 4 ... 163 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能视觉 智能视觉生产 视觉智能开放平台 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用