功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕、物理等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

性能监控最佳实践

这些工具可以根据监控数据自动化地进行故障排除、性能优化等操作,提高系统的稳定性和性能。建设一体化性能监控平台需要根据监控需求选择合适的监控工具,进行配置和整合,实现数据可视化和自动化运维,以提高系统的稳定性和性能。从 0 到 ...

HTTPDNS的高可用性如何保证

HTTPDNS通过以下方式保证高可用:为客户端提供多组服务IP,个别...采用Anycast IP网络多地域部署,在单个地域节点出现故障的情况下,流量可无缝切换到其他地域节点。同地域多可用区独立部署,单机房的故障不会导致该地域节点的服务中断异常。

ECS系统事件概述

当宿主上的故障风险无法规避时,阿里云会通过计划内运维事件提前通知受影响的ECS用户,为用户赢得一定的业务切换的缓冲时间。如果用户未提前响应计划类运维事件,故障风险发生时会导致ECS实例出现宕或重启。是 说明 当发生计划内运维...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

应用场景

​ 高可靠:在宕、网络故障等情况下,严格保证数据一致性。节约成本:节省运维成本,避免了分布式场景下产生的数据异常。节省开发成本,像使用单机事务一样使用分布式事务。推荐搭配 ECS 和 MQ 使用。通用分布式事务管理 提供通用的分布...

产品优势

高可用 在应用宕、节点故障等各类异常情况均可保证数据严格一致。多数据库支持 支持 MySQL、RDS、DRDS、PostgreSQL、Oracle数据库。说明 除 MySQL 数据库外,GTS 目前仅支持部分数据库版本。DRDS 仅支持5.2.x版本,Oracle 仅支持19c版本...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

什么是云工作流(CloudFlow)

方便您快速识别故障位置,并快速排除故障问题。支持长时间运行流程 云工作流 可以跟踪整个流程,持续长时间执行确保流程执行完成。有些流程可能要执行几个小时、几天、甚至几个月。例如运维相关的Pipeline和邮件推广流程。流程状态管理 云...

什么是Serverless工作流

方便您快速识别故障位置,并快速排除故障问题。支持长时间运行流程 Serverless 工作流 可以跟踪整个流程,持续长时间执行确保流程执行完成。有些流程可能要执行几个小时、几天、甚至几个月。例如运维相关的Pipeline和邮件推广流程。流程...

Pod诊断

Pod申请的GPU资源 检查Pod是否申请GPU资源,排除因为未申请GPU资源导致的Pod无法使用GPU。该Pod中没有声明GPU资源,如有需要,请检查Pod配置是否规范。Pod调度状态 检查Pod是否正常调度。该Pod中没有声明GPU资源,如有需要,请检查Pod配置...

虚拟机场景

本文列出了虚拟常见的故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

冷备操作手册

一 支持声明 冷备支持机型 物业管理一体-停车版、物业管理一体-人行版、物业管理一体-视频版、物业管理一体-EBA版、物业管理一体-通行版、物业管理一体-综合版 冷备恢复内容 应用:官方组件、三方应用、协议驱动 数据:协议...

功能特性

监控专有宿主机 运维 故障迁移 如果一台DDH有潜在故障风险,其物理处于可用状态,但随时可能出现故障,导致DDH中的ECS实例出现问题。您可以自主迁移有潜在故障风险的DDH到其他物理,避免相关业务因DDH故障受到影响。迁移有潜在故障风险...

NVMe协议介绍

而计算节点则经常受断电、宕、硬件故障等影响,所以业务通常搭建主备模式解决计算的高可用问题。例如数据库场景,当主库故障时迅速切换到备库对外提供服务,实例切换后,可以通过NVMe PR命令释放旧实例的写入权限,从而确保旧实例不再...

概览

无论您的主机是云服务器ECS,还是其他云厂商的虚拟或物理,都可以使用云监控的主机监控功能。目前云监控仅支持为Linux和Windows操作系统的主机安装插件。应用场景 您可以使用主机监控功能查询主机的资源使用情况和故障指标。主机监控的...

本地盘

注意事项 本地盘来自单台物理,数据可靠性取决于物理的可靠性,存在单点故障风险。警告 使用本地盘存储数据有丢失数据的风险,例如ECS实例所在物理发生硬件故障时。请勿在本地盘上存储需要长期保存的业务数据。建议您在应用层做数据...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

质检规则配置

例如下图,命中正则表达式:买.*(ssd盘|普通盘),排除正则表达式:用不了|不能用|不生效,所以结合起来就是只匹配用户购买产品的场景,但是要排除故障报修的场景,示例语句:我想买一块ssd盘,应该怎么操作(可命中)/我前两天买了ssd盘...

访问控制常见问题

配置限制访问CDN资源的用户时,如果遇到疑问请参考以下常见问题及处理建议。...远程鉴权服务器发生故障或宕时,CDN与鉴权服务器之间的数据交互超时后,按照设置的 鉴权超时之后的动作 参数,选择是否放行鉴权超时的用户请求。

错误码

常见 PolarDB-X 数据节点连接失败的原因如下:后端数据节点连接数已满 计算节点到数据节点的连接超时 数据节点拒绝连接 如果排除后端数据节点问题后仍然出现该错误,请联系技术支持。PXC-4103 ERR_ATOM_CONNECTION_POOL_FULL 描述:PolarDB...

功能概览

通过简单、安全及可靠的方式将虚拟整机数据备份上云,确保客户本地机房出现故障、虚拟、生产系统数据发生误删、勒索病毒等事故时可以从云上的备份库将虚拟整机恢复到本地VMware环境、阿里云VMware服务或阿里云ECS,实现业务系统...

ModifyBackupPolicy-修改防勒索策略

500 ServerError ServerError 服务故障,请稍后重试!访问 错误中心 查看更多错误码。变更历史 变更时间 变更内容概要 操作 2023-03-23 OpenAPI 错误码发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:400 ...

配置DDoS高防后访问网站提示502错误

网络出现拥塞或抖动 在已经排除以上两种原因后,偶发的局部网络抖动、运营商线路故障等因素,也可能导致502错误。相关文档 常见问题概览 配置DDoS高防后访问网站提示504错误 适用于 DDoS高防 如果您的问题仍未解决,您可以在阿里云社区 ...

光伏发电异常检测提效

同时,无法有效排除环境因素的干扰,例如一天不同的时段发电量不同,也受天气影响巨大,按照该检测方法无法动态适应各个变化的情况,为运维工作增加了不确定性,并带来运维负担。解决方案 物联网平台的数据服务提供数据智能功能,可以基于...

三网合一卡2.0使用入门

排除检测周期的影响,一般切换一次网络需要几十秒到分钟级不等(主要和模组是否需要重启逻辑有关)。切网多少次能到可用网络?当三个运营商基站均覆盖时,插卡即用。当三个运营商基站均无法覆盖时,则三网均不可用。当该设备区域内可用基站...

Pod诊断

Pod申请的GPU资源 检查Pod是否申请GPU资源,排除因为未申请GPU资源导致的Pod无法使用GPU。该Pod中没有声明GPU资源,如有需要,请检查Pod配置是否规范。Pod调度状态 检查Pod是否正常调度。该Pod中没有声明GPU资源,如有需要,请检查Pod配置...

Pod诊断

Pod申请的GPU资源 检查Pod是否申请GPU资源,排除因为未申请GPU资源导致的Pod无法使用GPU。该Pod中没有声明GPU资源,如有需要,请检查Pod配置是否规范。Pod调度状态 检查Pod是否正常调度。该Pod中没有声明GPU资源,如有需要,请检查Pod配置...

在Windows实例无法访问外部网络如何处理?

运行Windows Update程序,安装最新版本的补丁 该操作可以排除操作系统TCP/IP协议栈自身问题,操作步骤如下:在桌面左下角,单击 图标,在搜索框输入 update,然后单击 检查更新。在 Windows更新 页面,单击 下载,安装最新版本的补丁。重新...

常见报错及解决方案

Q:谐云组件故障排查思路 A:elasticsearch《故障排查思路》mysql《故障排查思路》redis《故障排查思路》harbor《故障排查思路》通用排查《中间件通用故障排查思路》ingress《故障排查思路》rocketmq《故障排查思路》kafka《故障排查思路》...

ECI Pod Annotation

配置ECI Pod所属安全组 k8s.aliyun.com/eci-vswitch vsw-bp1xpiowfm5vo8o3c*指定交换ID,支持指定多个交换实现多可用区功能。多可用区创建Pod k8s.aliyun.com/eci-schedule-strategy VSwitchOrdered 多可用区调度策略。取值范围:...

ECI Pod Annotation

配置ECI Pod所属安全组 k8s.aliyun.com/eci-vswitch vsw-bp1xpiowfm5vo8o3c*指定交换ID,支持指定多个交换实现多可用区功能。多可用区创建Pod k8s.aliyun.com/eci-schedule-strategy VSwitchOrdered 多可用区调度策略。取值范围:...

API概览

本产品(专有网络/2016-...ModifyVSwitchCidrReservationAttribute 修改交换预留网段的名称和描述信息 CreateVSwitch 创建交换 创建一个交换。CreateDefaultVSwitch 创建默认交换 调用CreateDefaultVSwitch接口创建一个默认的交换。...

日志说明

local.client.ip 源 IP local.client.port 本地客户端端口 local.zone 本地 zone target.ip.in.one.physical 目标 IP 是否在当前物理:T:表示在同一物理。F:表示不在同一物理。sys.baggage 系统透传的 baggage 数据 bus.baggage ...

Logtail配置

如果LabelValue不为空,则容器Label中包含LabelKey=LabelValue的容器才会被排除。LabelValue默认为字符串匹配,即只有LabelValue和容器Label的值完全相同才会匹配。如果该值以^开头并且以$结尾,则为正则匹配。例如设置 LabelKey 为 io....

蓝牙Mesh设备扩展协议

Opcode Format 说明 0b0xxxxxxx(排除0b01111111)1字节Opcode。0b01111111 保留,用于将来扩展。0b10xxxxxx xxxxxxxx 2字节Opcode。0b11xxxxxx zzzzzzzz zzzzzzzz 3字节Opcode。操作码定义 智能生活平台蓝牙Mesh扩展消息Opcode定义如下表...

服务管控和治理

故障隔离能够定位到异常的服务实例,实现实例级别精细化的隔离和流,使故障影响的范围更小、更可控。更多信息,请参见 故障隔离。服务拓扑 实际业务中,应用之间的关联与依赖非常复杂,需要通过全局视角检查具体的局部异常。您可以在...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

网站被劫持问题概述

DNS解析一般都与DNS有关,如果有这类故障,请先排除本地绑定hosts的情况后,再收集出口DNS信息和被劫持的IP地址。如下所示,异常的DNS解析没有经过阿里云CNAME解析,即被劫持到2个IP地址。您可以通过使用阿里云的 HTTPDNS,防止被劫持。...
共有117条 < 1 2 3 4 ... 117 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 应用高可用服务 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用