AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

功能更新记录

本文介绍故障演练Chaos历次发布涉及的功能变更,帮助您了解故障演练的发布动态。2021年10月 功能名称 功能概述 支持资源包类型 支持地域 发布时间 微服务强弱依赖支持Dubbo 在应用强弱依赖治理的基础上,微服务强弱依赖治理功能,通过接入...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

使用限制

请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动识别辅助弹性网卡的IP地址并添加路由,导致无法正常使用辅助弹性网卡。若ECS实例配置了...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

使用API终止和恢复VBR来确认冗余物理专线

当一条物理专线发生故障后,健康检查辅助系统自动切换业务流量到另外一条正常的物理专线上,从而保障您的业务高可用。自动切换的时间周期受您的VPC路由条目数量的影响。通常情况下,您的业务可以在12秒内完成自动切换。下表列出本地IDC通过...

CloudIDE 说明

保存合约工程到 BaaS 合约工程管理。基本框架 IDE 是一个典型的去中心化应用(Dapp),可通过 JavaScript SDK 直接与区块链平台通信,进行合约部署和调用。这样设计的优势在于,通过 IDE 您可以连接任何目标的蚂蚁区块链平台环境。

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

产品简介 开源ChaosBlade与商业化AHAS CHAOS故障演练的特点如下:开源ChaosBlade具备使用简单、场景丰富、演练模型标准化等一系列特点,可以帮助企业快速实施混沌工程。商业化AHAS CHAOS故障演练是阿里巴巴内部广泛使用的演练平台云上版本...

故障排查

本文介绍阿里云容器服务ACK集群在使用过程中常见问题的故障分析和排查流程。ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

常见问题旧版索引

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?产品FAQ 授权管理FAQ 集群管理FAQ 节点与节点池FAQ 容器网络FAQ Service FAQ Ingress FAQ DNS FAQ 应用FAQ 存储FAQ-CSI 存储FAQ-Flexvolume 容器安全FAQ 为什么可观测监控 ...

ping不通云服务ECS(SAG-1000)

本文介绍SAG-1000设备无法ping通ECS实例的原因和处理方法。问题现象 终端无法连接到阿里云,例如ping不通同CEN的ECS。可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入...

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标PC环境的网络故障。...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

什么是应用高可用服务AHAS

故障演练 故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景实现,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

关键技术竞争力

基于混沌工程的红蓝攻防能力 TRaaS 基于混沌工程、建立演练机制,提供故障注入、演练编排体系能力,支持在不同环境、不同阶段,主动对业务系统进行故障注入,从而在主动观测单应用健壮性的同时,验证整个体系的故障发现能力、应急响应能力...

安装 mPaaS 插件

mPaaS 插件提供多种开发辅助功能,包括:新建 mPaaS 工程,添加、删除和升级 mPaaS 组件,构建工程等。为方便您使用以上功能,本文将向您介绍 mPaaS 插件的安装过程。mPaaS 插件的安装有 在线安装 和 离线安装 两种安装方式。如果您的 ...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...

产品体系

高阶运维 TRaaS 技术风险防控平台,是以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,形成的解决用户上云和分布式改造过程中,可观测、故障应急、容灾、混沌工程、资金安全、压测等运维问题的平台产品。研发效能 源于蚂蚁集团在...

概述

TRaaS 技术风险防控平台,是以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,形成的解决用户上云和分布式改造过程中,可观测、故障应急、容灾、混沌工程、资金安全、压测等运维问题的平台产品。高可用管理平台 高可用管理平台(High ...

OPPO辅助通道集成

本章节介绍如何集成移动推送提供的OPPO辅助通道SDK。获取OPPO推送密钥 登录 OPPO开放平台,在推送服务中注册您的应用,在配置管理>应用配置中获取AppKey、AppSecret和MasterSecret。控制台配置密钥 登录移动推送控制台,设置您的OPPO推送...

魅族辅助通道集成

本章节介绍如何集成移动推送提供的魅族辅助通道SDK。获取魅族推送密钥 登录 魅族开放平台,在魅族消息推送服务中注册您的应用,在应用信息中获取AppID和AppSecret。设置消息回执 在魅族推送平台的应用列表,单击打开应用,进入 配置管理>...

华为辅助通道集成

本章节介绍如何集成移动推送提供的华为辅助通道SDK。获取华为推送密钥 登录 华为开发者联盟,注册您的应用,在应用信息中获取APP ID和SecretKey。说明 您可以在 我的应用 中查看应用APP ID和SecretKey。如果在上图中未找到SecretKey,您也...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

Google推送通道集成

辅助通道常见问题 Android端辅助通道和弹窗问题的排查步骤 Android端辅助通道SDK与其他厂商SDK冲突 Android端阿里云移动推送与其他注册厂商如何同时获取regId Android端辅助通道收到推送通知后单击通知无法打开相应Activity Android端辅助...

ConnectionDisconnect

告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理方法 检查用户侧运营商网络接入是否正常。icmsDocProps={'productMethod':'...

指标趋势图

分析预警 辅助线 通过辅助线可以查看当前度量值与辅助线设定值之间的差异。辅助线设定值分为固定值和计算值两种。计算值包含平均值、最大值、最小值和中位数四类。具体设置请参见 辅助线。智能洞察 波动分析 波动原因分析通过机器智能算法...

小米辅助通道集成

本章节介绍如何集成移动推送提供的小米辅助通道SDK。开启小米推送服务 登录 小米开放平台->推送运营平台,创建您的App,并开启应用的推送服务。说明 小米推送目前分为国内SDK和国际版SDK,在创建应用时需要根据自己应用的分发地在 推送运营...

容灾演练断网方式说明

如果ECS绑定了多块辅助网卡,每一块辅助网卡对应的安全组策略同样会进行故障注入,故障实验恢复时,系统会还原ECS绑定的原始安全组策略及辅助网卡对应的原始安全组。可用区断网在交换机级别进行模拟,而安全组断网在实例级别进行模拟。针对...

命令列表

命令列表如下:分类 命令 功能 工程管理命令 mpaas project create 创建 Xcode 工程 mpaas project target 获取 Xcode 工程的 targets 信息 mpaas project import 向工程导入云端配置数据 mpaas project edit 增删 mPaaS 模块依赖 mpaas ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
DataV数据可视化 数据库自治服务 负载均衡 云解析DNS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用