主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

运维服务内容说明

因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

故障排查

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

ping不通云服务ECS(SAG-1000)

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转...

管理缓存

通过将数据写回到UFS,可以保证如果Alluxio发生故障数据还是可恢复的。语法 alluxio fs persist示例:将Alluxio中 tmp 目录持久化到底层文件系统中。alluxio fs persist/tmp 返回如下信息。persisted file/tmp with size 46 setTtl 设置...

事件列表

事件信息 说明 Created container 创建容器 Successfully pulled image 拉取镜像成功 Pulling image 正在拉取镜像 Started container 启动容器 事件原因 事件原因是从事件具体信息中抽象出来的,方便您快速获取该事件的概要。具体说明如下...

查询和分析时序数据

错误语法 如果出现错误信息,表示校验不通过,仅生成部分语法解析树且提示错误位置与原因。在校验过程中,您还可以执行如下操作。单击 图标,刷新语法解析树。单击 图标,简化展示语法解析树中的节点信息。单击 图标、图标,展开或收起节点...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

Quick BI创建SQL数据集执行单表查询也提示语法错误

问题描述 Quick BI创建SQL数据集执行单表查询也提示语法错误,情况如下图:问题原因 表名称含有特殊符号。解决方案 MySQL数据源表名称含有特殊符号的时候需要使用反引号进行引用即可正常查询。select*from `wikibit-search-06`;适用于 ...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

获取RDS MySQL数据语法错误

其次,当写入数据库的SQL语法错误事,也会引发 fetch data error 错误,此时请根据错误原因分析。解决方案 更新SQL语句。资源函数中的SQL语法只支持SELECT查询语句。持续刷新错误 加工规则 e_table_map(res_rds_mysql(address="xxx",...

为何Pod中仍存在已恢复故障的“僵尸进程”?

在K8s环境中,下发的故障已经被恢复了,但是Pod中仍存在该故障的“僵尸进程”。本文介绍该情况可能的原因以及解决方案。可能原因 这是因为容器中存在PID Namespace隔离。在容器中,故障演练进程的父进程是PID=1的进程,容器中的一号进程不...

0030-00000005

问题原因 用户在PutBucketPolicy时,上传的Policy不符合标准的阿里云Policy语法,就会报错。问题示例 比如您发起了如下请求:PUT/?policy Content-Length:230 Host:oss-example.oss-cn-hangzhou.aliyuncs.com Date: Thu,21 Feb 2019 12:51:...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

设备无法上电

可能原因 未打开设备电源开关。设备电源线缆没有插牢。设备的外接电源有故障。设备的电源适配器有故障。解决方案 确认设备电源开关是否打开。确认设备电源线缆是否插牢。确认外接电源是否有故障。更换其它可以正常供电的外接电源,如果设备...

PREPARE TRANSACTION

本文介绍了PREPARE TRANSACTION的语法、参数以及示例等内容。简介 PREPARE TRANSACTION 为两阶段提交准备当前事务。在这个命令之后,该事务不再与当前会话关联。相反,它的状态被完全存储在磁盘上,并且有很高的可能性它会被提交成功(即便...

数据变更

检查影响行数失败,语法检查失败 报错示例:检查影响行数失败,语法检查失败,错误信息:ERROR.pos 37,line 1,column 31,token WHERE 报错原因:提交工单进行数据变更的预检查阶段,DMS会通过检查扫描行数再次检查SQL语句的语法是否有误...

组合类型

本文介绍了组合类型的定义及相关语法。一个 组合类型 表示一行或一个记录的结构,它本质上就是一个域名和它们数据类型的列表。本数据库允许把组合类型用在很多能用简单类型的地方。例如,一个表的一列可以被声明为一种组合类型。组合类型的...

归档存储服务等级协议

阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)...

设置Pod故障处理策略

如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会自动进行重调度,尝试重新创建Pod。您可以通过添加 k8s.aliyun...

错误码

DTX-404 insert’s duplicateKeyUpdateClauses is not expression.insert on duplicate key update 语句语法有错误 检查 SQL 语句语法是符合标准 SQL 语法。DTX-405 the insert sql’s columns or valurClauses is null.insert 语句语法有...

DDL 问题

DDL 任务创建常见问题 SQL 格式错误 SQL 语法错误 DDL 任务执行常见问题 无法获取分库分表拓扑 找不到物理数据节点 SQL 执行失败 DDL 任务创建常见问题 SQL 格式错误 错误信息:sqlContent Format error.must end with;解决方法:每条 SQL ...

YAML辅助编辑器

云效 Flow 基于流水线 YAML 语法提供辅助编辑能力,提供常用流水线、常用任务 YAML 模板,提供内置 YAML 手册随手查阅,支持 YAML 语法自动补齐、实时校验并推荐修复方案,以及多种快捷键操作等,帮助提升 YAML 编写效率。提供常用流水线 ...

常见问题-FAQ

重要 标准版最快可在4分钟左右准确发现故障并切换 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;全网生效时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL...

使用Hint语法

本文介绍如何在RDS MySQL的读写分离场景下使用Hint语法。限制 Hint语法仅支持读写分离地址,不支持只读地址。更多信息,请参见 什么是读写分离。使用方法 使用MySQL命令行进行连接并使用Hint语句时,需要在命令中增加-c 选项,否则Hint会被...

FAQs

重要 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;DNS切换同步时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL缓存设置以及网络环境不同,所以全网生效时间...

HINT语法使用说明

本文介绍如何在读写模式为 可读可写(自动读写分离)的集群地址中使用HINT语法。使用限制 仅读写模式为 可读可写(自动读写分离)的集群地址支持HINT语法,只读 模式下的集群地址和主地址均不支持HINT语法。关于集群地址的读写模式信息,请...

故障恢复

PROBLEM_UPDATE 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 返回数据 名称 类型 ...

故障撤销恢复

NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 clientToken String Body 否 FD200FAE-E98F-496E-BFE6-...

以太网接口频繁Up/Down

本文介绍以太网接口频繁Up/Down的原因和处理方法。问题现象 以太网接口频繁Up/Down。可能原因 线缆没有连接好。双绞线过长、光纤超长或链路损耗太大。接口、接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备...

故障完结

故障完结。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/problem/...

故障复盘

故障复盘 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/problem/...

删除故障

删除故障。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/problem/...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云原生数据仓库AnalyticDB MySQL版 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用