自动SQL优化

说明 当慢SQL优化完成后,可能会出现全局性能变差的问题,为了提升 SQL自动优化 的准确率,建议开启 SQL洞察和审计。操作步骤 访问 RDS实例列表,在上方选择地域,然后单击目标实例ID。进入 自治功能管理 页面。在左侧导航栏中,选择 自治...

概述

当前状态是否兼容需要重启后判断 警告 如果基于该状态数据启动,可能会出现启动失败或者运行结果不符合预期的问题,请谨慎选择。状态迁移 RocksDB和Gemini的迁移效率和作业表现方面的区别详情如下:RocksDB RocksDB是在作业启动时,会对...

慢日志分析

常见问题 Q:为什么会出现慢日志记录的SQL执行完成时间与SQL语句的实际执行时间不同?A:通常情况下是执行SQL语句修改了时区。慢日志记录的SQL执行时间的时区,存在会话级别、数据库级别和系统级别。慢日志时间设置逻辑为:当数据库存在...

慢日志

常见问题 Q:为什么会出现慢日志记录的SQL执行完成时间与SQL语句的实际执行时间不同?A:通常情况下是执行SQL语句修改了时区。慢日志记录的SQL执行时间的时区,存在会话级别、数据库级别和系统级别。慢日志时间设置逻辑为:当数据库存在...

诊断报告

当数据库实例出现性能问题,或者进行日常巡检时,您可以通过数据库自治服务DAS的诊断报告功能,针对指定时间段的实例运行状况发起诊断,帮助您从慢日志、表空间、性能趋势等多方面评估实例的健康状况,快速定位实例的异常情况。前提条件 ...

慢日志

常见问题 Q:为什么会出现慢日志记录的SQL执行完成时间与SQL语句的实际执行时间不同?A:通常情况下是执行SQL语句修改了时区。慢日志记录的SQL执行时间的时区,存在会话级别、数据库级别和系统级别。慢日志时间设置逻辑为:当数据库存在...

慢SQL

常见问题 Q:为什么会出现慢日志记录的SQL执行完成时间与SQL语句的实际执行时间不同?A:通常情况下是执行SQL语句修改了时区。慢日志记录的SQL执行时间的时区,存在会话级别、数据库级别和系统级别。慢日志时间设置逻辑为:当数据库存在...

诊断规则

通过故障诊断平台,运维人员可以将诊断过程、排查顺序进行图形化编排与设计,即故障诊断决策树。而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现...

自动SQL优化

前提条件 实例为如下版本:RDS MySQL 8.0 高可用系列或集群系列 RDS MySQL 5.7 高可用系列或集群系列 RDS MySQL 5.6 高可用系列 RDS MySQL 5.5 高可用系列 说明 当慢SQL优化完成后,可能会出现全局性能变差的问题,为了提升 SQL自动优化 的...

自治服务概述

云数据库 OceanBase 的自治服务是一款面向开发、运维、DBA 的一站式智能诊断自治服务,为用户提供可视化监控、性能优化、故障诊断、安全管理、容量管理等能力,帮助用户更简单、更低成本、更高性能的使用 OceanBase 数据库。背景信息 传统...

会话管理

常见问题 Q:为什么会出现%的 访问来源?A:该情况可能在您使用存储过程时出现。按如下示例可以复现这种情况:说明 示例中数据库实例为RDS MySQL,测试账号为test_user,测试数据库为testdb。在RDS控制台创建普通权限账号及其授权的数据库...

功能特性

提供故障诊断和运维监控,便于现场解决问题。与云端交付平台联动 线上集成、验证、出包,一步到位。柔性版本管理、故障回流差异。中间件统一供应 提供足够丰富的中间件(包括数据库),帮助产品加速实现完全容器化。对接入的中间件进行可运...

客户端诊断介绍

您可以在客户端关键链路写入诊断日志,当出现线上问题时,在控制台针对用户下发诊断指令拉取诊断日志,从而排查问题。客户端诊断功能支持通过 数据同步简介 或者 消息推送 通道拉取诊断日志。原理框架 控制台根据不同的诊断通道(消息推送...

创建MySQL集群

主实例的数据同步到备实例,当主实例出现故障无法访问时,自动切换到备用实例。说明 高可用 支持本地盘存储和云盘存储。专属集群名称 专属集群的名称。专有网络 专属集群归属的专有网络VPC。如需创建新的专有网络,您可登录 VPC控制台...

ConnectionDisconnect

ConnectionDisconnect事件提示您智能接入网关的主备IPsec链路都出现故障。告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理...

基本概念

概念 描述 故障转移(Fail Over)即容灾恢复,指您的 IDC 应用出现故障时,在阿里云上恢复应用的过程。故障恢复(Fail Back)当您的 IDC 内的环境恢复以后,将应用数据迁回自有 IDC 恢复应用运行的过程。RPO Recovery Point Objective(数据...

修改实例维护属性

当宿主机存在故障风险和出现突发故障时,阿里云通过系统事件方式通知宿主机上的用户,您可以响应该系统事件。在您响应该系统事件时,ECS实例的默认行为是自动重启。如果您希望在这种情况下不自动重启ECS实例,可以通过修改维护属性来调整...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题,一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

产品原理

当主地址池集合中,有一个应用服务地址出现故障时,HeathCheck模块准确的检测到异常情况,同时HeathCheck模块和DNS模块进行交互,最终是通过DNS模块将异常地址从向用户返回的应用服务地址列表中暂时删除;如果HeathCheck模块检测到应用...

教育实训

并且整体设备运维缺乏高效易用的解决方案,运维效率低,出现故障恢复时间长,影响教学的进度。客户痛点 学习门槛高,线下准备环境浪费时间,复杂软件安装繁琐,远程指导人力消耗大 学习效果差,教与练脱节,互动性差,缺少老师临场指导 线...

概述

容错是指系统能够在部分组件出现故障或错误的情况下,依然能够继续正常运行,并提供正确的输出结果。这意味着系统具有自动检测、纠正和恢复错误的能力,以保证系统的可靠性和可用性。系统容错的目标是使系统能够在面对硬件故障、软件错误、...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

日志简介

在应用的运维过程中可能遇到各种问题,您可以通过日志定位、诊断。EDAS 提供各种类型的日志,您可以在线查看,也可以下载。日志类型 EDAS 提供以下 4 种日志:EDAS 系统日志(通用):您可以通过该日志定位、诊断 EDAS 系统问题。EDAS ...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

高可用性

在索引配置了副本的情况下,当某一可用区出现故障时,剩余的可用区依然可以不间断地提供服务,显著增强了集群的可用性。同时通过切流操作,隔离出现故障的可用区,并自动在剩余的可用区中补充计算资源,满足业务对资源的需求。当可用区故障...

FailoverDiskReplicaGroup-启用异步复制组故障切换

当一致性复制组中某些复制对的主盘出现故障时,可以调用该接口恢复从盘的读写权限。接口说明 一致性复制组功能支持的地域请参见 云盘异步复制概述。一致性复制组必须处于 单次同步中(manual_syncing)、同步中(syncing)、正常(normal)...

跟踪概览

故障诊断与运维 服务故障分析:在出现服务中断或性能下降时,可以使用跟踪日志来分析事件前后的操作,以帮助确定故障原因。配置变更追踪:记录对云资源配置的所有更改,帮助识别可能导致服务中断的配置错误。基本概念 概念 说明 跟踪 跟踪...

为RDS创建灾备实例

应用场景 创建RDS灾备实例可以为主实例提供数据备份和灾难恢复保障,当主实例出现故障或不可用时,灾备实例将自动接管数据服务,保证业务的连续性和可用性。风险等级 默认风险等级:中风险。当您使用该规则时,可以按照实际需求变更风险...

NLB支持的地域

各可用区之间可以实现故障隔离,即如果一个可用区出现故障,不会影响其他可用区的正常运行。每个地域完全独立,不同地域的可用区完全隔离,但同一个地域内的可用区之间使用低时延链路相连。为了向广大用户提供更加稳定可靠的负载均衡服务,...

采集客户端数据的高可用方案

当Logstore A出现故障时,您需要将数据采集及时切换到Logstore B上,使Logstore B的数据实时可用。当Logstore B故障时,Logstore A的数据仍然实时可用。操作步骤:在日志服务控制台上,创建Project和Logstore。创建A地域的Project A和...

产品架构

日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发故障诊断、应急预案等。运行总览集中展示整个平台的运行状态、风险情况。部署架构 HAS 部署时,需要依赖以下底层服务:数据库 ...

诊断实例的健康状态

实例健康诊断功能可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 如果问题场景为全面体检或者实例网络异常,请确保待检测实例满足以下条件:实例规格:属于...

异地应用双活切流

选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回...

什么是高可用管理平台

事前:通过应用巡检、故障诊断以及和监控平台的联动,实现应用运行风险的主动发现。事中:通过故障诊断、应急预案、容灾切换实现风险事件快速定位和恢复。事后:通过风险定级、回溯,实现风险事件的闭环管理。有效提升 IT 技术风险防御水平...

基本步骤

请参考具体章节查看详细信息:创建应用 runtime 与 agenthub 部署 启动应用 设置报警 观察监控指标 故障诊断 更新 runtime 版本

产品优势

自动化故障诊断和标准化应急预案快速定位并恢复故障,减少因故障引起的业务中断时间。故障演练主动检验应用高可用能力。支持蚂蚁产品双中心容灾切换,满足监管合规需求。技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、...

诊断实例的健康状态

实例健康诊断功能可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。本文介绍如何使用OpenAPI诊断实例的健康状态。前提条件 如果问题场景为全面体检或者实例网络异常,请...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库审计 数据库自治服务 Node.js 性能平台 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用