设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

常见问题

A:目前,基于备份(快照)进行恢复(克隆)的速度是40分钟/TB。如果是恢复到任意时间点,则需要包含应用Redo日志的时间,这部分的恢复速度大概是20~70秒/GB,整个恢复时间是这两部分之和。性能和容量 Q:表个数上限是多少?表个数到多少...

系统运维工具SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

创建节点池

勾选 故障时重启节点 后,节点NotReady时,系统会尝试自动重启相关组件来修复故障节点,并在重启前执行排水。自动升级规则 选中 托管节点池 后,可设置此配置项。勾选 自动升级 kubelet 后,系统会在有可用的kubelet版本时自动升级到该版本...

创建单节点实例

可能原因 解决方法 地域选择错误 在云数据库MongoDB控制台左上角,选择实例所在的资源组和地域。实例列表选择错误 在云数据库MongoDB控制台左侧导航栏,选择 副本实例列表。资源不足 新创建的实例可能因为资源不足而退款。在您确认退款后...

创建单节点实例

可能原因 解决方法 地域选择错误 在云数据库MongoDB控制台左上角,选择实例所在的资源组和地域。实例列表选择错误 在云数据库MongoDB控制台左侧导航栏,选择 副本实例列表。资源不足 新创建的实例可能因为资源不足而退款。在您确认退款后...

数据湖集群

E-MapReduce(简称EMR)新版控制台提供了数据湖集群,一个更灵活、可靠,以及高效的大数据计算集群。同时,您可以基于该集群轻松构建一个可扩展的数据管道。本文为您介绍数据湖集群支持的特性,以及与旧版Hadoop集群之间的差异。数据湖集群...

Quick Audience受众筛选无法圈数据

问题描述 Quick Audience受众筛选无法圈数据。问题原因 数据库负载较高导致数据更新失败。解决方案 将数据的更新时间错开即可,或者当数据更新失败后可以手动更新一下数据。适用于 Quick Audience 公共云

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多);进展摘要:处理人将事件升级为...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

集群高可用架构推荐配置

节点池高可用配置 您可以基于节点的弹性伸缩、部署、多AZ,结合K8s调度的拓扑分布约束,确保服务在不同的故障域(failure-domain)资源充足且有所隔离,从而当某一故障域出现问题时,服务仍然可以保持运行,减少单点故障的风险,提高系统...

数据水印

字符(必)导出内容的字符,支持 默认字符、GBK、UTF-8、ISO-8859-1 格式。执行策略(必)执行策略,支持:立即执行:系统立即执行导出。定时执行:系统将根据您设定的时间点执行导出,可避开业务高峰期。说明 设置定时执行后不...

SAP系统高可用环境维护指南

SAP高可用环境维护概述 SAP HANA高可用常见维护场景 1.主节点异常后处理 2.备节点异常后处理 3.主备节点停机维护 4.主节点停机维护 5....2.4 重置故障计数(可)3.主备节点停机维护 重要 将集群设置为维护模式,依次关停备和...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

集群管理常见问题

开启部署可防止多个ECS实例部署在同一个物理机上,避免当某个物理机发生故障时影响多个ECS实例,导致EMR本地HDFS数据丢失。受ECS部署本身的限制,目前最多支持20台ECS实例加入部署。具体操作请参见 开启部署。扩容集群如何指定部署...

用户洞察常见问题

更新数据:用户标签数据、商品标签数据、RFM模型、AIPL模型均支持手动更新、周期更新,更新操作请分别参见 管理用户标签数据、管理商品标签数据、管理RFM模型、管理AIPL模型。行为数据不支持更新。更新受众:受众支持手动更新...

SQL结果导出

字符(必)导出内容的字符,支持 默认字符、GBK、UTF-8、ISO-8859-1 格式。执行策略(必)执行策略,支持:立即执行:系统立即执行导出。定时执行:系统将根据您设定的时间点执行导出,可避开业务高峰期。说明 设置定时执行后不...

云原生AI套件概述

容器服务管理控制台 配置ACK集群依赖项及创建依赖云资源(可)若需安装配置AI套件控制台:需在集群中安装监控插件和日志服务。需在访问控制(RAM)控制台为集群添加授权策略。详情请参见 授权。若使用私网、公网域名访问控制台,需要在...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

副本实例连接说明

云数据库MongoDB副本实例分别提供了主从节点和只读节点的单独连接地址,以及用于应用程序连接的高可用ConnectionStringURI和ReadOnly ConnectionstringURI地址。本文介绍副本实例连接地址的获取方式及连接说明。获取数据库连接地址 ...

如何配置流转规则

登录 运维事件中心控制台;点击左侧导航栏 策略中心>流转规则 页面的 新增规则 按钮进入 新增规则 页面;在 新增规则 页面:配置触发条件:设置 规则名称、规则条件(规则条件需要选择监控源、key)、关联服务;配置规则触发 报警的收敛...

概述

整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk(简称VDS),该模块基于共享存储架构,实现自治的集群节点管理,大幅降低故障检测和集群主耗时;新增支持全局预热系统的热备节点,通过对存储引擎内部的多个模块...

创建副本实例

云数据库MongoDB提供的副本实例适用于读多写少或存在临时突发大促活动等场景,例如阅读类网站、订单查询系统等。本文介绍云数据库MongoDB副本实例的创建方法。前提条件 已注册阿里云账号,注册流程请参见 注册阿里云账号。免费试用 ...

创建副本实例

云数据库MongoDB提供的副本实例适用于读多写少或存在临时突发大促活动等场景,例如阅读类网站、订单查询系统等。本文介绍云数据库MongoDB副本实例的创建方法。前提条件 已注册阿里云账号,注册流程请参见 注册阿里云账号。免费试用 ...

配置任务常见错误码及排查方法

原因:通讯链路故障,JDBC驱动程序数据包成功发送到源数据库服务器,但未收到来自源数据库的数据包。解决方法:排查数据库的连接数是否过多。参考 communications link failure 处理。联系技术支持解决。DTS.Msg.SQLExecuteError....

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

通过Mongo Shell连接MongoDB副本实例

Mongo Shell是MongoDB自带的数据库管理工具,您可以下载Mongo Shell工具并安装至客户端(本地服务器或ECS服务器),用于连接云数据库MongoDB副本实例。前提条件 已创建云数据库MongoDB副本实例,创建方法请参见 创建副本实例。背景...

2024年

2024-01-25 全部地域 计算成本优化 控制台资源观测支持修改指标聚合算法 控制台资源观测为优化页面体验,每个指标至多支持展示60个时间点,因此当时间范围大于1h时,原先图表默认使用区间范围内(所时间范围的分钟数/60)的平均值聚合...

上下文查询

开发人员无需登录服务器,在大量日志中通过关键字检索日志,日志服务支持通过控制台查看指定日志在原始文件中的上下文信息。前提条件 已通过Logtail采集到日志。具体操作,请参见 通过Logtail采集日志。重要 如果您使用了Logtail插件处理...

性能趋势

操作步骤 登录 MongoDB管理控制台。根据实例类型,在左侧导航栏单击 副本实例列表 或 分片集群实例列表。在页面左上角,选择实例所在的资源组和地域。找到目标实例,单击实例ID。在左侧导航栏,选择 性能趋势。节点列表 性能趋势 页面中...

连接保持

PolarDB 新增支持连接保持功能,避免由于一些运维操作(如升级配置、主备切换或升级小版本等)或非运维操作故障(如节点所在服务器故障)导致的连接闪断或新建连接短暂失败的问题,进一步提高 PolarDB 的高可用性。前提条件 PolarDB 数据库...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 数据传输服务 视频点播 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用