功能概览

包括两种类型,计划(planned failover)和非计划(unplanned failover),区别在于切换时生产站点ECS是否已经宕机故障恢复 Failback 当生产站点故障恢复时,将业务从容灾站点切回到生产站点的过程。正向保护 Forward 用于保护组和ECS的...

快速使用专属集群MyBase

若上述专有网络下无当前可用区的虚拟交换,您可以登录 交换控制台 创建虚拟交换,并确保与上述专有网络的地域和可用区保持一致。具体操作,请参见 步骤一:创建专有网络和交换。若上述专属集群和专有网络均选择系统默认创建,且...

功能概览

包括两种类型,计划(planned failover)和非计划(unplanned failover),区别在于切换时生产站点ECS是否已经宕机故障恢复 Failback 当生产站点故障恢复时,将业务从容灾站点切回到生产站点的过程。正向保护 Forward 用于保护组和ECS的...

概述

整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk(简称VDS),该模块基于共享存储架构,实现自治的集群节点管理,大幅降低故障检测和集群选主耗时;新增支持全局预热系统的热备节点,通过对存储引擎内部的多个模块...

算法能力列表

算法名称 算法能力简介 AlgorithmCode 明厨亮灶-工作帽检测 检测画面中的后厨员工是否存在未戴工作帽的情况,如果有则输出告警事件 9387534b-d6aa-404c-84fb-7c108343f410 明厨亮灶-口罩检测 检测画面中的后厨员工是否存在未戴口罩的情况,...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

演练场景说明

Java 场景名称 特性 虚拟场景 故障演练支持的虚拟场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。K8s类...

创建专有宿主机

您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机故障时自动迁移服务。CPU超分比:仅超分型规格支持CPU超分比,CPU超分比影响DDH的可用vCPU数,一台DDH的可用vCPU数=物理CPU核数*2*CPU超...

创建DDH

您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机故障时自动迁移服务。CPU超分比:仅超分型规格支持CPU超分比,CPU超分比影响DDH的可用vCPU数,一台DDH的可用vCPU数=物理CPU核数*2*CPU超...

云虚拟主机中安装ShopNC时遇到的常见问题

问题原因 原因一:针对问题一,由于安装ShopNC需要检测站点空间大小,而云虚拟主机禁止了相关函数,导致无法检测到磁盘信息。原因二:针对问题二,ShopNC默认设置了数据库地址长度,而云虚拟主机的数据库地址超过了该限制。解决方案 根据...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

响应云盒维修事件

会向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备(备仍受阿里云智能运维系统的检测)。...

高性能版实例

高可用 AnalyticDB PostgreSQL版 高性能版由于减少了一个副本,在高可用方面出现了一些下降,在物理机故障等极端情况下,集群恢复的时间会变长(8小时以内)。高性能版通过ESSD多副本技术,保留了完整的数据可靠性,并且阿里云团队通过更改...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

高可用能力

自动高可用模式下,PolarDB PostgreSQL版(兼容Oracle)通过对数据库内核、容器、主机等多维度状态检测,减少故障检测时间,降低故障误判概率,单点故障场景下RTO。手动高可用模式下,PolarDB PostgreSQL版(兼容Oracle)检测机制、状态...

一键诊断

计算层检测 存储层检测包括 异常算子检测、节点在线状态检测、CPU使用率倾斜检测、资源组平均CPU使用率检测、资源组间CPU使用率倾斜检测 和 时序指标相关性分析。异常算子检测 算子详细信息 计算层检测功能,可以帮助您快速查找异常算子...

镜像检测项说明

更多信息,请参见 如何解决实例迁移后的宕机问题?不支持神龙规格的系统通常是已经EOL不再维护的低版本系统,阿里云建议您尽早更新升级,使用各发行厂商正在维护更新的操作系统版本。Windows检测项 Windows操作系统镜像检测项的详细说明及...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

镜像检测概述

更多信息,请参见 如何解决实例迁移后的宕机问题?不支持神龙规格的系统通常是已经EOL不再维护的低版本系统,阿里云建议您尽早更新升级,使用各发行厂商正在维护更新的操作系统版本。Windows检测项 Windows操作系统镜像检测项的详细说明及...

语音异步检测

hintWords JSONArray"[{"context":"敏感词"}]"语音中包含的文本命中的风险关键词信息,用于提示您违规的原因,可能返回多个命中的关键词。具体结构描述,请参见 hintWords。keyword String 恶心 如果命中了用户自定义关键词,返回命中的...

V3.2.33版本升级通知

V3.2.33版本新增连通性检测工具,您可在登录堡垒或通过堡垒运维资产遇到连接问题时,使用连通性测试工具自助排查原因。升级时间 2023年02月23日~2023年04月07日 升级内容 新增连通性检测工具。更多说明,请参见 功能发布记录。升级方式...

演练概述

完整的故障演练包括以下四个阶段:安装故障演练探针 对指定机器进行演练,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。创建演练 配置演练基本信息、演练对象和演练全局参数。可同时选择多个故障类型。执行演练 将...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

故障排查

本文介绍阿里云容器服务ACK集群在使用过程中常见问题的故障分析和排查流程。ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes...

功能优势

AHAS Chaos 支持一次演练包含多个定义的故障场景,同时您可以定制这些场景的运行方式,选择依次进行故障注入或同时注入多个场景,通过不同的策略配置来达到不同的故障注入效果。丰富的故障场景 丰富的故障场景也是 AHAS Chaos 的一大特色,...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供者进行降级,使客户端的请求更多...

如何解决MSE Nacos实例域名无法解析的问题?

MSG SIZE rcvd:73 如果 dig 命令无法正常解析域名,采用以下方式修复:如果您的环境是通过ECS部署,请记录 SERVER 字段中的DNS服务器和NameServer地址信息,并 提工单 联系ECS或网络技术支持协助排查域名解析失败的原因。如果您的环境是...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

商业化AHAS CHAOS故障演练是阿里巴巴内部广泛使用的演练平台云上版本,具有灵活的流程编排、丰富的故障场景等特点,可以帮助企业提升分布式系统的容错能力,保障在企业上云或往云原生系统迁移过程中业务的连续性。AHAS CHAOS故障演练在...

DescribeDedicatedHosts-查询专有宿主机详细信息

UnderAssessment:物理风险,即故障潜伏期,其物理处于可用状态,但可能导致专有宿主机中的 ECS 实例出现问题。PermanentFailure:永久性故障,专有宿主机不可用。TempUnavailable:宿主机临时不可用。Redeploying:宿主机恢复中。默认...

检测资源栈的偏差状态

偏差检测可以帮助您查看资源栈的实际配置是否与资源栈模板配置存在差异,本文为您介绍如何检测资源栈的偏差状态。应用场景 如果您想检测资源栈实际的配置状态与模板中定义的状态是否相符或者资源栈中的资源状态是否符合实际状态,您可以...

检测资源的偏差状态

偏差检测可以帮助您查看具体资源是否已偏离预期的模板配置,本文为您介绍如何检测资源的偏差检测。应用场景 如果您想查看资源栈中的具体资源是否符合实际状态,您可以选择使用偏差检测功能检测资源的最新状态。前提条件 请确保您已经在整个...

ModifyInstance

Parameter.2.Code String 是 NetworkType 堡垒机的第2组属性的Code配置,设置为 NetworkType,表示设置堡垒机的网络。Parameter.2.Value String 是 vpc 堡垒机的第2组属性的Value配置,设置为 vpc,表示堡垒机实例采用VPC网络类型。...

故障注入

您可以通过故障注入功能向测试应用注入故障检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

修改主机的服务端口

目前堡垒对于服务器的RDP和SSH协议使用的是默认端口(RDP协议默认使用3389端口,SSH协议默认使用22端口),如果您在主机中自定义了端口,需要在服务端口中做相应修改。本文档介绍如何修改主机的服务端口。前提条件 在您修改服务端口前,...

异常检测

功能说明“异常检测”功能通过人工智能算法,可以识别您在云上消费费用的波动异常。同时,您还可对检测的结果进行评估反馈,从而辅助训练检测算法,提升算法检测的准确率。操作说明 登录“用户中心”,进入“成本管理-异常检测”,可以查看...

NAT网关故障排查指南

流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问公网服务时出现连接超时、下载速度慢等...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 云数据库 Redis 版 运维安全中心(堡垒机) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用