应用场景

故障恢复 通过ASM,可以轻松实现开箱即用的故障恢复功能:分布式系统存在高度复杂性,在基础设施、应用逻辑、运维流程等环节都可能存在稳定性风险导致业务系统的失效。提供了基于Istio的混沌工程能力,包括如何使用连接池配置和异常检测...

故障隔离

时间窗口大小 设置故障检测的时间,与 时间窗口内最少调用次数 配合,只有在指定时间段内进行指定次数的请求才会被采集。取值范围:(1,60]单位:秒 时间窗口内最少调用次数 设置指定时间内的最少调用请求次数。取值≥0。异常比例阈值(%)...

稳态数据挑选

而且,非稳态情况下还可能造成故障检测的误诊。因此,稳态数据挑选对设备性能评价、运行优化、系统辨识和故障检测均具有重要意义。具体的支持的方法有:滑动窗口检验法(Sliding window test,SWT)、组合统计检验法(Combination ...

配置算法实例

I-V曲线诊断 通过阵列配置对组串IV曲线进行模式分析,完成对光伏电站组串的故障检测,实现简单、高效的运维管理,从而降低运维成本。具体使用说明,请参见 I-V曲线诊断。创建阵列 重要 创建的阵列总数量,不能超过当前 I-V曲线诊断 算法...

以太网接口无法接通

如果测试仪检测出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间线缆长度需小于100米。说明 10/100/1000 Mbps电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,此类双绞线最大传输距离为100米。如果线缆长度大于100米...

以太网接口频繁Up/Down

检查项 检查标准 后续操作 用测试仪测试双绞线是否故障测试仪显示双绞线正常。如果检查出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间线缆长度。说明 10/100/1000M电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

API概览

本文为您汇总了内容安全中所有可调用的内容检测类API。概述 本文适用基于API URL发起HTTP或HTTPS POST请求的用户,如果您使用的是 SDK,可以跳过本文档。发起API请求的URL由不同参数组合而成,有固定的请求结构(请参见 请求结构)。URL中...

搭建高可用架构

为保障您的业务正常运行,RDS提供各类高可用功能,例如独享型规格、高可用系列、多可区、跨地域备份恢复等等。创建高可用架构实例 在 创建实例 时,您需要关注如下几个涉及高可用架构的选项:系列:RDS支持多种系列,建议您选择 高可用...

步骤七:故障切换

该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。故障恢复类型 数据同步后切换 该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再...

步骤七:故障切换

该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。故障恢复类型 数据同步后切换 该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可能力。

故障注入

您可以通过故障注入功能向测试应用注入故障检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

故障注入

您可以通过故障注入功能向测试应用注入故障检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

什么是消息演练

验证服务依赖:通过演练的故障注入,检测系统对消息组件的依赖程度,探索消息失效的情况下,自身服务是否能够运行正常。降级备案方案:评估消息服务在故障情况下,降级预案是否运行正常,上下游通知服务是否具有容错机制。定位故障根源:...

数据安全最佳实践

多可区实例将物理服务器部署在不同的可用区,当可用区A出现故障时流量可以在短时间内切换到另一个可用区B。整个切换过程对用户透明,应用代码无需变更。您可以在创建实例时选择多可区,详情请参见 创建RDS MySQL实例。已创建的实例如果...

免费体验PolarDB MySQL热备无感秒切

整合了多项技术,来解决用户的痛点问题:故障探测:引入全新的高可用模块Voting Disk Service(简称VDS),该模块基于共享存储架构,实现自治的集群节点管理,大幅降低故障检测和集群选主耗时。切换速度:新增支持全局预热系统的热备节点,...

服务管控和治理

故障注入 您可以通过故障注入功能向测试应用注入故障检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。更多信息,请参见 故障注入。服务鉴权 服务提供者提供服务后,您可以通过...

概述

整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk(简称VDS),该模块基于共享存储架构,实现自治的集群节点管理,大幅降低故障检测和集群选主耗时;新增支持全局预热系统的热备节点,通过对存储引擎内部的多个模块...

多可区架构最佳实践

此合规包可以帮助您检测未使用多可区架构的云资源。应用场景 多可区架构最佳实践应用于对服务连续性和数据可靠性要求较高的企业。默认规则 规则名称 规则描述 使用多可区的RDS实例 RDS实例支持多个可用区,视为“合规”。OSS存储空间...

MSE注册配置中心和自建注册配置中心对比

高可用 多可区部署,故障自动检测及恢复,SLA保障率高达99.95%。需自行探索和开发高可用保障体系,对团队技术要求高。性能 深度优化,TPS性能提升40%、QPS性能提升55%。需自行调优。监控告警 可对集群状态、服务数、配置数、TPS、请求...

高可用版

图数据库GDB支持高可用版和单节点版两个系列。高可用版采用一主一备的经典高可用...可靠性 计算与存储分离,计算节点的故障不会造成数据丢失。基于超大规模的阿里云飞天分布式存储,保证数据多副本的可靠性。适用场景 企业级的生产图数据库。

EMR Kafka磁盘故障运维

磁盘故障及其运维通常伴随着磁盘上的数据销毁。在进行磁盘运维时,您应考虑数据是否需要迁移备份。对于Kafka集群,您还需要考虑Topic分区副本数据是否可以从其他Broker节点分区副本同步恢复。本文以EMR Kafka 2.4.1版本为例,介绍Kafka磁盘...

托管节点池节点自动恢复

相应的故障解除后,该节点才能再次进行自动恢复操作。自动恢复事件 ACK触发自动恢复时,会将相关的事件写入 事件中心。您可以在集群信息页面选择 运维管理>事件中心,查看自动恢复的记录和具体操作。内容 级别 详细描述 NodeRepairStart ...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

使用代码检测提升代码质量和安全

软件是工程师编写的,难免可能存在质量或安全问题,这些问题可能在生产环境中引发严重的故障,直接造成企业的经济损失和信任危机。为了将风险降至最低,建议在编码过程中启用一系列的自动化扫描服务,尽早的发现问题,将风险扼杀在摇篮中。...

托管节点池概述

自愈:托管节点池会监控节点的运行状态,如果节点超过10分钟未上报节点状态,或者状态为NotReady,容器服务会尝试通过重启故障节点来恢复潜在的故障。因此,节点上的Pod会被重启。托管节点池与普通节点池的区别 ACK提供普通节点池和托管...

HTTPDNS的高可用性如何保证

HTTPDNS通过以下方式保证高可用:为客户端提供多组服务IP,个别服务IP被DDoS攻击黑洞或运营商封禁不会导致服务中断异常。采用Anycast IP网络多地域部署,在单个...同地域多可区独立部署,单机房的故障不会导致该地域节点的服务中断异常。

附录:SOFAStack 产品目录

产品架构 产品优势 开箱即 多种消息类型:事务消息、定时消息、顺序消息。多种订阅模式:Pub/Sub、Tag 过滤、集群消费、广播消费。多协议多语言:TCP/HTTP 协议,多语言客户端 SDK。便捷运维 可运维:消息回溯、死信队列、监控告警。易...

DescribeClusterAddonsVersion-查询集群组件版本

目前该API接口已标记为弃,推荐使用替代API:CS(2015-12-15)-ListClusterAddonInstances、CS(2015-12-15)-GetClusterAddonInstance。根据集群ID,查询集群中已安装的所有组件的详情。调试 您可以在OpenAPI Explorer中直接运行该接口,...

DescribeClusterAddonsVersion-查询集群组件版本

目前该API接口已标记为弃,推荐使用替代API:CS(2015-12-15)-ListClusterAddonInstances、CS(2015-12-15)-GetClusterAddonInstance。根据集群ID,查询集群中已安装的所有组件的详情。调试 您可以在OpenAPI Explorer中直接运行该接口,...

DescribeClusterAddonsVersion-查询集群组件版本

目前该API接口已标记为弃,推荐使用替代API:CS(2015-12-15)-ListClusterAddonInstances、CS(2015-12-15)-GetClusterAddonInstance。根据集群ID,查询集群中已安装的所有组件的详情。调试 您可以在OpenAPI Explorer中直接运行该接口,...

什么是云拨测

故障定位与诊断:云拨测利用先进的Traceroute诊断技术,快速发现并定位网络故障,提供详细的故障报告和解决建议。实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过...

主备切换

A:依赖高可用HA(High Availability)系统的探活机制实现故障检测,具体如下:主要事件 说明 健康检测 HA系统会探测确认主备节点健康状态。主节点异常 发现主节点不可用,会将备节点提升为主节点,同时将虚拟IP地址VIP(Virtual IP ...

主备切换

A:依赖高可用HA(High Availability)系统的探活机制实现故障检测,具体如下:主要事件 说明 健康检测 HA系统会探测确认主备节点健康状态。主节点异常 发现主节点不可用,会将备节点提升为主节点,同时将虚拟IP地址VIP(Virtual IP ...

概述

Redis应用最佳实践 检测云数据库Redis的实例规格是否满足要求,检测审计日志开启、公网及白名单设置、多可容灾能力、实例续费及到期、变更管理等是否存在风险,确保正确应用云数据库Redis版,保障系统稳定性和安全性。

响应云盒维修事件

在您授权同意后,阿里云会按照约定的时间上门更换硬件设备,并将拆除的故障设备运送回阿里云工厂进行维修。具体维修流程,请参见 云盒故障服务器维修流程。操作步骤 当您收到云盒维修事件通知时,可以在控制台授权阿里云上门更换硬件设备。...

基于ack-lingjun-aiast组件实现集群自动化运维

PAI AIMaster+灵骏AI助手是一套全自动的故障快速恢复系统。该系统能够实时监测并分析系统的运行状态,快速检测故障并采取恢复措施,例如硬件故障、网络故障、软件错误等,从而降低运维成本,提高系统可靠性和稳定性。组件介绍 安装灵骏AI...

使用高可用的RDS实例

应用场景 对于高可版的RDS实例,当主RDS实例出现故障无法访问时,会自动切换到备用RDS实例,提升系统的稳定性,减少业务中断风险。风险等级 默认风险等级:高风险。当您使用该规则时,可以按照实际需求变更风险等级。检测逻辑 RDS实例...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云安全中心 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用