代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

故障复盘

消耗比=本财年累计消耗故障分/财年故障分目标 制定故障分建议考虑以下原则:拉齐横向标准:在企业上层拉齐标准,降低各个子部门和业务团队的理解成本。减少重大故障影响:针对特大故障,设置较大的系数倍数,以凸显特大故障对故障分的影响...

MSE注册配置中心高可用最佳实践

无容灾保护 当来自Consumer端的请求量突然增加时,如果Provider容量水位较高,会导致个别Provider发生故障:注册中心会将故障节点摘除,全量流量会给剩余节点。剩余Provider节点负载变高,大概率也会发生故障。最终所有Provider节点故障,...

实例的节点故障处理机制

副本集架构 副本集实例提供个节点供用户访问,当其中的某个节点发生故障后,系统会使用Secondary节点或隐藏节点替换故障节点继续提供服务,并对故障节点进行检查与修复。该过程对用户完全透明,可能会产生1次30秒内的连接闪断,建议您在...

虚拟服务(Virtual Service)CRD说明

委托的 HTTPMatchRequest 必须是根的严格子集,否则会发生冲突,HTTPRoute 将不会生效。rewrite HTTPRewrite 否 重写HTTP URI和Authority头部。重写不能与重定向原语一起使用。重写将在转发之前执行。timeout Duration 否 HTTP请求的超时...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

存储资源

存储资源是指用于存储和管理数据的硬件和软件资源,包括节点的本地磁盘、分布式文件存储、数据库和缓存...可以使用自动检测与恢复、依赖降级、故障迁移、多级缓存、配置验证与回滚、读写分离、库分表、副本等容错策略分别应对以上风险点。

IgnoreHcCheckWarnings-对基线的风险项批量执行忽略或...

变更历史 变更时间 变更内容概要 操作 2023-08-18 OpenAPI 错误码发生变更、OpenAPI 入参发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:400 入参 OpenAPI 入参发生变更。新增入参:Source 2022-08-01 ...

DescribeVulList-根据漏洞类型查询对应漏洞信息

根据漏洞得分提供以下修复建议:13.5~15 (含 13.5 和 15 ):通常代表高危漏洞,需尽快修复。7~13.5 (含 7 ):通常代表中危漏洞,可延后修复。7 以下:通常代表低危漏洞,暂可不修复。7.8 Cvss_factor string CVSS 因子。7....

DescribeImageBaselineStrategy-查询镜像基线策略

查询镜像基线策略。...变更历史 变更时间 变更内容概要 操作 2023-08-18 OpenAPI 入参发生变更、OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 入参 OpenAPI 入参发生变更。新增入参:Source 出参 OpenAPI 返回结构发生变更。

ListCheckTypes-查询基线检查项的类型列表

2023-12-07 OpenAPI 错误码发生变更、OpenAPI 入参发生变更、OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:500 入参 OpenAPI 入参发生变更。新增入参:ShowChecks 新增入参:Source 出...

SanityCheck:算力健康检测

功能介绍 在执行DLC任务时,可能会遇到以下问题:在任务花费一定时间加载模型Checkpoint或其他初始化操作后,由于申请的资源存在故障,无法顺利开始训练,需要调查定位故障问题并重新提交任务。该过程中会导致GPU资源的浪费。在任务运行...

DescribeRiskType-查询基线类型

变更历史 变更时间 变更内容概要 操作 2023-11-21 OpenAPI 错误码发生变更、OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:400 出参 OpenAPI 返回结构发生变更。2023-08-18 OpenAPI 错误...

OSS文件上传和下载失败的排查方法

在使用OSS SDK上传或下载文件时,如发生报错,请参见 OSS SDK使用中常见问题。OSS文件上传失败 当上传文件失败时,请参见以下操作进行排查处理:检查本地与OSS的网络是否存在异常。若存在网络故障,请使用ping命令测试与OSS的网络连通性,...

ListCheckItemWarningSummary-获取基线检查项风险统计...

变更历史 变更时间 变更内容概要 操作 2023-11-07 OpenAPI 错误码发生变更、OpenAPI 入参发生变更、OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:500 入参 OpenAPI 入参发生变更。新增...

CreateTairInstance-创建Tair实例

在节点故障后,数据会丢失,系统会自动拉起新的实例。仅在 单可用区时支持,且不支持创建集群与读写分离架构。MASTER_SLAVE ShardCount integer 否 实例中的数据节点个数,取值:1:默认值,即表示创建的实例为 标准架构,仅拥有 1 个...

CreateTairInstance-创建Tair实例

在节点故障后,数据会丢失,系统会自动拉起新的实例。仅在 单可用区时支持,且不支持创建集群与读写分离架构。MASTER_SLAVE ShardCount integer 否 实例中的数据节点个数,取值:1:默认值,即表示创建的实例为 标准架构,仅拥有 1 个...

ADP底座/本地运维控制台

能够展示集群整体健康和健康等级,并展示集群体检检测项及异常情况 维度展示CPU、内存、存储的资源分布 本地运维控制台更新监控告警功能 消息通道新增钉钉工作消息、阿里云SMS、企业微信、Webhook类型 告警消息新增在线诊断能力 监控...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域,...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域...

UpdateMeshFeature-更新服务网格的功能配置

false MultiBufferPollDelay string 否 MultiBuffer 的策略拉取延迟,默认为。0.02s DiscoverySelectors string 否 用于选择性服务发现的数据平面命名空间标签选择器列表。[{"matchExpressions":[{"key":"asm-discovery","operator":...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。

链路状态

发生故障时,及时进行切换。操作步骤 登录 智能接入网关控制台。在 智能接入网关 页面,单击目标实例ID。在智能接入网关实例详情页面,单击 高可用配置,可查看链路状态。绿灯:表示链路正常。红灯:表示链路故障。icmsDocProps={'...

设备级高可用

在购买智能接入网关设备时,您可以选择购买两台设备,两台设备绑定到同一实例中,互为备份,在一台设备发生故障时进行设备切换,保障业务不中断。通过本文您可以在智能接入网关控制台查看设备级备份信息。前提条件 您购买的智能接入网关...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

为RDS创建灾备实例

当RDS实例所在可用地域发生故障时,可基于灾备实例快速恢复服务。应用场景 创建RDS灾备实例可以为主实例提供数据备份和灾难恢复保障,当主实例出现故障或不可用时,灾备实例将自动接管数据服务,保证业务的连续性和可用性。风险等级 默认...

主从(备)切换原因

实例故障 阿里云检测到实例发生故障,无法正常使用,系统会发起主从(备)切换,及时恢复业务正常运转,缩小故障影响范围。主从(备)切换完成后,实例状态会显示运行中,您不需要进行任何操作,实例可以正常运行。您可以在 服务可用性 ...

备份和灾难恢复

阿里金融云可以支持同城双活/灾备、两地三中心等架构方式。1.同城双活 同城双活、灾备是阿里金融云的...故障切换回切:DNS将生产IP从原生产中心修改到灾备中心,实现跨Region的故障切换和服务恢复机制,主站发生故障时,由备站继续提供服务。

同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

配置设备级高可用

当主网关设备发生故障时,HA机制能够从备份的网关设备中选举一台设备成为新的主网关设备,用来承担数据流量,从而保障网络的可靠通信。动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。...

HINT语法使用说明

例如/*force_proxy_internal*/set force_node='pi-bpxxxxxxxx',执行该命令后,后续所有查询命令只发往 pi-bpxxxxxxxx 节点,如果该节点发生故障,则返回报错 set force node 'rr-bpxxxxx' is not found,please check.当开启列存和行存...

集群版-双副本

数据片(data shards)每个数据片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

集群架构

数据片(data shards)每个数据片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

设置宕机自动迁移

若您未开启宕机自动迁移,DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。警告 本地SSD型DDH(例如本地SSD型i2)不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障,您可以 提交工单 申请人工迁移,但迁移后本地...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达率 100%。发布 H5 离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 短信服务 共享流量包 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用