什么是Serverless工作流

方便您快速识别故障位置,并快速排除故障问题。支持长时间运行流程 Serverless 工作流 可以跟踪整个流程,持续长时间执行确保流程执行完成。有些流程可能要执行几个小时、几天、甚至几个月。例如运维相关的Pipeline和邮件推广流程。流程...

在Windows实例无法访问外部网络如何处理?

或 Windows实例ping外地址提示“一般故障”。检查Windows实例是否存在性能问题 Windows实例可能存在CPU资源占用高、内存耗尽、带宽占用满、网络动态端口耗尽等问题,您可以通过如下方式进行检查:使用工具进行分析,具体操作,请参见 ...

异地双活切流

说明 单元(地域)出现大面积故障,将故障单元(地域)的流量切0,主数据库在该单元(地域)的切换到正常单元。a.选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA会自动将该单元的流量置0,将另一个单元置为100。b.单击 下...

Kubernetes集群网络规划

不能和其他集群的地址段重叠 不能和Pod的地址段重叠 不能和Service的地址段重叠 此例子中,Kubernetes集群Pod地址段可以选择10.0.0.0/8下的某个子段。说明 您需特别关注转发到VPC 2的地址段,可以把这部分地址理解成已经占用的地址,...

功能发布记录

本文为您记录云企业发布的功能及对应文档,方便您了解云企业功能动态。2023年12月 功能名称 变更类型 功能描述 发布时间 相关文档 链路类型 新增 跨地域连接新增支持铂金和金的链路类型,金链路可用于传输对链路质量不敏感的业务流量,...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

EasyCkpt:AI大模型高性能状态保存恢复

功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的功能特点:特点1:任务的故障是部分的。通常,故障的根因是一到两台机器的故障,这只会影响部分Worker。对于大规模分布式训练任务而言,不会所有...

Kubernetes集群网络规划

不能和其他集群的地址段重叠 不能和Pod的地址段重叠 不能和Service的地址段重叠 此例子中,Kubernetes集群Pod地址段可以选择10.0.0.0/8下的某个子段。说明 您需特别关注转发到VPC 2的地址段,可以把这部分地址理解成已经占用的地址,...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

为什么Wi-Fi信号很强上网却很慢

检查AP的信道是否存在干扰、功率设置是否过大,导致信号重叠。将AP连接协议改为仅支持高速率模式,排除掉低速率用户接入。检查是否在AP上进行上行限速,用于降低上行带宽占用。利用频谱设备或者相关软件进行同邻频扫描,检查STA附近是否...

Windows实例通过外部访问网络不通的处理

更多信息,请参见 在ECS实例的Windows服务器PING外提示一般故障处理方法。检查Windows实例是否有性能问题,如CPU资源占用高、内存耗尽、带宽占用满、网络动态端口耗尽。更多信息,请参见 Windows系统内存分析工具的介绍。检查Windows实例...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

【Fault Injection】故障注入

故意破坏服务,以暴露弱点的测试方法可以提高容错能力,发现客户端的错误,或者识别您所面临的故障情况。服务网格 ASM支持故障注入,您可以使用虚拟服务在应用层进行测试。本文介绍如何配置故障注入。前提条件 已完成准备工作,并部署...

【Fault Injection】故障注入

故意破坏服务,以暴露弱点的测试方法可以提高容错能力,发现客户端的错误,或者识别您所面临的故障情况。服务网格 ASM支持故障注入,您可以使用虚拟服务在应用层进行测试。本文介绍如何配置故障注入。前提条件 已完成准备工作,并部署...

测试指标

关于批量处理时间窗口,不同系统的批量处理时间窗口在起止时间上可以部分重叠。另外,同一系统内部,也可能存在多个批量处理过程同时进行,其时间窗口相互叠加。长时间批量处理将会对联机在线实时交易产生重大的性能影响。标准 在数据量很...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

DATASOURCE:CEN:CenRouteMaps

取值:Include:模糊匹配,匹配条件中的Community与被匹配路由的Community有重叠,即判定为匹配成功。Complete:精确匹配,匹配条件中的Community必须与被匹配路由的Community一致,才判定为匹配成功。Description String 路由策略的描述...

故障演练

高速通道故障演练功能是一种模拟故障场景的工具。例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过...

服务等级说明

(2)因数据总线故障导致的正常请求未能到达数据总线服务器端的请求(通过故障前7天内使用数据总线的域名的平均请求数计算)。1.4 有效的总请求 客户某一阿里云账号下数据总线服务器端接收到的所有请求视为有效的总请求。1.5 每5分钟错误率...

SLA服务等级协议

(2)因客服工作台故障导致的正常请求未能到达客服工作台服务器端的请求(通过故障前7天内使用客服工作台的域名的平均请求数计算)。1.4有效的总请求:客户某一阿里云账号下客服工作台服务器端接收到的所有请求视为有效的总请求。1.5每5...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

归档存储服务等级协议

故障恢复能力 阿里云为付费用户的云服务提供7×24小时的运行维护,并以在线工单和电话报障等方式提供技术支持,具备完善的故障监控、自动告警、快速定位、快速恢复等一系列故障应急响应机制。2.11.网络接入性能 阿里云归档存储对用户不限制...

服务等级协议

1.5 每5分钟错误率:根据区域的不同 以每5分钟为单位按照如下方式计算:每5分钟错误率=每5分钟失败请求数/每5分钟有效总请求数x100%注:当出现平台服务故障而无法获取失败请求数时,将通过计算前7个自然日用户每分钟请求数的平均值,用该...

服务协议

赔偿范围不包括以下原因所导致的请求失败或服务不可用:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到...

产品服务等级协议

2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何...

事件中心

risk-ec-bgpRouterFail BGP连接故障 警告 BGP 连接故障 物理专线网络连通性故障或BGP配置异常,导致BGP连接故障和路由丢失。建议您联系您的商务经理沟通处理。risk-ec-inTrafficDroppedToZero VBR入方向流量陡降 警告 VBR入方向流量陡降 ...

服务等级协议

(2)因运维事件中心故障导致的正常请求未能到达运维事件中心服务器端的请求(通过故障前7天内使用运维事件中心的域名的平均请求数计算)。1.4有效的总请求:客户某一阿里云账号下运维事件中心服务器端接收到的所有请求视为有效的总请求。1...

混沌工程缓存实战系列-Redis

因为服务端出现故障更加真实,所以可以从服务端层面去制造故障,但对于问题定位和排查的要求会更高。注入故障,观察指标的变化。缓存监控指标 目前支持的可监控的缓存指标如下:指标 说明 缓存QPS QPS是最通用也是最易观察的指标。缓存命中...

部分索引

通常,本数据库会对索引使用做出合理的选择(例如,它会在检索公值时避开索引,这样前面的例子只能节约索引尺寸,它并非是避免索引使用所必需的),非常不正确的规划选择则需要作为故障报告。记住建立一个部分索引意味着我们知道的至少和...

VPN网关支持BGP动态路由公告

VPN网关启用BGP动态路由功能后,如果VPN网关关联的VPC加入了云企业,则云企业需开启路由重叠功能。说明 2019年03月01日后创建的云企业实例,默认开启重叠路由功能。关于如何开启路由重叠功能,请参见 开启重叠路由功能。如果一个VPC...

错误码

常见 PolarDB-X 数据节点连接失败的原因如下:后端数据节点连接数已满 计算节点到数据节点的连接超时 数据节点拒绝连接 如果排除后端数据节点问题后仍然出现该错误,请联系技术支持。PXC-4103 ERR_ATOM_CONNECTION_POOL_FULL 描述:PolarDB...

使用限制

政策封或阿里集团封网都将影响专线延时施工,若遇到阿里集团封,请向您的阿里客户经理咨询。阿里接入点机房是阿里云向电信运营商或第三方租赁的机房,若存在专线入楼费和楼内线缆费,需接入方向机房运营商支付。专线施工类服务时间 ...

路由策略概述

专有网络VPC(Virtual Private Cloud)实例ID 边界路由器VBR(Virtual Border Router)实例ID 云连接CCN(Cloud Connect Network)实例ID 智能接入网关(Smart Access Gateway)实例ID 源实例ID列表支持 排除匹配 模式,即被匹配路由的源...

从TR专线迁移至ECR专线访问云资源

您可以自行规划网段,请确保您的网段之间没有重叠。机构 网段规划 本地IDC 10.10.10.0/24 VPC 192.168.1.0/24 VBR1 阿里云侧IPv4互联IP:10.0.0.1 客户侧IPv4互联IP:10.0.0.2 IPv4子网掩码:255.255.255.252 VBR2 阿里云侧IPv4互联IP:10....

源为PolarDB-X的功能规范和约束说明

在断、业务切流后,如DTS任务恢复正常,会自动启动重试机制,重新同步、迁移或订阅故障发生前一段时间的数据,以避免目标库数据丢失。在这种情况下,如目标表缺少主键,会导致源目库数据不一致;如目标表存在主键,则在重试机制过程中源...

源为PolarDB-X的功能规范和约束说明

在断、业务切流后,如DTS任务恢复正常,会自动启动重试机制,重新同步、迁移或订阅故障发生前一段时间的数据,以避免目标库数据丢失。在这种情况下,如目标表缺少主键,会导致源目库数据不一致;如目标表存在主键,则在重试机制过程中源...

目标规则(Destination Rule)CRD说明

consecutiveLocalOriginFailures UInt32Value 否 触发排除需要的连续本地故障数。默认为5。该字段仅在 splitExternalLocalOriginErrors 设置为true时生效。consecutiveGatewayErrors UInt32Value 否 将主机排除出连接池需要的网关错误数。...

DescribeCenRouteMaps-查询路由策略

取值:RegionIn:入地域网关方向,表示路由传入云企业地域网关的方向。例如:路由从本地域的网络实例发布到本地域网关,或其他地域的路由发布到本地域网关。RegionOut:出地域网关方向,表示路由传出云企业地域网关的方向。例如:路由...

Pod诊断

Pod申请的GPU资源 检查Pod是否申请GPU资源,排除因为未申请GPU资源导致的Pod无法使用GPU。该Pod中没有声明GPU资源,如有需要,请检查Pod配置是否规范。Pod调度状态 检查Pod是否正常调度。该Pod中没有声明GPU资源,如有需要,请检查Pod配置...
共有129条 < 1 2 3 4 ... 129 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 负载均衡 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用