流水单据型业务场景多活实践

在 读多写少型业务场景多活实践 中,已经将导购链路进行了异地多读改造,而该业务后续在一次大促期间,遭遇了一次订单应用大面积故障,导致大促期间下业务长时间无法使用,于是下业务的容灾建设也提上了议程。下业务是典型的流水单据...

读多写少型业务场景多活实践

验证爆炸半径是否控制故障单元内:预期:UserID为2000的用户路由到北京单元,不受杭州单元故障的影响。结果:导购页访问正常,符合预期。切流恢复 接下来将验证故障场景下的容灾恢复能力。在杭州单元发生故障的情况下,可以使用MSHA切流...

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

三网合一卡2.0使用入门

排除检测周期的影响,一般切换一次网络需要几十秒到分钟级不等(主要和模组是否需要重启逻辑有关)。切网多少次能到可用网络?当三个运营商基站均覆盖时,插卡即用。当三个运营商基站均无法覆盖时,则三网均不可用。当该设备区域内可用基站...

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

限流算法选择

可以通过拉长限流周期来应对突发流量。如 1 秒限流 10 个,想要放过瞬间 20 个请求,可以把限流配置改成 3 秒限流 30 个。拉长限流周期会有一定风险,用户可以自主决定承担多少风险。缺点:没有很好的处理单位时间的边界。比如在前一秒的...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供者进行降级,使客户端的请求更多...

进入Linux系统的用户模式

您可以在用户模式下,查看系统日志文件、检查服务状态、测试网络连接等,以进行故障排除和问题修复。以排查Linux系统启动问题为例,您可以进行如下操作:如果系统配置文件出现问题,导致系统无法正常启动,您可以在用户模式下修改相应...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

无法连接到同一个云连接网内的本地客户端

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否为黄色...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

概述

分区剪枝机制支持以下两种剪枝方式:排除约束 快速剪枝 排除约束 参数 constraint_exclusion 用于控制排除约束,取值范围:on、off 或partition,默认为partition。如果参数 constraint_exclusion 为partition或on,则表示启用排除约束;...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

费用与成本相关术语

A-E 术语 释义 包月周期-动态月周期 在每个周期内按实际消费线性抵扣,直到剩余量为0或者周期结束,在新周期开始时恢复购买的周期容量。动态月周期是指在订购生效次日0点往后30天作为重置周期。包月周期-自然月周期 在每个周期内按实际消费...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障)常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

EMR Kafka磁盘故障运维

此方案的优点在于不需要等待故障磁盘下线、维修、上线周期故障处理周期短。适用场景 适合单个Broker只有一块数据盘的场景。如果Broker上数据较少、恢复速度较快、集群负载较低,您也可以选择此方式来进行故障节点的运维。说明 如果坏盘为...

K8s应用运维管理最佳实践

重要 禁止从负载均衡控制台直接修改SLB实例的监听配置(含监听+证书),可能导致SLB控制台修改的配置回退,引发应用入口相关的故障。请勿配置私网SLB进行集群内部服务的访问。Pod实例之间无法直接访问私网SLB地址,私网SLB只是用来提供VPC...

健康检查最佳实践

检查周期 通常用于控制探测的灵敏度,理论上如果高频率的检查不会对业务有实质影响,则检查周期越短越好。但是,如果Liveness的检查周期太短,可能会让业务容器更容易重启。因此,可以根据计算公式(节点最大可容忍故障时间/3),来确定...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

域名控制台授权

本文为您介绍域名控制台授权的功能使用说明,以及开启和关闭域名控制台授权的操作指导。适用场景 当实际注册域名的阿里云账号(如注册代理商的阿里云账号)和域名所有者分属不同人员时,注册代理商可以在域名控制台上开启域名控制台...

混合云应用双活容灾最佳实践

多活控制台提供MSFE集群界面白屏化的部署、扩缩容、监控等常规运维能力,以及应对故障场景的分钟级切流能力。服务互通和同单元优先调用:业务应用需要按业务产品线分批上云,过程中存在下游应用仅IDC部署的情况。利用MSHA注册中心同步功能...

作业调试

在正式环境中使用Session集群,JM的复用机制会对作业间的稳定性产生负面影响,详情如下:JobManager故障会对集群内的所有作业造成影响。TaskManager故障会对在其上有task运行的相关作业造成影响。同一个TaskManager内部,不同Task...

无法开启域名控制台功能

如果您无法在控制台上开启域名控制台功能,请参见本文进行排查。问题现象 在阿里云域名控制台上无法找到开启域名控制台功能的入口。可能原因 如果在域名控制台上无法找到开启域名控制台功能的入口,可能是因为您当前登录的账号不是...

故障应急

故障管理体系是围绕故障全生命周期采取的一系列控制流程,包括故障基础数据管理(故障等级定义、应急场景监控覆盖、服务组&值班表管理、故障订阅管理),故障发现(7*24监控值班、智能基线告警),故障应急协同(故障通告及更新、故障应急...

产品优势

同时,OSS基于高可用架构设计,消除故障,确保数据业务的持续性。服务可用性最高可达99.995%。数据设计持久性最高可达99.9999999999%(12个9)。规模自动扩展,不影响对外服务。OSS会通过计算网络流量包的校验和,验证数据包在客户端和...

微服务治理差异化能力

容错:故障自愈能力 线上常出现以下场景:某应用发布,灰度部分实例,但由于代码逻辑写的有问题,造成线程池满,客户端调用失败。某应用运行过程中,某几台实例由于磁盘满,或者是宿主机资源争抢导致load很高,客户端出现调用超时。...

域名管理概述

域名控制台管理 域名控制台,是向部分阿里云域名所有者提供的一个独立于阿里云账号的域名管理平台,开放了部分域名管理功能。当实际注册域名的阿里云账号(如注册代理商的阿里云账号)和域名所有者分属不同人员时,注册代理商可以在...

基本概念

什么是弹性容器实例 负载均衡实例 负载均衡实例是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的故障,提升应用系统的可用性。负载均衡SLB产品家族介绍 RDS实例 云...

产品优势

安全、稳定 提供7×24小时的运行维护,并以在线工和电话报障等方式提供技术支持,具备完善的故障监控、自动告警、快速定位等一系列故障应急响应机制。基于阿里云的AccessKeyId和AccessKeySecret安全加密对,从访问接口上进行权限控制和...

行业算法版介绍

安全、稳定 提供7×24小时的运行维护,并以在线工和电话报障等方式提供技术支持,具备完善的故障监控、自动告警、快速定位等一系列故障应急响应机制。基于阿里云的AccessKeyId和AccessKeySecret安全加密对,从访问接口上进行权限控制和...

基于最后一次访问时间的生命周期规则

注意事项 规则数量 通过控制台最多可配置100条生命周期规则,条生命周期规则中可同时包含最后一次修改时间以及最后一次访问时间的策略。如果您需要配置更多数量的生命周期规则,请使用SDK或者命令行工具ossutil。费用说明 Object监控管理...

DDH生命周期

专有宿主机DDH的生命周期是指DDH从创建到释放的整个过程。在这个过程中,DDH会经历不同的状态。本文介绍DDH整个生命周期内的所有状态。DDH状态详情,如下表所示。状态 属性 说明 控制台上可见 启动中 中间状态 创建成功后,一台DDH进入 ...

查看IPsec连接日志

您可以查看IPsec连接的日志信息,通过日志信息排查IPsec-VPN连接的故障。背景信息 系统支持查看180天内IPsec连接的日志信息,您一次可查看的日志周期最长为10分钟。操作步骤 登录 VPN网关管理控制台。在左侧导航栏,选择 网间互联>VPN>...

时间属性配置说明

使用说明 调度任务的时间属性配置,仅定义任务预期执行时间,其实际是否执行与实际执行时间受多方因素影响,包括但不限于以下场景:调度开关控制 仅当DataWorks工作空间开启 启用调度周期 开关后,工作空间中的任务才可以根据其配置自动...

应用强弱依赖治理

创建强弱依赖治理 登录 AHAS控制台,在左侧导航栏选择 故障演练>演练方案。在左侧导航栏选择 演练方案>微服务演练。在 微服务演练 页面,单击左侧 强弱依赖治理。在 强弱依赖治理 页面,单击 创建治理方案,进入 应用接入 配置向导页。参数...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

基于最后一次修改时间的生命周期规则

在开通了OSS-HDFS服务的Bucket中配置生命周期规则 在开通了OSS-HDFS服务的Bucket中配置基于OSS文件的生命周期规则 如果您对开通了OSS-HDFS服务的Bucket设置或更新为匹配整个Bucket的生命周期规则,需通过NOT元素排除.dlsdata/,避免因生命...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
容器镜像服务 轻量应用服务器 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用