实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

离线同步常见问题

本文为您介绍离线同步的相关问题。文档概述 问题分类 相关文档 离线同步任务运维常见问题 为什么数据源测试连通性成功,但是离线同步任务执行失败?如何切换数据集成任务执行资源组?脏数据如何排查和定位?如何查看脏数据?如果离线同步...

SPI设备驱动程序开发指南

传输线数,掩码为 AOS_SPI_MCFG_WIDTH_MASK,取值必须为以下当中的一个:AOS_SPI_MCFG_WIDTH_1:表示单线传输。AOS_SPI_MCFG_WIDTH_2:表示双线传输。AOS_SPI_MCFG_WIDTH_4:表示四线传输。AOS_SPI_MCFG_WIDTH_8:表示八线传输。AOS_SPI_...

各源环境迁移至阿里云

原因是该UCloud Linux系统的内核可能与阿里云平台不兼容。您可以更换Linux系统内核,例如,对于CentOS操作系统,您可以更换为 CentOS官方内核。您也可以寻求技术支持,详细信息,请参见 联系我们。跨国际地域迁移的操作步骤 本操作适用于将...

混沌工程缓存实战系列-Redis

一次购物车的内部查询,都需要查询50的缓存(为了更好观看演练效果,次数稍微放大),每次缓存的操作约10 ms。购物车的内部查询优先经过缓存,失败了以后再使用数据库。连接缓存的SDK使用Java的JedisClient,设置的超时时间为100 ms。...

创建服务器迁移任务

您可以单击 查看原因 了解迁移任务出错的原因,并根据原因排查问题。您也可以单击操作列,并单击 前往OOS查看历史验证 获取OOS模板的历史执行信息。查看目标实例 如果您选择操作系统迁移或者迁移的目标类型为云服务器实例时者,可以在操作...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

编辑自定义功能

例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

全局参数

流水线提供全局参数来设定一些变量,在配置流水线时,可以通过引用全局变量的方式支持一些需要参数变化的场景。参数设定 全局参数的配置入口在流水线编辑页面的输入源配置中,如下所示:用户可以添加任意参数,并设置默认值:参数使用 全局...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

设备显示离线

本文介绍智能接入网关设备显示离线原因和处理方法。问题现象 登录 智能接入网关控制台,查看设备状态为 离线。可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

故障管理

根据墨菲定律,假设某意外事件在一次实验(活动)中发生的概率为p(p>0),则在n实验(活动)中至少有一次发生的概率为P=1-(1-p)n。由此可见,当实验次数n趋向于无穷时,pn会越来越趋于1,即成为必然事件。为了保障业务稳定性,可以通过...

I2C设备驱动程序开发指南

一次硬件传输的最大长度等于FIFO深度或DMA数据最大长度,考虑到硬件传输最大长度有限,一个transfer可能包含一次或多硬件传输。AliOS Things提供如下函数操作硬件传输。这些函数可以在 start_xfer 回调函数或中断处理程序中调用,支持在...

读多写少型业务场景多活实践

与许多企业一样,该电商业务首次开始考虑容灾建设,是源于一次商品应用的故障,导致导购页面长时间无法访问,电商业务瘫痪。虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始考虑...

流水单据型业务场景多活实践

在 读多写少型业务场景多活实践 中,已经将导购链路进行了异地多读改造,而该业务后续在一次大促期间,遭遇了一次订单应用大面积故障,导致大促期间下单业务长时间无法使用,于是下单业务的容灾建设也提上了议程。下单业务是典型的流水单据...

以太网接口频繁Up/Down

本文介绍以太网接口频繁Up/Down的原因和处理方法。问题现象 以太网接口频繁Up/Down。可能原因 线缆没有连接好。双绞线过长、光纤超长或链路损耗太大。接口、接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

以太网接口无法接通

本文介绍以太网接口没有接通的可能原因和处理方法。问题现象 以太网接口没有接通(物理上)。可能原因 设备没有连接电源或者以太网接口连接的线缆没有插好。光纤、双绞线过长或者链路损耗太大。接口、接口模块或者设备故障。解决方案 检查...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

同城多活架构实践

但因为一次线上可用区级故障,才发现将故障可用区的HTTP流量切换到其他可用区后,下游的RPC、MQ调用仍然有概率访问到故障可用区内的机器,业务仍然无法使用,导致电商页面长时间无法访问,甚至电商业务瘫痪。虽然故障最终得以解决,但故障...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

演练概述

基于阿里巴巴多年业务的真实线故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为某种原因中间失败了,您想支持断点续传,只Copy剩下未Copy成功的文件,则需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。hadoop jar jindo...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为某种原因中间失败了,您想支持断点续传,只Copy剩下未Copy成功的文件,则需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。hadoop jar jindo...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为某种原因中间失败了,您想支持断点续传,只Copy剩下未Copy成功的文件,则需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。hadoop jar jindo...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为某种原因中间失败了,您想支持断点续传,只Copy剩下未Copy成功的文件,则需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。hadoop jar jindo...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为各种原因中间失败了,而此时您想支持断点续传,只Copy剩下未Copy成功的文件,此时需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为各种原因中间失败了,而此时您想支持断点续传,只Copy剩下未Copy成功的文件,此时需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为各种原因中间失败了,而此时您想支持断点续传,只Copy剩下未Copy成功的文件,此时需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。...

Jindo DistCp场景化使用指导

在 场景 的基础上,如果您的Distcp任务因为各种原因中间失败了,而此时您想支持断点续传,只Copy剩下未Copy成功的文件,此时需要您在进行上一次Distcp任务完成后进行如下操作:增加一个-diff 命令,查看所有文件是否都传输完成。...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 全球加速 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用