实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

网络类场景

网络延迟 网络延迟场景可以指定网络延迟因素(例如网卡、本地端口、远程端口、目标IP等)和延迟时间,对应用或服务注入网络调用延迟故障。验证网络延迟情况下系统的容错能力。表 1.参数说明 参数名称 参数说明 网卡名称 具体的网卡设备,为...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

计费概述

预付费资源包:用户预先采购资源包,当发生API调用时,从资源包里抵扣对应次数或额度。QPS叠加包:OCR文字识别默认支持10QPS,部分能力支持付费提升QPS。OCR文档自学习,在公共云支持如下3类情况:支持 免费额度、按量后付费、资源包预付费...

API概览

RedeployDedicatedHost 执行专有宿主机的故障迁移 调用RedeployDedicatedHost执行专有宿主机的故障迁移。ReleaseDedicatedHost 释放专有宿主机 调用ReleaseDedicatedHost释放一台按量付费专有宿主机。CreateDedicatedHostCluster 创建一个...

Co、递归调用

发现问题 客户接入 Node.js 性能平台 后,通过监控经常出现内存增长导致的 OOM,于是客户加上了一条告警规则:@heap_used/heap_limit>0.5,目的是在堆较小但是发生泄漏时能正常输出 heapsnapshot 文件用于分析。经过授权,我们得以进入客户...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

调用链分析

所以B的分布可能是:一共有4次请求,其中有2次请求调用的4个Span B都是正常的,剩下2次请求中,首次Span B的调用发生异常,然后重新调用成功。说明 如果需要查看具体的调用链详情,可以将鼠标悬浮于蓝色的Span名称上,在悬浮框中可以看到...

调用链分析

所以B的分布可能是:一共有4次请求,其中有2次请求调用的4个Span B都是正常的,剩下2次请求中,首次Span B的调用发生异常,然后重新调用成功。说明 如果需要查看具体的调用链详情,可以将鼠标悬浮于蓝色的Span名称上,在悬浮框中可以看到...

调用链分析

所以B的分布可能是:一共有4次请求,其中有2次请求调用的4个Span B都是正常的,剩下2次请求中,首次Span B的调用发生异常,然后重新调用成功。说明 如果需要查看具体的调用链详情,可以将鼠标悬浮于蓝色的Span名称上,在悬浮框中可以看到...

调用链分析

所以B的分布可能是:一共有4次请求,其中有2次请求调用的4个Span B都是正常的,剩下2次请求中,首次Span B的调用发生异常,然后重新调用成功。说明 如果需要查看具体的调用链详情,可以将鼠标悬浮于蓝色的Span名称上,在悬浮框中可以看到...

API概览

RedeployDedicatedHost 执行专有宿主机的故障迁移 调用RedeployDedicatedHost执行专有宿主机的故障迁移。ReleaseDedicatedHost 释放专有宿主机 调用ReleaseDedicatedHost释放一台按量付费专有宿主机。CreateDedicatedHostCluster 创建一个...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

计量计费相关

如果不发生API调用,开通服务不会产生OCR费用。资源包买错了可以退款吗?若因产品介绍说明有误导致的购买错误 且资源包尚未使用,可工单申请退款,预需要计3-4个工作日审批,款项会原路退回。在审批期间,如您急需使用其他产品,可以先购买...

计费概述

开通服务后,即可使用 金融级实人认证 服务。...流量包退款说明 购买流量包5天内且未使用,即未发生实际调用次数,支持退全款。如果您不确定是否已经使用,您可以通过 费用中心,查看资源包的使用情况。具体操作,请参见 资源实例管理。

通过错/慢调用链排查应用产生异常的原因

在生产环境中,引发应用异常(如耗时突增、错误率突增)的原因有很多,常见的包括流量不均、单机故障、程序异常和依赖组件故障等。在新应用上线或大促备战前通常建议做一次系统性的性能调优,分析当前系统存在哪些性能瓶颈,梳理出常出错的...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

API概览

您可以调用DescribeClusterEvents接口,获取指定集群中发生的事件列表,并查询事件的详细信息,包括事件级别、时间状态、时间发生时间等。任务 API 标题 API概述 DescribeTaskInfo 查询任务详情 您可以调用DescribeTaskInfo接口,查询集群...

API概览

您可以调用DescribeEvents接口,查询某类事件的详细信息,包括事件级别、时间状态、时间发生时间等。DescribeClusterEvents 查询指定集群的事件 集群操作事件包括集群创建、集群变更、节点池创建、节点池扩容、Addon安装、集群升级等。您...

API概览

推荐您使用托管节点池,以帮助您自动完成部分节点运维操作,例如高危CVE漏洞自动修复、部分故障修复等,从而降低您的节点运维负担。DeleteClusterNodepool 删除节点池 您可以调用DeleteClusterNodepool接口删除不再使用的节点池。...

使用示例

远程登录功能主要应用于设备发生故障导致设备不可用时,对设备进行远程运维。本文以C Link SDK中的Demo文件./demos/remote_access_basic_demo.c 为例,介绍如何调用Link SDK的API,帮助设备实现远程登录功能。背景信息 远程登录功能的更多...

合约间调用

当普通调用发生时,需要指定被调用合约的Identity,转移给被调用合约的资产数量,gas数量,被调用合约接口名称,被调用合约接口的参数列表。A->B A 合约调用 B 合约。B 执行过程中,GetSender()是 A;B 的代码操作的都是 B 合约本身的存储...

设计方案

整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制进行互相调用的微服务架构,...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

合约间调用

当普通调用发生时,需要指定被调用合约的Identity,转移给被调用合约的资产数量,gas数量,被调用合约接口名称,被调用合约接口的参数列表。A->B A 合约调用 B 合约。B 执行过程中,GetSender()是 A;B 的代码操作的都是 B 合约本身的存储...

流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

RPC 常见问题

如果客户端日志 sofa-registry.log 中显示服务地址已经推送,但是 RPC-02306 错误发生的时间在服务地址推送之前,这种情况多发生调用服务时,客户端应用还没有完成启动。问题原因多为业务系统自己通过定时任务调用服务,或者在 bean 初始...

参数模式

与 OUT 参数一样,IN OUT 形参也可由被调用程序修改,如果被调用程序终止且未发生异常,则形参中的最后一个值将传递给调用程序的实参。如果发生已处理的异常,则实参采用分配给形参的最后一个值。如果发生未处理的异常,则实参的值仍是它在...

API概览

故障演练 API 标题 API概述 CreateFailoverTestJob 创建高速通道故障演练任务 调用CreateFailoverTestJob接口创建高速通道故障演练任务。StartFailoverTestJob 开始高速通道故障演练任务 调用StartFailoverTestJob接口开始高速通道故障演练...

API概览

UpdateExperiment 调用UpdateExperiment接口编辑故障演练基本信息及流程定义。ExecuteExperiment 调用ExecuteExperiment接口执行故障演练。PushExperimentTask 调用PushExperimentTask接口推进故障演练任务。FinishExperimentTask 调用...

ReprotectDiskReplicaPair-启用云盘反向异步复制

您可以调用 FailoverDiskReplicaPair 启用故障切换功能。异步复制关系中,主盘必须从所属的 ECS 实例上卸载,即处于未挂载的状态。您可以调用 DetachDisk 卸载云盘。启用反向复制功能后,您还需要重新调用 StartDiskReplicaPair 启动异步...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 机器翻译 短信服务 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用