原因三:MaxCompute UDF依赖的资源类型不正确。例如PY文件,资源类型是PY,但MaxCompute UDF代码中 get_cache_file 需要的类型是FILE。原因四:MaxCompute UDF依赖的资源不是最新的。当您通过DataWorks上传MaxCompute资源时,从DataWorks...
Java 场景名称 特性 虚拟机场景 故障演练支持的虚拟机场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。K8s类...
如果用户未提前响应计划类运维事件,故障风险发生时会导致ECS实例出现宕机或重启。是 说明 当发生计划内运维事件的实例为大数据型或本地SSD型(不包含i4p、d3c),该事件将在 本地盘实例事件 下展示。关于更多本地盘事件信息,请参见 本地...
如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...
慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...
本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...
此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...
项目 网段规划 本地网络 私网网段:172.16.0.0/12 三层交换机G11端口:192.168.100.2/30 三层交换机G12端口:192.168.110.1/30 三层交换机G2端口:192.168.80.2/30 三层交换机BGP路由协议:AS号:65430 Router ID:192.168.1.1 出口路由器G...
背景信息 完成VMware虚拟机备份任务后,您可以在VMware虚拟机出现故障时,在Cloud Backup控制台将其备份时的状态迅速恢复至本地或者阿里云VMware服务,以保证业务连续性。虚机备份服务从1.0.13开始支持在Cloud Backup控制台上统一管控备份...
故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。
本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...
专有宿主机是单租户独享的物理机资源,您可以在专有宿主机上自行创建ECS实例和获取物理服务器属性等信息。DescribeDedicatedHosts 查询专有宿主机详细信息 调用DescribeDedicatedHosts查询一台或多台专有宿主机的详细信息,包括物理性能...
P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...
2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...
与共享宿主机(多租户环境)相比,DDH为您...高可用 DDH提供自动宕机迁移能力,在物理机故障时自动迁移,您无需准备备机,故障迁移自动完成。同时支持在不停机的情况下将ECS实例在不同宿主机间迁移,在需要时进行负载均衡,保障业务的高可用。
调用RedeployDedicatedHost执行专有宿主机的故障迁移。接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询...
系统策略可进一步细分为产品系统策略、服务角色策略和服务关联角色策略三类。部分云产品仅提供三类策略中的一类或两类,请以本文实际展示的策略类型为准。产品系统策略 AliyunYundunBastionHostAuditOnlyAccess 您可以将 ...
目前监控的DDH资源分为计算、网络、存储三类,具体的监控项如下表所示。资源类型 监控项 单位 描述 计算 专有宿主机上VM总的CPU利用率%DDH上所有ECS实例的CPU使用率均值。网络 专有宿主机上VM入方向网络每秒收包数 pps DDH上所有ECS实例的...
调用RedeployDedicatedHost执行专有宿主机的故障迁移。接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询...
故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练包括以下四个阶段:安装故障演练探针 对指定机器进行演练,需要在机器上面安装故障演练探针,探针的作用是下发故障...
系统策略可进一步细分为产品系统策略、服务角色策略和服务关联角色策略三类。部分云产品仅提供三类策略中的一类或两类,请以本文实际展示的策略类型为准。产品系统策略 AliyunECSFullAccess 您可以将AliyunECSFullAccess策略授权给RAM身份...
本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到用户本地数据中心的物理服务器上。前提条件 服务器已进入实时复制状态。更多信息,请参见 启动复制。背景信息 目前阿里云的混合...
系统策略可进一步细分为产品系统策略、服务角色策略和服务关联角色策略三类。部分云产品仅提供三类策略中的一类或两类,请以本文实际展示的策略类型为准。产品系统策略 AliyunCloudPhoneFullAccess 您可以将 AliyunCloudPhoneFullAccess ...
在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断
设置监控报警 为避免实例因为CPU、磁盘、内存、连接等原因导致实例不可用,建议您监控实例相关性能,并设置超过阈值时 自动报警,防患于未然。恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使...
接口说明 修改 CPU 超卖比时,专有宿主机上的 ECS 实例必须为已停止(Stopped)状态。修改 CPU 超卖比不会影响 DDH 的运行状态,但需注意 DDH 中已分配的 vCPU 数量不能超过修改后的总 vCPU 数量,否则超出部分的 ECS 实例将无法启动。调试...
场景三:故障>云间网络故障,会自动选中 切流组件。说明 单元(地域)间通信出现故障,将流量,主数据库全部切换到主单元(地域)。a.MSHA会自动将备单元的流量切0,主数据在备单元的也会自动选中,后续会切换单主单元。b.单击 下一步,...
可根据需要选择环境类的故障演练或是服务依赖类的故障演练。运行环境 可选择 机器负载高、内存消耗高、磁盘无剩余空间 或 磁盘读写过高 场景。服务依赖 可选择 本地服务丢失、本地服务延迟、调用下游服务丢失 或 调用下游服务延迟 场景。...
数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...
阿里云 服务网格 ASM提供了开箱即用的基于服务等级目标SLO(Service Level Objectives)的...假设在3天内错误率保持为阈值的两倍,在第三天故障解除。短时间窗口能够使告警在6小时后解除。若无短时间窗口,即使不存在故障,告警也会持续3天。
阿里云 服务网格 ASM提供了开箱即用的基于服务等级目标SLO(Service Level Objectives)的...假设在3天内错误率保持为阈值的两倍,在第三天故障解除。短时间窗口能够使告警在6小时后解除。若无短时间窗口,即使不存在故障,告警也会持续3天。
zoomin_out 放大 AaiMotionOutEffect:zoomout_out 圆形扫描 AaiMotionOutEffect:angular_out 旋出 AaiMotionOutEffect:rotate1_out 旋转飞出 AaiMotionOutEffect:rotate2_out 故障打印机 AaiMotionOutEffect:brokentypewriter_out ...
以下通过示例帮助您更好地理解授权组的概念:您在阿里云上共10个ECS实例,其中:应用服务器2个(APP1、APP2)数据库服务器2个(DB1、DB2)中间件服务器2个(M1、M2)开发测试服务器4个(TEST1-4)您单位共有三类工作人员:开发人员...
容灾概述 目前云上容灾主要分为以下三类:同城跨AZ容灾 同城容灾包含多活容灾和主备容灾,同城中心之间物理距离较近,网络延迟低,可防范AZ级别性质的灾难损害,例如火灾、断网或断电等。跨地域多活容灾 跨地域多活容灾对于网络延迟相对较...
zoomin_out"放大"AaiMotionOutEffect":"zoomout_out"圆形扫描"AaiMotionOutEffect":"angular_out"旋出"AaiMotionOutEffect":"rotate1_out"旋转飞出"AaiMotionOutEffect":"rotate2_out"故障打印机"AaiMotionOutEffect":"brokentypewriter_...
7*24监控值班 对于有条件的企业,可以设立全球运行指挥中心(Global Operations Center,简称GOC),实现7*24监控值班,时刻关注核心业务线上异常与故障。...建议重点覆盖成功(总)量、成功(失败)率、失败量三类场景的业务指标。
复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...
添加资产组 登录堡垒机系统。具体操作,请参见 登录堡垒机系统。在左侧导航栏,选择 资产管理>资产组。在 资产组 页面,单击 添加资产组。在 新建资产组 面板,输入资产组名称和备注信息,单击 创建。资产名称长度为1~128个字符,可以包含...
4G 系统盘:32G 移动测试,安装运行各类APP应用 视频类使用场景如抖音、快手等计算、内存资源消耗大 性能型 ecp.ce.xlarge CPU:4核 内存:8G 系统盘:32G 游戏类场景,计算、渲染要求高 直播场景,提供稳定流畅的视频流 其中,规格标识 各...
故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...