通用性能

告警 支持主流协议 Snmptrap、Syslog、PING(同时支持采集性能告警)告警解析能力:支持 实时计算引擎,1万记录数/秒的分析入库 故障收敛能力:支持 按照规则和拓扑压缩归并 诊断自愈能力:支持 执行预分析和自动化管控任务,设备场景做到1...

自助诊断GPU节点问题

启用节点诊断 您可以在故障诊断中选择待诊断的GPU节点发起节点诊断,并根据诊断报告修复问题。登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 巡检和诊断>故障诊断。在 ...

ReportInstancesStatus-反馈一台或者多台ECS实例异常...

取值范围:hardware-cpu-error:CPU 故障 hardware-motherboard-error:主板故障 hardware-mem-error:内存故障 hardware-power-error:电源故障 hardware-disk-error:磁盘故障 hardware-networkcard-error:网卡故障 hardware-raidcard-...

UpdateExperiment

调用UpdateExperiment接口编辑故障演练基本信息及流程定义。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 ...

Android SDK常见问题排查步骤

4.打开用户反馈后,点击“我要反馈”,“常见问题”没有反应,原因是调用WebView的pauseTimers方法会暂停所有webview的layout、parsing、javascripttimer,会影响用户反馈的运行。这时请在调用用户反馈之前,调用WebView的resumeTimers方法...

GxP欧盟附录11标准合规包

业务背景 GxP欧盟附录11(GxP EU Annex 11)是欧盟对于计算机化系统使用的规范性要求,主要针对在制药、生物技术和医疗器械领域中使用计算机化系统的企业和组织。他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保...

PageableQueryExperimentTaskByExperimentId

Code String P_ERROR_*接口请求反馈编码。Success Boolean true 接口请求成功标识。示例 请求示例 http(s):/[Endpoint]/?Action=PageableQueryExperimentTaskByExperimentId&ExperimentId=1234567890123456789&Page=1&Size=10&Namespace=...

互动直播RTC SDK简介

客户只需要把想要的状态通过API传至SDK,SDK内部会进行状态判断,并在适当时机达成用户想要的目标状态,同时在执行时通过回调机制及时向客户反馈SDK当前执行状态,使客户使用我们的SDK时享受到无忧的体验。您只需设置期望的状态,SDK便会...

ExecuteExperiment

调用ExecuteExperiment接口执行故障演练。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是 ...

移动性能监控简介

诊断迅速 结合网络请求数据分析、页面加载性能、JS 异常监控等功能,可迅速进行业务故障排查,将问题根源定位的时间提升至秒级。应用场景 网络性能问题定位 通过网络全链路数据监控,及时发现网络问题,定位故障链路问题节点,辅助用户进行...

主备切换

常见问题 Q:实例故障触发主备切换的原理是什么?A:依赖高可用HA(High Availability)系统的探活机制实现故障检测,具体如下:主要事件 说明 健康检测 HA系统会探测确认主备节点健康状态。主节点异常 发现主节点不可用,会将备节点提升为...

主备切换

常见问题 Q:实例故障触发主备切换的原理是什么?A:依赖高可用HA(High Availability)系统的探活机制实现故障检测,具体如下:主要事件 说明 健康检测 HA系统会探测确认主备节点健康状态。主节点异常 发现主节点不可用,会将备节点提升为...

可观测

是变更人主动并及时发现问题,降低重大故障影响半径的有效方式之一。变更观测是变更执行人的基础工具之一,变更可观测能力是对变更系统最基础的要求。变更观测三大原则 变更执行期间需有效观测:变更系统逐步实现强管控,所有变更从第1批...

常见问题旧版索引

本文介绍容器服务ACK的常见问题。您在使用容器服务ACK时如果收到容器服务ACK返回的错误信息,可查阅 容器服务ACK错误码 匹配解决方案。如果您没有收到具体的错误信息,可根据以下问题分类匹配问题场景和解决方案。入门FAQ 方案规划 容器...

iOS API相关问题排查步骤

常见的内容:「用户反馈」的extInfo作用是什么?举例:「用户反馈」的extInfo作用是什么?相关开放的接口,可以先自己在Demo里尝试使用后,看看能否得知该接口的含义;extInfo是个NSDictionary类型,应用自定义扩展信息,里面的信息可以...

使用ACK AI助手进行故障排查和智能问答

若ACK AI助手无法定位问题的根因并提供可用的解决方案,您可以发起进一步发起诊断,对异常的Pod、Node节点发起基于ACK技术专家诊断经验的深度故障诊断功能。更多信息,请参见 使用集群诊断。前提条件 已开通 容器服务 Kubernetes 版 并已...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,数据库、MQ等中间件异常事件),以及集成各业务自建的定位工具能力,并在故障及风险预警的应急过程中进行可疑原因定位,帮助促进故障及风险预警初因定位的时长缩短。...

日志聚合多维指标智能巡检

当服务器出现问题时,日志服务将展示QPS、延时、出入流量、成功率等不同维度指标的变化,并通过钉钉群通知给运维人员,便于运维人员及时判断故障,解决问题。SLB 7层访问日志示例如下图所示。步骤一:创建智能巡检任务 登录 日志服务控制台...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

功能优势

丰富的故障场景 丰富的故障场景也是 AHAS Chaos 的一大特色,包括了以下场景:常见的基础设施资源例如CPU、内存、磁盘等。应用级别的故障注入,目前只支持 Java 应用,后续将陆续推出对于 NodeJs 和 C++ 的应用故障注入。云原生领域的演练...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

模块开通

多活容灾MSHA(Multi-Site High Availability),是在阿⾥巴巴电商业务环境演进出来的多活容灾架构解决⽅案,可以将业务恢复和故障恢复解耦,有灵活的规则调度、跨域跨云管控、数据保护等能力,保障故障场景下的业务快速恢复,助⼒企业的容...

托管节点池节点自动恢复

故障:当前节点发现故障。恢复失败:当前节点无法恢复。当节点的运行状态发生变化并持续一段时间后,ACK将判定该状态符合故障状态,存在节点故障。当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成...

多维指标智能巡检

当弹性公网IP出现问题时,日志服务将展示入方向数据包速率和出方向数据包速率等不同维度指标的变化,并通过钉钉群通知给运维人员,便于运维人员及时判断故障,解决问题。EIP指标数据如下图所示。步骤一:创建智能巡检任务 登录 日志服务...

人力家:用云效搭建一站式发布工具链持续降本提效

引入云效之前,数据由PM手工收集整理,这些数据包括:每个需求的记分卡、完成情况、工时,代码评审问题记录,线下缺陷,线上故障,安全问题等。这些记录散落在各个地方,有的在审批单里,有的在Excel表里,收集起来费时费力。引入云效后,...

新手指引

本文介绍了轻量应用服务器的基础知识、快速使用流程、控制台的使用指引、计费方式、以及新手用户常见问题等,帮助您快速上手轻量应用服务器。了解产品 您可以通过产品概念、产品优势、应用场景等方面初步了解轻量应用服务器。什么是轻量...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

什么是消息演练

定位故障根源:经过消息演练之后,积累了消息系统的处理经验,对于未来的系统诊断定位有参考和提升作用。消息的演练场景 消息服务通常是由不同的模块组成。例如,RocketMQ分为生产者Producer、消费者Consumer、服务集群Broker和注册中心...

诊断决策树

在左侧导航栏上,单击 故障诊断>诊断决策树。单击 新建,在 创建诊断决策树 页面,配置诊断决策树信息,包括决策树名称、描述,超时时间以及标签。单击 确认。编辑诊断决策树,否则节点将无法执行。单击目标诊断决策树名称进入详情页,开始...

iOS SDK接入

在这个集成教程中,我们使用已创建的Demo应用,向您展示如何快速地集成用户反馈组件功能。前提条件 在这个集成教程中,我们使用已创建的Demo应用,向您展示如何快速地集成用户反馈组件功能。一般地,您需要入驻成为开发者并且创建应用后,...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

监控、诊断故障排除

诊断错误 客户端应用程序会在请求发生错误时接收到服务端返回的相关错误信息,监控服务也会记录并显示各种错误类型请求的计数和占比。您也可以通过检查服务器端日志、客户端日志和网络日志来获取相关单个请求的详细信息。通常,响应中返回...

无法连接Windows实例

此处列举较为常见的问题原因,具体原因以现场排查结果为准。防火墙配置异常。远程访问端口的配置异常。CPU负载过高。安全组公网规则错误。修改管理终端密码后未重启ECS实例。数据盘挂载失败。客户端本地网络异常。运营商网络异常。网卡配置...

产品架构介绍

故障隔离:当局部Provider出现异常时,支持将异常的Provider进行故障隔离,保证所有机房内的Consumer均不会调用到异常的Provider,实现微服务流量的故障逃逸。单元化服务寻址:针对异地多活单元化架构,支持按照单元化规则寻址调用Provider...

NVMe协议介绍

NVMe共享盘可以帮助应用实现高可用、高并发、可扩展的业务,可以帮助基于传统SAN的业务无缝上云,共享盘常见的应用场景包括数据共享、高可用故障转移、分布式缓存加速、机器模型训练等。数据共享 NVMe最简单的应用场景为数据共享,当数据被...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

同城多活常见问题

本文介绍同城多活的常见问题以及解决方案。假设数据库主备,ECS双可用区部署,是否就是同城多活?和EDAS、MSE集群流量同可用区优先的差异和优势?消息是基于Shutdown机制实现多活么?数据库是两个机房各一个主备,还是主机房一主一备,备...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用