设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

人脸特征算法上云

IoT门禁服务向设备下发人脸权限时默认使用图片的方式,核心原因是为了更好的兼容性,下发图片后由端侧设备计算人脸特征值。之所以采用这种方式,是因为云、端算法不容易统一。直接下发图片的方式由于需要多次网络交互和本地计算,部署性能...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...

探针安装常见问题

常见问题 本文介绍了以下常见问题:AHAS架构感知和故障演练探针limits配置 ECS探针安装常见问题 容器服务安装ack-ahas-pilot常见问题1 容器服务安装ack-ahas-pilot常见问题2 容器服务安装ack-ahas-pilot常见问题3 容器服务安装ack-ahas-...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

附录:SOFAStack 产品目录

保险与监管报送 参与方多、业务复杂度高是该类业务的典型特征。SOFAStack 分布式事务历经十多年的演进历程,足以灵活应对各种场景,满足事务一致性要求,保证与各类业务完美结合。数据访问代理 数据访问代理(Open Database Proxy,简称 ...

风险视图

查看风险 登录 AHAS控制台,从左侧导航栏选择 故障演练>架构感知。在 场景视图 区域,单击 风险视图 的 查看视图,进入详情页。默认进入的是 缩略图 视图模式。将鼠标悬浮在图标上,可查看该产品需重点关注的TOP5风险和风险总数。在页面右...

混沌工程缓存实战系列-Redis

针对上面的假设结合系统特征,可以设计出以下的演练场景:Redis延迟增加20 ms,缓存累计耗时50*20=1000 ms,此时CartServiceRT小于配置的接口超时3000 ms,业务正常。Redis延迟增加80 ms,缓存累计耗时50*80=4000 ms,购物车内部查询继续,...

故障诊断

lastState.terminated.reason="OOMKilled"]|any'#对jq表达式的结果进行匹配,结果是否匹配'true'-type:regexp expression:"true"#问题严重等级:Critical/Warning/Info level:Critical#问题总结 summary:Pod因OOM被Kill#问题原因,支持...

什么是设备诊断

设备诊断是阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...

FeatureStore常见问题

本文为您介绍FeatureStore的相关问题...报错示例 报错原因 离线特征视图数据同步到在线图计算服务GraphCompute时不支持merge合并。解决方法 在同步数据节点运行publish_table时,设置mode为 'Overwrite'。相关操作,请参见 例行同步数据节点。

自动SQL限流

即使硬件设备或者网络出现故障,巡检系统也可以快速迁移、及时重启,保证服务稳定。但现有的这些手段几乎都是针对服务端的稳定性保证,来自业务端的异常使用造成的问题还需要人工介入处理,比如业务变化中引入了新的慢SQL,突然涌入的洪峰...

概览

什么是智能阈值 智能阈值基于机器学习算法动态识别历史数据模式特征(例如:监控指标的周期性、整体趋势和波动大小等),并融合具体的云产品的监控指标信息,自动针对每个实例计算出上下阈值的报警边界。应用场景 在不同业务场景下,云资源...

常见问题

PolarDB 每个节点都有一个故障切换(Failover)优先级,决定了故障切换时被选举为主节点的概率高低。当多个节点的优先级相同时,则有相同的概率被选举为主节点,详情请参见 自动/手动主备切换。备份与恢复 Q:PolarDB 采用什么备份方式?A...

如何排查Java场景下故障注入不生效的问题

为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,您需要先确认该演练的故障执行步骤是否已开启Debug模式。若...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

播放异常自主排查

异常无明显分布特征:异常产生原因比较复杂或被数据量所掩盖,需要从内容到人的业务链路重要节点逆向排查,逐步定位问题节点以追溯原因。步骤一:排查端 终端设备兼容性 首先判断当前音视频流的协议是否为操作系统与应用环境所支持,若不...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

播放异常自主排查

异常无明显分布特征:异常产生原因比较复杂或被数据量所掩盖,需要从内容到人的业务链路重要节点逆向排查,逐步定位问题节点以追溯原因。步骤一:排查端 终端设备兼容性 首先判断当前音视频流的协议是否为操作系统与应用环境所支持,若不...

播放异常自主排查

异常无明显分布特征:异常产生原因比较复杂或被数据量所掩盖,需要从内容到人的业务链路重要节点逆向排查,逐步定位问题节点以追溯原因。步骤一:排查端 终端设备兼容性 首先判断当前音视频流的协议是否为操作系统与应用环境所支持,若不...

Windows操作系统云虚拟主机耗资源(客户程序故障)...

本文主要介绍Windows操作系统云虚拟主机耗资源(客户程序故障)问题的原因分析及处理意见。调用Access程序问题(最常见)原因:Access数据库大小超过30M,频繁调用时耗用系统资源。解决方法:将数据库大小压缩到30M以内,或者升级到SQL ...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

运维服务内容说明

因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

错误码

遇到该错误的通常原因是数据节点故障,请联系技术支持。PXC-4108 ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW 描述:变量(variable)不允许被设置为NULL。示例:ERR-CODE:[PXC-4108][ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW]System ...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

板块地图

例如:全国各省的设备数量分布情况、新冠疫情的确诊情况等,帮助您了解指定事件的区域分布特征。本文介绍板块地图组件的详细配置方法。步骤一:添加组件 创建Web应用。具体操作,请参见 创建Web应用。在Web应用编辑器中,单击最左侧的组件...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

Quick BI色彩地图部分省份不显示

问题描述 Quick BI色彩地图部分存在数据的省份在地图上不显示。问题原因 因为取整计算的色阶两端是整数(向下取整),最大值和最小值会受影响,中间值只是落在的区间有些微的差异。解决方案 数据映射区间的“取整”复选框取消选择。适用于 ...

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

故障排查

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 Web应用防火墙 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用