主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

功能概述

访问策略 访问策略包括DNS智能解析、默认地址池/备用地址池、生效地址池切换策略等相关信息,一个GTM实例可以创建多个访问策略,可为不同网络或区域来源的访问用户设置不同的解析响应地址池,并最终实现用户就近访问接入和故障自动切换的...

AIOps 解决方案专家服务内容说明

面对云上甚至多云的复杂业务系统,运维人员经常会遇到技术栈繁杂、配置告警耗时长、设置指标告警遗漏、告警风暴以及故障定位耗时等一系列运维问题,最终可能导致严重的资损。智能运维又称AIOps,即人工智能与运维相结合,可通过机器学习的...

混沌工程缓存实战系列-Redis

配置完毕之后,可以发起自动演练、自动探测,最终得出结论(故障演练支持演练节点自动推进,也支持手动一步步推进)。验证结果。从演练执行结果可以看出,最终的运行结果和假设一致,当延迟注入80 ms之后,购物车不可用。但当延迟注入20 ms...

通信能力技术服务协议

阿里有权根据最终用户或第三方的投诉以及阿里对您服务的监督检查,自行决定您及其客户是否利用本服务从事不正当活动,并以此中止或终止向您提供服务。阿里有权在必要时变更部分或全部的服务功能,如功能变更可能引起日常服务的中断或终止,...

附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

访问策略

访问策略包括DNS智能解析、主地址池集合/备地址池集合、生效地址池集合切换策略等相关信息,一个GTM实例可以创建多个访问策略,可为不同网络或区域来源的访问用户设置不同的解析响应地址池集合,并最终实现用户就近访问接入和故障自动切换...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

多集群联邦发布容灾

部署单元状态:应用侧视角下,机房灾难最终会体现为部署单元(Cell)不可用,导致用户通过发布单发布应用服务时出现不符合预期的发布。机房灾难下的多集群联邦发布 对于应用发布而言,容灾场景下存在多种可选项。在发布单执行前,用户可...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

短信发送状态回执错误码

isv.CUSTOMER_REFUSED 用户已退订推广短信 原因:该手机用户已退订推广短信。解决方案:请尊重手机用户意愿,减少对该客户的推广短信发送。isv.SMS_TEST_SIGN_TEMPLATE_LIMIT 测试模板和签名限制 原因:测试专用签名和模板必须结合使用。...

通过站点监控功能监控DNS解析异常

但少数情况下从运营商递归DNS获取的域名解析结果不一定正确(即与域名持有人在权威域名解析服务器设置的域名解析指向地址不相同,例如:域名解析污染、域名解析劫持、权威DNS服务故障等情况),此时会导致用户无法正常访问服务。...

常见问题

A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前100%兼容PostgreSQL,存储容量最高可达100 TB。详情请参见 什么是PolarDB。Q:为什么 云原生...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

常见问题

A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前支持3种独立的引擎,分别可以100%兼容MySQL、100%兼容PostgreSQL、高度兼容Oracle语法,存储...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

ConnectionDisconnect

告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理方法 检查用户侧运营商网络接入是否正常。icmsDocProps={'productMethod':'...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

名词解释

另一方面是在⼀个数据中心发⽣故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,实现用户故障无感知。两地三中心 即生产数据中心、同城灾备中心、异地灾备中心建设方案。这种模式下,两个城市的三个数据...

配置RAM权限

AHAS支持对云服务器ECS(Elastic Compute Service)和容器服务ACK(Alibaba Cloud Container Service for Kubernetes)进行演练,为了控制被演练对象的范围,AHAS故障演练支持对RAM子账号进行授权配置。配置方法 使用阿里云账号登录 RAM...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

产品优势

与传统依赖人力的应用交付和运维方式相比,计算巢提供了智能高效、安全可靠的服务交付和运维体验,有助于提升服务商的服务能力、降低运营成本、提升用户的部署效率和降低用户管理软件和资源的成本。智能高效 计算巢集成了阿里云一系列底层...

故障处理流程

SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,查看运营商网络状态。硬件排查。查看安全组规则...

MSE注册配置中心高可用最佳实践

最终所有Provider节点故障,100%无法提供服务。有容灾保护 当来自Consumer端的请求量突然增加时,如果Provider容量水位较高,导致个别Provider发生故障:注册中心会将故障节点摘除,全量流量会给剩余节点。故障节点数达到保护阈值,流量...

强弱依赖治理概述

强弱依赖治理就是通过科学的手段持续稳定地得到应用间依赖关系、流量、强弱等数据,提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续推进系统稳定性提升。什么是强弱依赖?异常发生时,不影响核心业务流程,不...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

按步骤提交设备故障信息

本案例创建四个业务服务和一个Web应用,搭建一个设备故障上报的工单页面,引导使用Web应用的用户完成故障信息的提交。前提条件 已完成项目的创建(例如 project_space)。详细内容,请参见 项目。步骤一:使用云数据库创建数据库表 登录 云...

ID Mapping与用户唯一标识QAID

Quick Audience在V4的表数据导入、事件数据上报等流程中引入自动的ID Mapping环节,通过ID Mapping实现跨来源渠道、跨ID类型的用户身份识别、用户数据拉通。背景 您的Quick Audience数据池中可能有来源于多个渠道的同一个用户的数据,例如...

通用场景

在 概览 界面单击 新建投放计划,系统进入 新建投放计划 界面。...用户单击 最终消耗确认 时,如果没有媒体领取当前计划的任务,用户可以单击最终消耗确认,完成计划;有媒体认领后,必须上传数据才可以单击最终消耗确认完成计划。

通用场景

在 概览 界面单击 新建投放计划,系统进入 新建投放计划 界面。...用户单击 最终消耗确认 时,如果没有媒体领取当前计划的任务,用户可以单击最终消耗确认,完成计划;有媒体认领后,必须上传数据才可以单击最终消耗确认完成计划。

归档存储服务等级协议

阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)...

采集客户端数据的高可用方案

但是在一些相对极端的场景下,单集群可能由于一些预期外原因存在故障停服风险。针对该单集群故障风险,日志服务提供两种异地多活的客户端数据采集方案。方案比较 对比项 方案1:双写 方案2:数据加工复制+写入切换 部署复杂度 低 需要额外...

通话记录

IVR放弃 当用户来电进入IVR流程,但是最终用户没有选择所需的人工服务,就挂断了电话。排队放弃 当用户按键选择了所需的人工服务,但是对应的人工服务队列坐席全忙,没有进入任何坐席的工作台,此时用户挂断了电话。振铃放弃 当用户来电...

通话记录

IVR放弃 当用户来电进入IVR流程,但是最终用户没有选择所需的人工服务,就挂断了电话。排队放弃 当用户按键选择了所需的人工服务,但是对应的人工服务队列坐席全忙,没有进入任何坐席的工作台,此时用户挂断了电话。振铃放弃 当用户来电...

通过VNC/Workbench远程连接实例的问题

说明 用户名Administrator拼写错误属于远程连接失败的常见原因之一。忘记密码 请重置实例密码,然后使用新密码重新登录Windows实例。具体操作,请参见 重置实例登录密码。用户名和密码正确 请继续下一步检查。如果您曾经修改过Windows实例...

应用场景

服务安全 通过ASM,可以轻松实现服务之间的双向TLS认证:支持以渐进方式实现mTLS双向认证,可以确保服务间通信以及最终用户与服务之间通信的安全。双向TLS认证在实现过程中不需要更改服务代码,可以为每个服务提供基于角色的强大身份认证...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 物联网无线连接服务 商标服务 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用