应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用性的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

混合云解决方案

如果MASTER 宕机,发生故障转移,此时SLAVE如果要提供服务,日志读取器会等待镜像日志先同步,再做发布,但如果MASTER发生硬件故障,此时SLAVE需要打开一个跟踪标记1448,在镜像故障的情况下可以继续分发数据。说明 1448标记用于在事务...

基本概念

例如,某项任务完成的信息,或者设备发生故障或告警时的温度等,事件可以被订阅和推送。数据解析脚本 针对采用透传格式/自定义数据格式的设备,需要在云端编写数据解析脚本,将设备上报的二进制数据或自定义的JSON数据,转换为物联网平台...

ping不通云服务(SAG-100WM)

介绍SAG-100WM设备 ping 不通同云企业CEN(Cloud Enterprise Network)的云服务器ECS(Elastic Compute Service)或同云连接CCN(Cloud Connect Network)内的客户端的处理方法。问题现象 终端无法连接到阿里云。例如 ping 不通同CEN的...

诊断决策树

对于已知的明确故障,可以根据诊断现象,编排诊断决策树,进而故障发生时执行,完成故障定位。对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 ...

云边通信组件Raven概述

边缘云场景中,计算设备往往分布在多个隔离的地域和网络。因此,集群中的边缘设备往往采用分组管理,导致了不同分组的节点之间以及其下应用之间网络不互通等隔离性问题。为提升云边运维和监控能力,ACK Edge集群 引入了云边通信组件Raven...

ping不通云服务ECS(SAG-1000)

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转...

MoveHostsToNetworkDomain-批量将主机移入指定网络

批量将主机移入指定网络。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 类型 必填 描述 示例值...

什么是云拨测

故障定位与诊断:云拨测利用先进的Traceroute诊断技术,快速发现并定位网络故障,提供详细的故障报告和解决建议。实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过...

批量将数据库移入指定网络

批量将数据库移入指定网络。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 类型 必填 描述 示例...

API概览

网络(仅支持V3.2.40及以上版本使用)API 标题 API概述 CreateNetworkDomain 创建网络 创建网络。GetNetworkDomain 获取指定网络详情 获取指定网络详情。ListNetworkDomains 获取指定堡垒机下网络列表 获取指定堡垒机下的网络...

常见问题FAQ

10.右上角固网/WIFI局域连接异常 故障示意图如下:设备显示固网/WIFI局域连接异常。该问题为设备与路由器之间的本地连接故障。如是固网接入。请按顺序检查:1.设备与路由器两端的RJ45插头是否松动。2.更换一根网线。3.重启路由器。4....

集群高可用架构推荐配置

多可用区的地域:所有托管组件均严格采用多副本、多AZ均衡打散部署策略,确保在单个可用区或节点发生故障时,集群仍然能够正常提供服务。单可用区地域:所有托管组件均严格采用多副本、多节点打散部署策略,确保在单个节点发生故障时,集群...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

变更管理简介

有计划、受管控的变更操作降低故障发生率、业务连续性异常。规范变更准备及变更方案,提高变更成功率与可靠性。变更有记录,所有变更可回溯。核心功能 针对变更操作的审批管控以及所有变更记录 基础配置:支持自定义配置变更系统、变更类型...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

资源调度概述

功能 描述 参考文档 Pod拓扑分布约束 您可以使用拓扑分布约束(Topology Spread Constraints)控制Pod 在集群内故障域之间的分布,有助于实现高可用或者节省成本。目前ACS支持可用区(Zone)拓扑。可用区打散及亲和调度 Pod间亲和与反...

堡垒机的审计事件

CreateNetworkDomainProxy 创建网络代理服务器。CreatePasswordTask 创建改密任务。CreatePolicy 创建控制策略。CreateRdsHosts 创建RDS类型的主机。CreateRule 创建授权规则。CreateShareKey 创建共享密钥。CreateUser 创建用户。...

消息通知

网络代理告警通知 当网络代理服务异常时,堡垒机将发送消息通知。说明 在堡垒机中创建网络且使用代理的连接方式来添加代理服务器后,堡垒机会每五分钟检测一次代理服务器的连通性。更多信息,请参见 网络。运维审批通知 运维员进行...

异地双活切流

说明 单元(地域)出现大面积故障,将故障单元(地域)的流量切0,主数据库在该单元(地域)的切换到正常单元。a.选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA会自动将该单元的流量置0,将另一个单元置为100。b.单击 下...

产品架构介绍

多活流量必须经过接入层,以便在故障发生时,通过接入层切换入口流量。比例分流:接入层支持按比例将流量分流到机房。特殊场景下,可以将机房流量切零,从而实现故障情况下的流量切换。精准路由:接入层支持根据HTTP请求Header/Cookie/...

基本概念

安全编码一般按照业务-地点-角色,比如在西溪IT部门负责教育业务,可定义为JY-XX-IT,当然我们也可以遵照自己的规则定义,限制为:仅支持大写字母、数字、下划线及中划线拼写的编码。配置管理 配置管理指对网络设备、业务承载服务器、...

支持的地域

如果堡垒机与ECS实例不在同一地域,一般情况下无法实现内网互通访问,需要打通网络或者使用堡垒机的网络功能。资源价格 根据您的预算选择合适的地域。不同地域的资源价格可能有差异,更多信息,请参见 计费方式。支持的地域列表 区域 ...

版本说明

提供了跨故障域的软亲和策略;ADP-Local支持白屏化的应用存储备份;ADP-Local支持组件诊断资源分析;ADP-Local支持组件日志聚合查询和统计;ADP-Local新增白屏化运维操作:通用PVC存储扩容、Redis水平扩容、RocketMQ垂直扩缩容、MySQL自动...

AIOps 解决方案专家服务内容说明

根据智能AI算法和阿里多年积累的AIOps经验,在故障发生后,提供自动化解决方案。在方案设计中我们提供包括时序预测和根因分析、历史数据预测的3大类算法场景的设计,更多具体算法详见《10.1算法列表》《智能故障发现设计方案》3 定制化业务...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

功能特性

查看同流量分析 网络监测与诊断 帮助用户在云上运维阶段更高效地监测网络业务变化和故障诊断排查。功能集 功能 功能描述 参考文档 事件中心 问题事件 展示已经造成业务受损,并且7天内状态一直处于进行中的异常事件列表。查看问题事件 ...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全故障恢复时间=故障发现时间+全生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

网络资源

网络资源是指用于节点之间通信和数据传输的硬件和软件资源,除了包括广域、局域、交换机、路由器,还包括常用到的专有网络、虚拟交换机、负载均衡、弹性公网、VPN、DNS、CDN等资源。在分布式系统中,网络资源的主要作用是支持节点之间...

教育培训行业

但实际开班时人数会发生变化,经常并未完全坐满,导致有部分电脑闲置 设备利用率低:随着课程变化需要经常更换设备,投资回报率低 运维效率低:整体设备运维缺乏高效易用的解决方案,出现故障恢复时间长,耽误教学时间 在线教育:营销课...

实例之间无法互相访问AD或同时加入AD怎么办?

本文介绍如何解决实例之间无法互相访问AD,或者无法同时加入AD的问题。问题描述 使用同一个Windows Server镜像创建几台ECS实例后,实例之间无法互相访问AD,或者无法同时加入AD。问题原因 使用同一个Windows Server镜像的几台实例...

组播概述

例如在线直播、视频会议、金融交易行情数据同步、远程教育和网络电视等。组播的优势 在点对多点的网络通信场景中,相对于单播和广播通信模式,组播通信模式可以帮助您减轻服务器负载并提高带宽的利用率。以在线直播场景为例,为您介绍单播...

附录:SOFAStack 产品目录

传统实现方式是在系统代码里指定任务的执行顺序,当业务发生变化时需要修改代码才可以正常工作,可维护性很差。使用 SOFAStack 任务调度中的任务编排功能,可以轻松完成任务之间的依赖调整,大大提高了可维护性,并可以直观地看到任务的...

迁移可用区

例如,单可用区实例可以承受服务器和机架级别的故障,而多可用区实例可以承受机房级别的故障。说明 对于包含主备节点的实例,建议迁移至多个可用区,实现实例的跨可用区容灾。从多个可用区迁移至一个可用区 为了满足特定功能的要求。操作...

解析设置类常见问题总结

答:DNS解析过程,各记录类型之间是有优先级的,所以在主机记录相同、解析线路相同的情况下,有几种记录类型是不能共存使用,否则会给用户造成配置风险,导致业务不可用的情况发生。您可以参阅 解析记录冲突规则 文档。添加记录时,提示A和...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

配置设备级高可用

当主网关设备发生故障时,HA机制能够从备份的网关设备中选举一台设备成为新的主网关设备,用来承担数据流量,从而保障网络的可靠通信。动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。...

灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全故障恢复时间=故障发现时间+全生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云企业网 弹性公网IP 共享流量包 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用