监控服务概览

OSS监控服务为您提供系统基本运行状态、性能以及计量等方面的监控数据指标,并且提供自定义报警服务,帮助您跟踪请求、分析使用情况、统计业务趋势,及时发现以及诊断系统的相关问题。OSS监控指标主要分为基础服务指标、性能指标和计量指标...

【升级公告】IPsec-VPN连接升级为双隧道模式

尊敬的阿里云用户,为提高VPN网关产品的使用体验,VPN网关产品将IPsec-VPN连接升级为双隧道模式,一个IPsec-VPN连接下将包含主备两条隧道,且两条隧道分布在不同的可用区,在主隧道故障后,流量可以通过备隧道进行传输,实现IPsec-VPN连接...

选择接入点

口,俗称裸光纤,运营商直接将传输网的路分给最终用户使用。路的速率理论上无限大,只取决于互联两端接口的模块协商速率,例如千兆、万兆、40 Gbps和100 Gbps。说明 不同接入点提供的端口类型不同,请在购买专线端口时仔细确认。...

独享专线连接前准备

口,俗称裸光纤,运营商直接将传输网的路分给最终用户使用。路的速率理论上无限大,只取决于互联两端接口的模块协商速率,例如千兆、万兆、40 Gbps和100 Gbps。说明 不同接入点提供的端口类型不同,请在购买专线端口时仔细确认。...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

强弱依赖治理概述

如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的时候,将导致商品详情页部分内容加载不,出现如下图的情况,但核心业务流程仍可继续推进,用户体验并未受到太多影响。通过以上对比可以看出,当下游依赖...

Gmail 投递帮助

Gmail发送者指南,请参考 文档。一、投递失败的原因 一般来说,投递失败会出于以下一种或多种原因:发送邮件...6、使用故障排除工具 如果按照本文中的指南进行操作后仍然遇到邮件传送问题,请尝试 对发件人的电子邮件传送问题进行故障排除

概述

优势 容灾备份,降低业务中断风险 主DNS系统故障,辅助DNS可继续提供域名解析服务,保障业务可用性。稳定可靠,保障业务稳定运行 云解析DNS提供100%SLA服务,全球DNS集群互相备份,服务永不宕机。全球节点,提升域名解析效率 节点遍布全球...

查看和运行SMC客户端

具体操作,请参见 故障排除。说明 如果您需要停止客户端迁移或修改客户端配置,可参考以下操作步骤退出SMC客户端。Linux Linux版本客户端默认在后台运行,可执行以下命令退出后台进程:./go2aliyun_client-abort Windows Windows版本客户端...

网络资源

网络资源是指用于节点之间通信和数据传输的硬件和软件资源,除了包括广域网、局域网、交换机、路由器,还包括常用到的专有网络、虚拟交换机、负载均衡、弹性公网、VPN、DNS、CDN等资源。在分布式系统中,网络资源的主要作用是支持节点之间...

社交互动最佳实践

方案优势:阿里云DCDN支持WebSocket协议的链路传输加速,在用户到 DCDN 节点以及 DCDN 节点到源站之间建立双工的通信,并创建长久性的连接,有效提升数据交换效率。同时,您可以通过IP应用加速,使用TCP/UDP作为底层传输协议,实现接入...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

模块故障

本文介绍模块发生故障的原因和处理方法。问题现象 模块连接后,接口指示灯没有变为绿色。可能原因 模块不兼容或损坏。智能接入网关设备支持的模块型号请参见 模块型号。说明 目前仅SAG-1000设备支持模块插入。解决方案 通用多...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

UpdateProjectConfig-更新项目配置

64 ThrottleRps integer 否 传输阶段限制能达到的最大传输速率,单位为记录数/秒。输入 null 时,表示不限制 RPS。null ThrottleIOPS integer 否 传输阶段限制能达到的最大传输流量,单位为字节/秒。输入 null 时,表示不限制 IOPS...

DescribeExcludeSystemPath-查询防勒索系统排除目录

查询防勒索系统排除目录。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

查看实例的系统日志和屏幕截图

系统通过串口打印输出的日志会包含两种类型的信息,一类是系统启动开机时的日志内容,另一类是系统内核故障或异常时的日志内容。更多详情,请参见《云栖社区》博客 操作系统有异常?诊断日志来帮忙。使用限制 使用该功能时您需要注意如下...

应用场景

一站式运维事件管理 应用场景 满足各类监控场景下报警统一事件化管理需求,支持集成对接各监控系统,支持服务器自定义推送异常事件,对报警、事件、故障进行流程一站式管理,提升企业运维效率。能够解决 多源监控集成:支持多个常见监控...

配置匹配规则

开启同步 DDL 功能后,当您使用 DDL 语句在源端创建一张新表或者修改一张表结构时,如果对应的表名在迁移/同步对象规则和排除对象规则的差集内,则该 DDL 语句可以被数据传输同步至目标端。库表汇聚场景下:建议您使用导入对象或匹配规则的...

管理集群

主机故障处理策略 设置主机故障系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 设置主机故障系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

概述

但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障、错误的变更、突发流量,甚至到光纤挖断、自然灾害等引起的整个机房不可用情况,如何保障系统稳定性具有很大...

系统故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

产品正式商业化发布

产品适用场景 一站式运维事件管理:满足各类监控场景下报警统一事件化管理需求,支持集成对接各监控系统,支持服务器自定义推送异常事件,对报警、事件、故障进行流程一站式管理,提升企业运维效率。体系化故障闭环管理:基于阿里多年...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

设计原则

因此,数据容灾对于企业来说是非常必要的,数据灾备是企业保护核心数据的重要手段,能有效降低勒索病毒、系统故障、自然灾害和运维事故导致的数据丢失和损坏问题,同时满足行业安全和合规要求,可以保障企业的正常运行和稳定发展。...

CreateProject-创建项目

本接口用于创建数据迁移或...null ThrottleIOPS integer 否 传输阶段限制能达到的最大传输流量,单位为字节/秒。输入 null 时,表示不限制 IOPS。null EnableIncrTransfer boolean 否 是否开启增量同步。true EnableReverseIncrTransfer ...

消息(Message)

消息持久化 云消息队列 RocketMQ 版 会默认对消息进行持久化,即将接收到的消息存储到 云消息队列 RocketMQ 版 服务端的存储文件中,保证消息的可回溯性和系统故障场景下的可恢复性。模型关系 在整个 云消息队列 RocketMQ 版 的领域模型中...

灾备方案

图 1.Tair 容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

演练场景说明

故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复...

配置健康检查

如果健康检查探测到物理专线链路故障系统默认会将当前物理专线的流量切换至其他任意一个正常的物理专线进行传输。在您配置健康检查时,您也可以通过健康检查的 切换路由 功能自定义是否允许路由切换。前提条件 您已经将物理专线关联的VBR...

同城容灾架构概述

基本原理 同城容灾是在相隔较远的两地(同城)建立两套功能相同的IT系统,当一处系统因意外(火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。对于中大型企业来说,如果希望业务系统具备同城容...

灾备方案介绍

图 1.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

PTS压测快速入门

演练阶段:在演练排查阶段,您需要对系统进行故障演练,进而发现并验证系统问题,锻炼系统及相关人员的应急能力,阿里云提供了 故障演练 平台帮助您演练预案。更多信息,请参见 什么是故障演练。容灾阶段:在容灾防护阶段,您需要构建系统...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 负载均衡 云安全中心 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用