一致性复制组概述

容灾站点 除了生产站点以外另外建立容灾站点,当生产站点发生故障时,容灾站点可以接管业务,实现业务不间断。恢复点目标(RPO)由于云盘异常可能丢失的数据量,以时间为单位,是异步复制功能的数据指标之一(一致性复制组功能的RPO默认为...

EMR Kafka磁盘故障运维

当磁盘发生故障时,应及时完成相关故障的处理,及时恢复集群的容错能力。磁盘运维概述 本文从磁盘监控和磁盘故障恢复角度来介绍磁盘运维策略。磁盘监控 以下内容从Kafka服务层面以及ECS系统层面来简单了解一下磁盘的监控策略。Kafka服务...

CentOS系统时区错误的排查思路

概述 本文主要介绍CentOS系统时区错误的排查思路。详细信息 CentOS系统时区错误,显示为UTC时区,以下为...将正常服务器/usr/share/zoneinfo/Asia/Shanghai 文件拷贝到故障服务器后,执行 date 命令,确认时区恢复正常。适用于 云服务器ECS

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

ECS灾备解决方案

为了保障企业业务稳定、IT系统功能正常以及数据安全,灾备解决方案变得越来越重要,并且正在迅速...即使其中一台ECS服务器故障或资源利用超负荷,服务仍然可以持续对外提供,从而保障业务的连续性和可用性。更多信息,请参见 部署高可用架构。

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用性的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

诊断决策树

对于已知的明确故障,可以根据诊断现象,编排诊断决策树,进而故障发生时执行,完成故障定位。对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 ...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

云盒计算资源配置最佳实践

本文介绍如何配置云盒计算资源,在满足业务需求的同时,有效降低成本,并提升硬件风险应对能力。背景信息 云盒的硬件设计中,各类硬件设备的保障...关于如何授权维修以及维修相关流程,请参见 响应云盒维修事件 和 云盒故障服务器维修流程。

重要参数

参数 说明 enableVideo 是否发布本地视频到视频服务器。enableAudio 是否发布本地音频到视频服务器。SubscribeParam 订阅音视频流。手动订阅的场景下,是否订阅音视频。参数 说明 enableVideo 手动订阅的场景下,是否订阅视频。enableAudio...

什么是MX解析?

当您的域名解析记录中存在多条MX记录的时候,邮件发送方的服务器会优先把邮件投递到MX优先级最高的服务器,当此服务器出现故障无法接收邮件的时候,发送方的服务器会自动选择下一个优先级最高的服务器,直到邮件投递成功,或者所有服务器都...

配置负载均衡实例

创建负载均衡实例后,您需要对负载均衡实例进行配置才能进行流量转发,您需要添加至少一个监听和一组后端服务器。本指南指引您配置一个TCP监听并添加部署了静态网页...这表明在单台后端服务器出现故障时,负载均衡仍然能够保证业务的可用性。

服务器迁移至轻量应用服务器

服务器迁移中心支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)、IDC服务器、虚拟机和其他云平台的云主机迁移至阿里云轻量应用服务器。本文介绍如何将其他厂商轻量服务器迁移至轻量应用...

服务器迁移至轻量应用服务器

服务器迁移中心 支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)迁移至阿里云 轻量应用服务器。本文介绍如何将其他厂商轻量服务器迁移至轻量应用服务器。前提条件 已导入迁移源信息。您...

灾备规划

如果您的AD服务器是集中部署在一个数据中心,可能发生同一时间离线的情况,建议您:用混合云灾备一体机保护AD服务器,在云下发生故障时首先恢复这台AD服务器。在云上VPC里部署一个从AD服务器,与云下的主AD服务器保持连接。云下发生故障时...

移动推送到达率能达到多少

但是,实际的推送到达率,会受到很多因素影响的,例如:第三方推送服务器故障,导致 mPaaS 向其推送信息的失败。第三方推送服务器与设备端的问题,导致信息未能成功送达。推送服务器与互联网间的通讯问题,导致信息未能成功送达。用户...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

管理通话应用

设置媒体流代理服务器后,音视频流数据将通过该代理服务器进行转发。重要 代理服务器地址错误会导致音视频通话异常,若无必要请勿填写。配置时需分别填入服务器地址和地址对应的出网 IP,请确保输入的地址准确。媒体流代理服务器地址格式为...

围绕混沌工程的平台实践

因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实可能发生故障来考量系统的稳定性。混沌工程和AHAS Chaos AHAS Chaos是以混沌工程为理论指导的故障演练平台,目标是成为混沌...

负载均衡调度算法介绍

负载均衡会根据配置的调度算法,将来自客户端的请求按照对应的算法规则转发至相应的后端服务器。负载均衡支持轮询、加权轮询、加权最小连接数、一致性哈希等多种调度算法,用于支持不同的业务场景。本文列出所有负载均衡系列产品支持的调度...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

客户端上传SDK概述

可通过设置获取上传地址和凭证相关接口StorageLocation参数实现 媒资管理 支持设置元数据,如媒体标题、媒体标签、媒体分类、视频封面等。可通过获取上传地址和凭证相关接口的参数(如Title、Tags、CateId、CoverURL等)设置。音视频转码 ...

获取上传地址和凭证

上传地址和凭证是视频点播服务下发的上传媒体文件到视频点播存储的文件地址和授权凭证。相对于STS方式,使用上传地址和凭证上传媒体文件拥有很多优势。更多信息,请参见 凭证方式与STS方式对比。如需使用STS方式,请参见 获取STS临时Token...

重要参数

本文介绍音视频通话 API 在接入 Android 时涉及的重要参数。参数 说明 CreateRoomParams 创建房间。JoinRoomParams 加入房间。PublishConfig 发布媒体流。UnpublishConfig 取消订阅。SubscribeConfig 订阅媒体流。UnsubscribeConfig 取消...

网络资源

故障转移:当主要DNS服务器发生异常时,能够自动切换到备份DNS服务器,确保域名解析的连续性和稳定性。防火墙配置错误 指在配置防火墙规则时出现错误或不完整的情况,导致防火墙无法正确地过滤和控制网络流量。配置错误可能导致防火墙无法...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达率 100%。发布 H5 离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...

如何解决MSE Nacos实例域名无法解析的问题?

应用节点所配置的DNS服务器或NameServer故障,特别是Kubernetes集群所依赖的CoreDNS故障,导致无法解析MSE域名。解决方案 方案一:使用dig命令 执行如下命令安装dig工具。yum install-y bind-utils 如下代码所示,使用 dig 命令,尝试解析...

产品高可用

最佳实践:会话同步可以保证长连接不受集群内服务器故障的影响,但是对于短连接或连接未触发会话同步规则时(未完成三次握手),集群内的服务器故障仍可能会影响用户请求。为了防止集群中某台机器故障导致的会话中断,您可以在业务逻辑中...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

产品架构

基础架构说明 负载均衡作为流量转发服务,将来自客户端的请求通过负载均衡集群转发至后端服务器,后端服务器再将响应通过内网返回给负载均衡。阿里云当前提供四层和七层的负载均衡服务。四层采用四层专用集群+keepalived的方式实现负载均衡...

客户端离线排查

如果DNS服务无法运行,重启您的服务器,或者检查服务器DNS服务是否有故障。检查服务器是否设置了防火墙ACL规则或阿里云安全组规则。如果有,请确认已将云安全中心的服务端IP加入防火墙白名单(仅出方向需添加,入方向无需配置)以允许网络...

ListInstances-获取实例列表

接口说明 通过此接口可查看指定地域下一个或多个实例的详细信息,包括服务器名称、公网 IP 地址,内网 IP 地址,服务器创建时间、服务器到期时间等信息。QPS 限制 本接口的单用户 QPS 限制为 10 次/分钟。超过限制,API 调用会被限流,这...

错误码和状态码说明

服务器的响应必须包含有关响应中所发生的冲突的信息。服务器在响应与前一个请求相冲突的Put请求时可能会返回此状态码,同时会提供两个请求的差异列表。411 需要有效长度 服务器不会接受包含无效内容长度标头字段的请求。412 未满足前提条件...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 视频点播 负载均衡 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用