性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

使用ACK Net Exporter定位网络问题

该功能需要满足以下条件:操作系统内核为4.10以上版本。至少安装了以下任意一项文件。已安装对应的kernel-debuginfo文件(内核调试信息的数据文件)。具有携带debug信息的vmlinux文件(操作系统内核编译后且未经过压缩的原始文件)。已安装...

使用报警服务

使用阈值报警回调 云监控除了 电话、短信、邮件和WebHook的报警通知方式外,还可以使用报警回调方式,实现将云监控发送的报警通知集成到已的运维系统或消息通知系统。报警通知合并 当同一个阿里云账号的多个资源在同一报警规则和周期内...

附录:SOFAStack 产品目录

只要保证消息格式不变,消息的发送方和接收方并不需要直接连接,任何一方的系统故障都不会对其他应用产生影响。分布式事务的数据一致性 应用解耦后还需要确保数据的最终一致性,利用消息队列事务消息和消息的可靠传递机制,可以在实现系统...

设置SSL加密

openssl x509-in {CA证书路径}/ApsaraDB-CA-Chain.pem-text 关闭SSL加密 重要 关闭SSL加密会重启RDS实例,系统会触发主备切换降低影响,但仍建议您在业务低峰期操作。访问 RDS实例列表,在上方选择地域,然后单击目标实例ID。在左侧导航栏...

迁移可用区

常见问题 Q:迁移过程中发生数据写入,切换后对原有数据是否影响?对于迁移过程中新写入的数据,切换后新数据是否还会保留?A:原有数据不会影响;对于迁移过程中新写入的数据会保留。重要 迁移过程中会出现实例切换,请确保应用具有...

管理运维事件

前提条件 您需要登录 消息中心,确保 云数据库故障或运维通知 的通知开关处于开启状态并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。注意事项 事件等级 为 严重 的运维事件需要优先关注。DTS的运维事件...

数据转发到AMQP服务端订阅消费组

常见问题 如何在物联网平台上实现设备连接和状态同步?设备上报的十六进制的数据可以通过AMQP服务端订阅吗?一个消费组对应一个AMQP消息队列吗?一个设备可以只对应一个AMQP消息队列吗?AMQP服务端订阅设备上报消息后,为什么收不到RRPC...

数据转发到AMQP服务端订阅消费组消费

前提条件 已创建产品。已创建设备。已创建消费组,作为数据转发目的地。您可使用物联网平台默认消费组(DEFAULT_GROUP)或创建消费组。已添加待转发的设备Topic数据源。例如:创建数据源 DataSource,添加指定设备的 物模型数据上报 Topic...

故障止损恢复

人工梳理预案:通过全面梳理故障场景及风险场景的可用降级预案来达到该场景触发故障时,系统自动推荐前期关联的预案,提供故障群内一键执行的方式,也提供设定执行条件,符合条件系统自动执行的方式。通用垂直专项快恢能力:通过集成包括...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

邮件推送常见退信代码及处理方法

邮件投递成功返回码 邮件投递成功,邮件推送或邮件接收方返回成功。返回码:250 send mail ok,表示邮件请求操作完成,邮件到达收件方服务器。邮件投递成功,接收人反馈没有收到,处理方法:请接收方检查邮件是否被放入了垃圾邮件夹。请...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

使用ASM构建分布式系统的容错能力

分布式系统存在高度复杂性的特点,在基础设施、应用逻辑、运维流程等环节都可能存在稳定性风险而导致业务系统的失效。因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统的...

使用ASM构建分布式系统的容错能力

分布式系统存在高度复杂性的特点,在基础设施、应用逻辑、运维流程等环节都可能存在稳定性风险而导致业务系统的失效。因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统的...

Windows实例中数据恢复

本文介绍了Windows系统常见的数据盘分区丢失的问题以及对应的处理方法,同时提供了使用云盘的常见误区以及最佳实践,避免可能的数据丢失风险。前提条件 已注册阿里云账号。如还未注册,请先完成 账号注册。在修复数据前,您必须先对丢失...

测试指标

集群 对于使用集群方式的系统,主要通过以下方式考量其集群可靠性:集群中某个节点出现故障时,系统是否业务中断情况出现。在集群中新增一个节点时,是否需要重启系统。当故障节点恢复后,加入集群,是否需要重启系统。当故障节点恢复后...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

创建操作系统迁移任务

导入迁移源信息后,SMC控制台会自动生成迁移源记录,您需要在控制台为迁移源创建操作系统迁移任务,并完成操作系统的迁移。说明 关于操作系统迁移的更多信息,请参见 操作系统迁移(Linux)和 操作系统迁移(Windows)。前提条件 已导入...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

微服务强弱依赖治理

在应用强弱依赖治理的基础上,微服务强弱依赖治理功能,通过接入MSE,可分析出应用所依赖的Dubbo、Spring Cloud服务,并能够快速的发起方法级别的故障注入,帮助您快速分析出应用与所依赖的各种方法之间的强弱依赖关系。本文介绍如何进行微...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

管理报警

数据库备份DBS 已接入云监控平台,通过对重要的监控指标设置报警规则,让您及时得知指标数据发生异常,帮您迅速定位处理故障。报警说明 报警配置项 说明 报警触发条件 关闭增量日志备份、开启增量日志备份、增量备份异常、备份网关离线、...

通知设置

如果要修改已信息接收人的信息,您需要单击 基本接收管理 页面右上角的 消息接收人管理 修改相应联系人的信息。具体操作,请参见 消息接收管理设置。保存成功后,更改后的消息接收人配置会立即生效。说明 未验证过的联系人需要经过验证后...

功能概述

③ 容灾演练或流量切换完成后,如希望恢复到执行前的访问策略,那么可以通过 回滚功能 实现,操作回滚,系统则会将故障地址池中的地址恢复为“智能返回”的工作模式,并会恢复访问策略。使用指南您可以参阅 容灾预案 文档。

产品简介

管理系统历史所有升级的故障(人为手动升级或系统自动触发);支持故障全生命周期管理,包括通知、处理、Timeline记录、改进、预防;报警、事件、故障全链路数据在线化管理,实现业务运营的可视化、在线化、智能化管理。升级策略 针对所有...

应用强弱依赖治理

前提条件 需要安装探针才能识别到应用,如未安装请参见 管理探针。背景信息 如果您想快速分析应用与所依赖的各种方法之间的强弱依赖关系,请参见 微服务强弱依赖治理。创建强弱依赖治理 登录 AHAS控制台,在左侧导航栏选择 故障演练>演练...

设置SSL加密

为提高链路的安全性,您可以启用SSL(Secure Sockets Layer)加密,然后安装SSL CA证书到您的应用服务。SSL加密功能在传输层对网络连接进行加密,在提升通信数据安全性的同时,保证数据的完整性。前提条件 实例的部署模式为 经典 版(原本...

设置SSL加密

为提高链路的安全性,您可以启用SSL(Secure Sockets Layer)加密,然后安装SSL CA证书到您的应用服务。SSL加密功能在传输层对网络连接进行加密,在提升通信数据安全性的同时,保证数据的完整性。前提条件 Redis实例部署模式为 经典 版。...

常见问题

本文汇总了 PolarDB 数据库代理相关的常见问题。读写分离 Q:为什么刚插入的语句,立即查的时候查不到?A:读写分离的架构下,主节点和只读节点之间复制会延迟,但 PolarDB 支持会话一致性,即同一个会话内保证能读到之前的更新,详情请...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

网络资源

网络资源是流量入口和数据交互的基础设施,常见的网络资源风险点如下:网络带宽不足 指网络连接的带宽无法满足系统或应用程序的需求,导致网络传输速度慢,影响系统的响应和性能。针对网络资源带宽不足的情况:带宽监控预警:实时监控网络...

常见问题

本文汇总了 PolarDB 集群访问相关的常见问题。Q:如果应用程序使用 PolarDB 公网地址连接数据库,产生的流量需要收费吗?A:阿里云不会对 PolarDB 公网地址产生的流量进行收费。Q:一个集群最多允许创建多少个单节点集群地址?A:一个集群...

基本概念

通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。API 应用程序编程接口,是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。API 分组 用于将 API 进行逻辑的分组,分组下的 API 使用相同的分组...

应用场景

秒杀处理系统按照秒杀处理逻辑将满足秒杀条件的请求发送至 云消息队列 RocketMQ 版。下游的通知系统订阅 云消息队列 RocketMQ 版 的秒杀相关消息,再将秒杀成功的消息发送到相应用户。用户收到秒杀成功的通知。大规模机器的缓存同步 双十一...

公共云基础服务说明书

阿里云售后团队向客户提供的关于第三方软件的建议只适用于经验的系统管理员或其他相关IT人员。阿里云不负责以上第三方软件的安装、调试或更新,或对建议的实施。第三方软件目录及问题服务范围举例:第三方软件目录 服务范围:示例 非服务...

监控、诊断和故障排除

客户端错误问题 客户端授权错误请求增加 当监控中的客户端授权错误请求数增加,或者客户端程序接收到大量的403请求错误,那么最常见的可能原因以下几个:用户访问的Bucket域名不正确 如果用户直接用三级域名或者二级域名访问,那么可能的...

设置安全消息接收人的最佳实践

步骤一:在消息中心设置安全消息接收人 订阅站内信、邮箱、短信的安全消息 添加联系人作为安全消息的消息接收人,该联系人根据通知方式,可以接收来自邮件、短信 或站内信渠道的安全通知提醒。登录 阿里云消息中心。在左侧导航栏,选择 ...

在EMQX服务器配置私有证书单向认证

不同的操作系统、服务器或客户端设备,部署操作可能有所差异,如问题,请联系产品技术专家进行咨询,详情请参见 专家一对一服务。前提条件 已通过阿里云私有CA服务申请服务端证书。具体操作,请参见 申请私有证书。说明 本文是以阿里云...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数字证书管理服务(原SSL证书) 智能语音交互 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用