混沌工程缓存实战系列-Redis

通过探针管理向Cart服务所在的机器安装演练探针。创建演练场景。本示例创建网络延迟的故障场景。登录 AHAS控制台,在左侧栏选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练>新建空白演练。在 演练配置 页面,填写相关参数,选择 ...

常见问题

运维管理 容器应用服务常见问题 经典应用服务常见问题 中间件 SOFABoot 常见问题 微服务常见问题 微服务故障排查之 DRM 微服务故障排查之限流 微服务故障排查之 RPC 服务网格-故障排查 消息队列常见问题 任务调度常见问题 分布式链路跟踪...

购买并启用软件密钥管理实例

本文介绍如何通过Terraform购买并启用KMS软件密钥管理实例。概述 购买并启用软件密钥管理实例时,您需要为该KMS实例绑定VPC以及交换机,也支持为该KMS实例关联多个VPC。配置完成后 生成CA实例证书,请您妥善保存,在应用访问KMS实例时需要...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

查询密钥和凭据的使用记录

KMS支持和操作审计、日志服务集成,记录密钥和凭据使用过程中的各种事件,用于故障排除、安全监控等。本文介绍如何查询密钥以及凭据的使用记录。背景信息 通常我们将密钥和凭据的事件分为两部分,一部分是管控类操作,例如密钥的创建、删除...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

基于多集群实现跨地域容灾和流量负载均衡

服务网格 ASM为应用服务提供了跨地域流量分布和跨地域故障转移能力。跨地域流量分布功能可以将流量按照设定的权重路由至多个集群,实现多地域负载均衡。跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨...

基于多集群实现跨地域容灾和流量负载均衡

服务网格 ASM为应用服务提供了跨地域流量分布和跨地域故障转移能力。跨地域流量分布功能可以将流量按照设定的权重路由至多个集群,实现多地域负载均衡。跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨...

动态与公告

功能/版本 历史版本GTM标准版 新版GTM标准版 新版GTM旗舰版 全网故障恢复时间=故障切换时间+全生效时间 在健康检查间隔设置为1分钟,TTL60秒,连续失败次数3次的配置下,GTM能在4分钟左右准确发现故障并切换,故障切换后理论上60秒左右...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

从TR专线迁移至ECR专线访问云资源

登录 云企业网管理控制台。在 云企业网实例 页面,找到目标云企业网实例,单击目标实例ID。在 基本信息>转发路由器 页签,找到目标地域的转发路由器实例,单击目标实例ID。在转发路由器实例详情页面,单击 转发路由器路由表 页签。在转发...

产品正式商业化发布

体系化故障闭环管理:基于阿里多年base ITIL实践经验沉淀的故障管理体系,满足企业重大故障的流程化、在线化管理需求,持续提升业务连续性。云钉运维协同:基于钉钉,进行运维问题的协同处理,提升信息流转效率,加速问题解决。更多能力...

SOFAMesh 服务网格总体经济影响报告

运维安全管理与灰度发布效率提升带来超过 50 万的成本节省。该企业在使用服务网格后,基础架构相关的故障从每年至少两起降为零起,节省了运维人员进行故障定位、修复的时间。同时,服务网格也提升了安全运维规则配置的效率,从一周 2 至 3 ...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

【Fault Injection】故障注入

故意破坏服务,以暴露弱点的测试方法可以提高容错能力,发现客户端的错误,或者识别您所面临的故障情况。服务网格 ASM支持故障注入,您可以使用虚拟服务在应用层进行测试。本文介绍如何配置故障注入。前提条件 已完成准备工作,并部署...

【Fault Injection】故障注入

故意破坏服务,以暴露弱点的测试方法可以提高容错能力,发现客户端的错误,或者识别您所面临的故障情况。服务网格 ASM支持故障注入,您可以使用虚拟服务在应用层进行测试。本文介绍如何配置故障注入。前提条件 已完成准备工作,并部署...

按量计费

(0-50]M/min 1.5/小时(50-100]M/min 3/小时(100-150]M/min 4.5/小时 以此类推/流转规则(故障应急)流转规则触发类型为启动故障应急时的费用,按此类型流转规则条数收费。3.5/条/日/变更管理 自定义审批配置费用,按审批流条数收费...

概述

VDS借助 PolarDB 的共享存储架构,可以实现集群节点的自治管理故障检测和集群选主。VDS架构说明如下:VDS中每个计算节点有独立的VDS线程,分为三种不同的角色:Leader、Follower和Observer。其中Leader对应 PolarDB 的主节点,Follower...

模型服务网格

模型服务网格(Model Service Mesh)提供了一个可扩展的、高性能的基础架构,用于将多个模型服务进行管理、部署和调度,以此更好地处理模型的部署、版本管理、路由和推理请求的负载均衡。本文介绍模型服务网格的概念和相关功能。什么是模型...

配置健康检查

步骤一:在云企业网管理控制台添加健康检查配置 登录 云企业网管理控制台。在左侧导航栏,单击 健康检查。在 健康检查 页面,选择VBR实例所在的地域,然后单击 设置健康检查。在 设置健康检查 对话框,根据以下信息配置健康检查,然后单击 ...

创建系统事件报警规则

DeviceWanLinkUp 网络连接断开 ConnectionDisconnect 设备WAN链路故障 DeviceWanLinkDown 状态通知 设备上线 DeviceOnline 设备离线 DeviceOffline 操作步骤 登录 智能接入网关管理控制台。在左侧导航栏,选择 系统事件监控>报警管理。在 ...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

云解析DNS如何实现故障切换

本文介绍如何通过DNS实现故障隔离或故障切换。使用场景 企业的线上网站或应用,一般是使用公网权威解析产品设置智能解析,来提升用户跨运营商(或地区)的访问速度和访问质量。...请参阅 GTM实现跨访问加速与故障切换 操作文档。

名词解释

网关 LoRaWAN接入网络的网元,负责和终端节点的上下行无线通信。节点 具有LoRa通信功能的终端或者模组等。凭证 入网凭证,在LoRaWAN协议里将入网凭证写入关联节点设备的JoinEUI,每个节点分组通过入网凭证,接入指定网络。专用凭证 接入...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

健康检查

设置健康检查 登录 云企业网管理控制台。在左侧导航栏,单击 健康检查。在 健康检查 页面,选择边界路由器实例所在的地域,然后单击 设置健康检查。在 设置健康检查 面板,根据以下信息配置健康检查,然后单击 确定。配置 说明 云企业网...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

智能卡简介

智能卡一卡多,支持多个运营商网络通道,可以在移动、联通、电信运营商之间进行智能切换。您可使用阿里云SDK配合二次开发,无需在设备开模2个及以上的卡槽,即可识别卡片并进行网络切换。产品优势 网络优选 无需提前实地勘测网络信号以...

什么是全局流量管理

产品概述 全局流量管理(Global Traffic Manager),简称GTM,它可以帮助企业实现用户访问应用服务的就近接入、高并发负载均摊、应用服务的健康检查,并能够根据健康检查结果实现故障隔离或流量切换,方便企业灵活快速的构建同城多活和异地...

ping不通云服务(SAG-100WM)

介绍SAG-100WM设备 ping 不通同云企业CEN(Cloud Enterprise Network)的云服务器ECS(Elastic Compute Service)或同云连接CCN(Cloud Connect Network)内的客户端的处理方法。问题现象 终端无法连接到阿里云。例如 ping 不通同CEN的...

创建发布任务

需要升级客户端版本时,IT管理员可以在客户端管理中创建发布任务。本文档介绍如何在客户端管理页面发布任务。背景信息 IT管理员查看待更新版本中是否有需要升级的客户端版本,在创建发布任务时可以选择需要的版本进行更新升级。您已购买的...

重启设备

网络故障时,重启设备可消除部分软件故障。背景信息 重启设备一般有两种方法:通过关闭或打开设备电源进行重启。通过智能接入网关控制台,远程重启设备。关闭或打开设备电源 警告 您通过关闭或打开设备电源进行重启时,请注意保存设备的...

带宽包变配及续费说明

带宽包变配操作步骤 登录 云企业网管理控制台。在 云企业网实例 页面,找到目标云企业网实例,在 操作 列单击 管理。在云企业网实例详情页面,单击 带宽包管理 页签,找到目标带宽包,然后在 带宽 列单击 降配 或 升配。说明 跨境带宽包...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

事件分析概述

链路追踪:提供事件轨迹能力,还原事件整体链路状态,帮助您快速排除故障,定位链路问题。低成本 事件总线EventBridge 支持事件以云服务事件总线和自定义事件总线形式接入,云服务事件总线支持接入所有阿里云产品事件,无缝支持云服务事件...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云企业网 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用