全景监控

全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题时按照问题的紧急程度,选择告警方式,快速通知相关人员,及时处理问题,保障系统和数据的稳定运行。同时,全景监控提供统一的监控接入标准,全方位对接各种...

功能简介

全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题时按照问题的紧急程度,选择告警方式,快速通知相关人员,及时处理问题,保障系统和数据的稳定运行。同时,全景监控提供统一的监控接入标准,全方位对接各种...

动态与公告

功能/版本 历史版本GTM标准版 新版GTM标准版 新版GTM旗舰版 全网故障恢复时间=故障切换时间+全网生效时间 在健康检查间隔设置为1分钟,TTL60秒,连续失败次数3次的配置下,GTM能在4分钟左右准确发现故障并切换,故障切换后理论上60秒左右...

节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

功能清单

创建 标准版、企业版、旗舰版、英文版 机器人管理 DeleteInstance 机器人-删除 标准版、企业版、旗舰版、英文版 机器人管理 UpdateInstance 机器人-更新 标准版、企业版、旗舰版、英文版 机器人管理 LinkInstanceCategory 机器人-绑定类目 ...

更换操作系统系统盘)

如果您在创建ECS实例时选错了操作系统,或者当前使用的操作系统不能满足业务需求,您可以为ECS实例更换新的操作系统。本文介绍如何使用公共镜像或者非公共镜像(自定义镜像、共享镜像等)更换操作系统系统盘)。前提条件 为系统盘 创建...

更换操作系统系统盘)

如果您在创建ECS实例时选错了操作系统,或者当前使用的操作系统不能满足业务需求,您可以为ECS实例更换新的操作系统。本文介绍如何使用公共镜像或者非公共镜像(自定义镜像、共享镜像等)更换操作系统系统盘)。前提条件 为系统盘 创建...

什么故障

本文主要介绍什么故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。“用户体验下降”说明故障的核心要关注用户感受,可通过客服...

更新软件

Linux发行中的软件包不断更新,以添加新功能、修复错误、提供安全更新等,您可以根据需要更新至最新软件。本文以在CentOS、Debian、Ubuntu和OpenSUSE操作系统为例,为您介绍本文介绍如何在不同Linux发行上,更新单个软件或全部软件...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现故障 ...

产品原理

当主地址池集合中,有一个应用服务地址出现故障时,HeathCheck模块准确的检测到异常情况,同时HeathCheck模块和DNS模块进行交互,最终是通过DNS模块将异常地址从向用户返回的应用服务地址列表中暂时删除;如果HeathCheck模块检测到应用...

Android 7.0(N)以上版本的JIT问题

问题 在Android 7.0(N)以上版本的系统中,出现了JIT问题引发异常。问题原因 在Android N以后的版本对频繁使用的App进行jit操作,从而生成app image并更新oat文件。如果App image包含了补丁修改的class,就无法进行热更新。因为App在...

概述

数据库治理的常见问题 系统对外提供查询接口,由于SQL语句涉及多表Join,因此可能触发慢查询,最终导致DB连接池/Tomcat线程池满,应用整体不可用。在应用启动时,数据库Druid连接池处于初始化,同时伴有大量请求进入,可能导致Dubbo的...

PTS压测快速入门

演练阶段:在演练排查阶段,您需要对系统进行故障演练,进而发现并验证系统问题,锻炼系统及相关人员的应急能力,阿里云提供了 故障演练 平台帮助您演练预案。更多信息,请参见 什么故障演练。容灾阶段:在容灾防护阶段,您需要构建系统...

错误编码:HSF-0064

问题描述 HSF调用异常,出现以下错误,则说明初始化 ...解决方案 一般情况下,如果是在Pandora sar包的模式下,不会出现问题。如果出现,请检查Pandora容器是否启动成功。适用于 企业级分布式应用服务EDAS

容灾恢复

解决了服务故障持续影响业务的问题,避免了雪崩效应,提高系统可用率。功能原理 单机故障剔除统计一个时间窗口内的调用次数和异常次数,并计算每个服务对应 IP 的异常率和该服务的平均异常率。当 IP 的异常率大于服务平均异常率,且达到...

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

什么是应用高可用服务AHAS

应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的SaaS产品,主要包含多活容灾、故障演练和流量防护三个独立的功能模块。其中流量防护已迁移至微服务治理服务MSE。多活容灾 多活容灾MSHA(Multi-...

托管节点池节点自动恢复

当节点发生异常时,ACK自动执行恢复操作。将节点池设置为托管模式为所有节点同时开启自动恢复功能。本文介绍节点自动恢复的应用场景和处理流程。前提条件 已创建托管节点池或开启托管节点池。具体操作,请参见 管理托管节点池。已开启...

如何通过 mPaaS 框架解决 App 线上问题

问题描述 一般情况下,在 App 发布或更新上线之后,所发布的版本基本就脱离了开发者的控制。如果这时发现 APP 存在 Bug,传统手段一般只能通过发布新版本来修复 Bug。这种方式有着明显的弊端如效率低,用户体验不佳等。mPaaS 提供了多种运...

通过Jira账号信息集成Jira工单系统

任务 子任务 改进 新功能 故障 Epic 故事 故障 告警关闭时,问题的状态 Jira问题关闭时的状态。当Jira问题处于设置的状态时,Jira问题被认定为关闭,问题对应的告警操作将不再同步到该问题上。Jira问题状态选项:待办 处理中 正评审 ...

产品价格

版本配置 功能项 标准版 旗舰版 全网故障恢复时间=故障切换时间+全网生效时间 在健康检查间隔设置为1分钟,TTL60秒,连续失败次数3次的配置下,GTM能在4分钟左右准确发现故障并切换,故障切换后理论上60秒左右可以全网生效,但实际情况取决...

产品原理

当 Pool A 中,有一个应用服务地址出现故障时,HeathCheck模块 准确的检测到异常情况,同时 HeathCheck模块 和 DNS模块 进行交互,最终是通过 DNS模块 将异常IP地址从向用户返回的应用服务IP地址列表中暂时删除;如果 HeathCheck模块 ...

使用Windows公共镜像创建非IO优化实例后无法识别网卡

问题描述 使用新版本的Windows公共镜像创建非IO优化实例,启动系统后无法识别网卡驱动,导致网络不通,无法远程连接。问题原因 新版本的镜像默认安装KVM驱动,Xen虚拟化需要Xen驱动包支持,但是新版本镜像默认没有集成,导致创建后网卡无法...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

通过OAuth认证方式集成Jira工单系统

ARMS告警管理支持通过Jira账号信息或OAuth认证的方式集成Jira工单系统,本文介绍如何通过OAuth认证方式在ARMS告警管理中集成Jira工单系统,使告警在创建时能同时在Jira中创建问题工单,告警状态与工单状态可以实现双向同步。步骤一:配置...

2023年11月之前

新增 高级版、企业版、旗舰版 2022-11-08 释放实例 设置 自定义日志存储容量预警 新增 高级版、企业版、旗舰版 2022-10-27 告警通知 日志分析 新增互联网流量日志和VPC流量日志的细分投递开关。新增 高级版、企业版、旗舰版 2022-09-26 ...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

集成iOS SDK时的常见问题

编译代码时报image not found 问题现象:编译代码时可能会出现以下错误:可能原因:SDK 1.6及之前版本是静态加载,从1.7版本开始切换为动态加载。解决方案:将 AliRTCSdk.framework 加载到Embedded Binaries中。隐私权限未申请导致程序运行...

开通服务

仅支持 高级版、企业版、旗舰版 和 仅采购增值服务 用户购买镜像安全扫描功能。镜像安全扫描功能按照扫描镜像次数计费,计费价格请参见 云安全中心购买页。说明 免费版 用户可升级至 高级版、企业版、旗舰版 或 仅采购增值服务 购买镜像...

什么是全局流量管理?

故障切换:指当健康检查结果发现用户访问的默认地址池出现整体不可用时,系统会自动把用户访问流量切换到备用地址上,可确保应用服务地址故障时,能够用备用地址池来响应用户的DNS查询请求,从而实现降低业务中断的风险,保障业务的稳定...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

创建MySQL集群

主实例的数据同步到备实例,当主实例出现故障无法访问时,自动切换到备用实例。说明 高可用 支持本地盘存储和云盘存储。专属集群名称 专属集群的名称。专有网络 专属集群归属的专有网络VPC。如需创建新的专有网络,您可登录 VPC控制台...

什么是全局流量管理?

4、故障切换 指当健康检查结果发现用户访问的主地址池集合出现整体不可用时,系统会自动将用户访问流量切换到备地址集合上,可确保应用服务地址故障时,能够用备地址池集合来响应用户的DNS查询请求,从而实现降低业务中断的风险,保障业务...

访问云虚拟主机上的网站提示“Internal Server Error...

说明 如果Linux操作系统云虚拟主机上安装了WordPress网站后,修改WordPress网站中主题的某些变量时,也会出现上述报错信息。Windows操作系统云虚拟主机:访问该主机上的网站时提示“Internal Server Error”相关报错,具体信息如下所示:...

分支门店

客户痛点 业务运维效率低 不同门店的建设阶段导致操作系统、浏览器、通用办公软件等版本存在差异,新业务系统上线或变更时容易出现兼容性问题,影响业务效率 全国提升门店连锁率的背景下,需要快速提升业务扩张的效率和门店的标准化 门店...

计费概述

本文介绍IoT Studio体验版、企业版和旗舰版的不同计费方式。重要 以下内容仅供参考,实际收费以账单为准。计费方式 产品规格 计费方式 体验版 不计费。体验版有一个月的试用时间,试用结束后可以购买企业版或旗舰版继续使用。说明 旧版服务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云数据库 Redis 版 云数据库 RDS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用