产品原理

当主地址池集合中,有一个应用服务地址出现故障时,HeathCheck模块会准确的检测到异常情况,同时HeathCheck模块会和DNS模块进行交互,最终是通过DNS模块将异常地址从向用户返回的应用服务地址列表中暂时删除;如果HeathCheck模块检测到应用...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

产品原理

当 Pool A 中,有一个应用服务地址出现故障时,HeathCheck模块 准确的检测到异常情况,同时 HeathCheck模块 和 DNS模块 进行交互,最终是通过 DNS模块 将异常IP地址从向用户返回的应用服务IP地址列表中暂时删除;如果 HeathCheck模块 ...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

人工干预

2、新建问题及答案,先添加标准答案,也可根据实际问答场景添加可能会出现的相似问题。3、人工干预效果测试,添加完人工干预问题后,可通过添加的标准问题或相似问题,在问答测试页面的对话框进行测试,查看干预效果。操作步骤 1、人工干预...

架构模块介绍

模块划分 SOFARPC 各个模块的实现类都只在自己模块出现一般不交叉依赖。需要交叉依赖的实现类已经全部抽象到 core 或者 common 模块中。模块划分如下:模块名 子模块名 中文名 说明 依赖 all-发布打包模块 需要打包的全部模块。all bom...

0048-00000100

问题描述 使用浏览器通过OSS标准域名访问文件时,可能会出现无法预览而是直接下载的现象。问题原因 在2019/09/23 17:00之后创建的Bucket,使用 OSS域名 访问文件,且文件的ContentType属于以下类型之一时,image/jpeg image/gif image/tiff...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

多人协作

数据同步 在多人协作过程中,为了防止数据丢失及数据同步不准确的情况,有数据同步机制来解决这个问题。多人在同一页面时的同步机制。如用户A在 集成API 界面增加某个字段,并保存。用户B的 集成API 界面同步对应数据。获取编辑权限时,...

什么是容器报警演练

当集群的API Server监测到特定事件,报警模块会通过邮件、短信等方式通知用户处理。AHAS容器演练中的监控报警验证功能通过模拟事件触发,验证集群监控报警设置是否正常可用,并统计报警成功率、以及事件触发到监控报警的平均延迟,从而验证...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

内存型

数据结构模块集成 集成多个自研的数据模块,包括 exString(包含 Redis String命令增强)、exHash、GIS、Bloom、Doc、TS、Cpc、exZset、Roaring、Vector 和 Search,扩展了Redis的适用性,使业务无需再关心存储的结构和时效性,能够极大...

常见问题

A:切换域名后,可能会存在DNS解析缓存问题,在缓存过期时间内可能会出现连接不上数据库或数据库只支持读操作无法执行写入操作等情况,建议您刷新一下服务器的DNS缓存。Q:迁移切换后,为什么在PolarDB-X 2.0标准版控制台上看不见 完成迁移...

使用Python操作OSS时出现“No module named oss2”...

问题描述 使用Python上传或下载OSS的资源时,调用oss2模块,在运行Python脚本文件后出现“No module named oss2”报错。问题原因 系统环境中没有安装OSS的Python SDK和oss2模块。解决方案 以Linux系统为例,在脚本文件的环境中,执行以下...

自动/手动主备切换

注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制;当只读节点开启了热备功能时,主备切换将在5~10秒内完成。关于如何开启只读节点的热备...

围绕混沌工程的平台实践

本文主要介绍AHAS Chaos是如何围绕混沌工程来打造故障演练服务,您可以了解到混沌工程的基本知识和AHAS Chaos的优势。混沌工程和故障演练 首先您需要了解混沌工程和故障演练的关系。以下是混沌工程官方定义:混沌工程是在分布式系统上进行...

Dataphin服务-项目管理中没有Dataphin数据源模块

问题描述 Dataphin服务-项目管理...2.只有用户角色为:系统管理员、开发用户、服务项目管理员,才会出现Dataphin数据源分组。解决方案 调整相关角色权限或者计算引擎。创建服务单元、应用和Dataphin数据源的分组 适用于 Dataphin 独立部署3.8

常见错误码说明

在API调用时可能会出现报错,可以参考本文档根据错误码定位错误原因并解决报错问题。1.错误码:Throttling.User 接口调用超限 错误信息:Flow control has been triggered.解决建议:一般情况是指的服务请求频率过高,超过了QPS限制(资源...

故障协同处理(基于钉钉)

本文主要介绍什么故障协同处理。云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台...

任务管理概述

在金融级的数据库设计场景中,可能存在大量的数据库分库,执行 DDL 操作意味着在多个数据节点以及大量的物理数据库中执行任务,不仅耗时较长,还可能因为硬件故障等因素导致执行失败,从而需要进行人工干预。因此,数据访问代理提供...

功能特性

当风险事件发生时,风险事件中心推荐可执行的应急预案,供运维快速选择并自动化执行,从而通过标准化处理流程,实现故障快速恢复。故障演练 故障演练 提供了故障注入能力,通过演练平台主动触发故障,以此观测应用软件的高可用性。故障...

灾备方案

标准版-双副本高可用架构 标准架构(双副本)实例采用双机主从(Master-Replica)架构,高可用HA模块侦测到主节点故障时,自动进行主从切换,将Replica提升为Master,而原来的Master恢复连接后成为新的Replica。集群架构 图 3.集群版-...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

异地应用双活切流

选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回...

灾备方案介绍

标准版-双副本高可用架构 标准架构(双副本)实例采用双机主从(Master-Replica)架构,高可用HA模块侦测到主节点故障时,自动进行主从切换,将Replica提升为Master,而原来的Master恢复连接后成为新的Replica。集群架构(双副本)图 3...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

Windows系统的ECS实例ping外网地址提示“一般故障”...

然后重新ping外网地址,不再出现一般故障”错误时,表示该问题已解决。检查网卡配置信息 执行 ipconfig/all 或 route print 命令检查IP配置,查看路由配置是否存在问题。如果回显中显示了所有网卡信息,如下图所示,说明路由配置没有问题...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

定制管理

5.请根据示例的指示操作(不同的服务干预操作也不相同),在定制对象中输入干预对象文本,点击“开始解析”,右侧干预内容部分会出现解析结果。6.在干预内容中可以对实例的服务接口结果进行位移、新增、编辑、删除等操作,最终 点击“确定...

以太网接口无法接通

问题现象 以太网接口没有接通(物理上)。可能原因 设备没有连接电源或者以太网接口连接的线缆没有插好。光纤、双绞线过长或者链路损耗太大。接口、接口模块或者设备故障。解决方案 检查本端和对端设备是否接通电源,设备线缆和模块是否插...

以太网接口频繁Up/Down

问题现象 以太网接口频繁Up/Down。可能原因 线缆没有连接好。双绞线过长、光纤超长或链路损耗太大。接口、接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备两端链路、接口模块是否故障。设备之间是通过双绞线...

【2.0】IVR智能导航模块使用说明

四、导航转接失败模块出口的使用方式 导航转接失败说明:当导航转接到其他流程出现异常时,执行导航转接失败这个接口,建议连接放音模块,对转接失败做一下说明,然后放音之后可根据业务流程连接其他模块或者结束。五、用户挂机模块出口...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

无侵入观测概述

其次由于Kernel Space传递的元数据信息只有Pid、FD等进程粒度的元信息,而针对Kubernetes可观测场景,Pod、Container等资源定义更有意义,所以Correlate Meta模块会为Process模块处理后的数据绑定容器相关的元数据信息。聚合:绑定容器相关...

数据标准概述

用户成员类型 角色类型 说明 超级管理员 系统角色 超级管理员可以指定数据标准管理员,同时在数据标准模块中,等同于数据标准管理员,负责:标准集的创建及管理,指定每个标准集的维护人员、成员、可见范围及审批模板。标准的创建及管理。...

常见问题

如果无数据产生,则会出现数据不足的情况。案例:云监控上发现上传下载延迟 问题分析:云监控平台上查看到的数据是云监控产品节点发起探测请求获得的数据,并不代表真实用户环境。解决方案:云监控平台监控到访问延迟较大的情况,可通过...

共享内存通信(SMC)常见问题

如果您在Alibaba Cloud Linux 3系统中启用了共享内存通信SMC(Shared Memory Communication),且使用过程中遇到无法正常通信、部分端口不可用、对比TCP没有应用性能提升等问题,可以参考本文提供的方案进行排查并解决。启用SMC后应用性能...

2023年

无 缺陷修复 修复带SORT KEY的内存攒批任务执行后可能会出现的查询报错问题。修复Serverless实例读取字符串类型数据可能出错的问题。修复WHERE子句中过滤条件过多可能出错的问题。修复SQL包含like语句时可能出现报错的问题。修复扩缩容等锁...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 负载均衡 Web应用防火墙 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用