应用场景

前端的监控系统和大数据处理系统会利用 TSDB 的数据查询和计算分析能力进行业务监控和分析结果的实时展现。电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析。...

ack-node-repairer

当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

处理事件

PolarDB-X 1.0 提供待处理事件服务,当出现处理事件时,系统会通过邮件、短信和控制台等途径提醒您及时处理,本文将介绍如何在控制台上查看和管理待处理事件。背景信息 PolarDB-X 1.0 待处理事件包括:运维事件:如网络变更等运维提醒,...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

标准版-双副本

当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

常见问题概览

下载备份文件 性能、空间与内存 热点问题 其他常见问题 如何排查MongoDB实例负载过高的问题 MongoDB实例内存使用率高问题 MongoDB实例的CPU使用率高问题 MongoDB实例IOPS使用率高问题 MongoDB实例空间使用率高问题什么高可用系统会触发...

标准架构

当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

部署和使用跨可用区实例

同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

在使用阿里云服务的过程中我应该避免哪些操作?

6)重置以及更换系统务必要了解的事项 重置以及更换系统会导致被操作磁盘数据跟快照丢失并不可找回,如有重要数据一定要提前备份,谨慎操作。7)Linux系统下不能开启NetWorkManager服务 linux系统请不要开启NetWorkManager服务,该服务会跟...

AMD实例规格与操作系统兼容性说明

AMD Zen架构发布于2017年,处理器的部分新特性在旧版操作系统会出现部分功能支持上的缺陷。下文列出了各操作系统对于不同代系AMD实例的兼容性说明,并提供了官方兼容性说明文档以供您参考。购买AMD实例规格时,建议您使用表中列出的官方...

应用场景

批处理系统 很多行业的批处理系统中通常有大量批处理操作,包含多张大表关联的复杂计算,并且涉及到大量的数据更新。批处理意味着每一次处理的数据量很大,而且有很多张大表要做关联,经常要做一些比较复杂的查询,并且更新量也比较大,...

消费重试

系统异常时处理中的消息状态如何恢复:帮助您了解当系统出现异常(宕机故障)等场景时,处理中的消息状态如何恢复,是否会出现状态不一致。消费重试策略 消费重试策略指消费者在消费某条消息失败后,消息重试的间隔时间和最大重试次数。...

Intel实例规格与操作系统兼容性说明

重要 Intel实例规格处理器(Sapphire Rapids)的部分新特性在旧版操作系统会出现部分功能支持上的缺陷。如果您在8代Intel实例规格上使用了官方不支持的操作系统版本,需要自行评估并承担可能产生的风险。请您根据应用的实际情况,自行...

测试指标

集群 对于使用集群方式的系统,主要通过以下方式考量其集群可靠性:集群中某个节点出现故障时,系统是否有业务中断情况出现。在集群中新增一个节点时,是否需要重启系统。当故障节点恢复后,加入集群,是否需要重启系统。当故障节点恢复后...

什么实例发生主备切换?

实例异常:阿里云检测到实例发生故障,无法正常使用时,系统会立即触发主备切换,及时恢复实例,缩短故障影响时长。宿主机下线或实例异常导致的主备切换会以站内信或邮件等形式通知到您,通知内容如下:【阿里云】尊敬的*:您的云数据库...

迁移Batch批量计算到分布式工作流Argo集群

但主流的Batch批处理系统,需要通过Job ID指定Job依赖,由于Job ID需要在Job提交后才能获取,因此需要编写脚本实现Job间依赖(伪代码如下),Job较多时,依赖关系不够直观,维护成本较高。Batch批处理系统Job间依赖,JobB依赖JobA,在JobA...

解决Windows实例中无法查看数据盘问题

磁盘显示为 外部 或 脱机 将Windows的系统更换到更高版本的系统后,可能会出现看不到数据盘的情况。在运行窗口输入 diskmgmt.msc 命令,运行磁盘管理,磁盘可能会显示为 外部 或 脱机。请参考如下步骤修复磁盘。显示为 外部 的磁盘,在磁盘...

产品概述

什么是批量计算 批量计算(BatchCompute)是一种适用于大规模并行批处理作业的分布式云服务。BatchCompute 可支持海量作业并发规模,系统自动完成资源管理、作业调度和数据加载,并按实际使用量计费。通俗的讲,就是您可以提交一个任意的...

微服务治理概述

无 消除变更过程中的风险 功能 使用场景 相关文档 相关视频 无损上线 在某些场景下,服务提供者需要接收大流量请求并成功返回,而刚启动的冷系统直接处理大量请求,可能由于应用内部资源初始化不彻底从而出现请求阻塞、报错等问题。...

系统防护

系统防护即从整体维度对应用入口流量进行控制,结合应用的Load、总体平均RT、入口QPS和线程数等几个维度的监控指标,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。背景信息 长期以来...

iOS端出现无apns token或apns token失效如何处理

问题详述 iOS端出现无apns token或apns token失效如何处理问题解答 无apns token 需要在EMAS控制台上对您的App进行证书的配置和上传。如已经配置证书,出现该错,请检查一下您推送环境是否正确,比如配置了开发环境下的推送证书,推送的...

Transaction Table2.0概述

随着当前数据处理业务场景日趋复杂,很多业务场景并不要求延时秒级更新可见或者行级更新,更多的需求是分钟级或者小时级的近实时数据处理叠加海量数据批处理场景,MaxCompute支持基于Transaction Table2.0实现近实时的增全量一体的数据存储...

如何管理故障

当报警来源的指标持续恶化,触发故障产生规则,系统自动产生故障故障过程 故障过程用于记录管理故障处理的全过程。当故障处于处理中/已恢复状态时,故障详情默认进入故障过程tab页;可以对故障的最新进展、故障影响面(影响服务)、舆情...

Spark SQL执行方式

AnalyticDB for MySQL 湖仓版(3.0)支持使用批处理和交互式两种方法执行Spark SQL,两种执行方式都直接与 AnalyticDB for MySQL 的元数据服务连通,可以读写 AnalyticDB for MySQL 的库表。本文介绍批处理和交互式两种执行方式的注意事项...

强弱依赖治理概述

通过以上对比可以看出,当下游依赖出现问题时,当前系统会受到一些影响,严重影响用户体验的是强依赖,影响较小的则是弱依赖。强弱依赖治理 强弱依赖治理就是提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续...

远程连接Windows Server 2003实例后在...如何处理

更换操作系统后,原来旧的系统被释放,清除系统盘上的所有数据,请在更换操作系统前为系统盘创建快照备份数据,再执行操作,创建快照的更多信息,请参见 快照概述。方案二:将网卡的 Offload.Tx.LSO 参数 更改为 Disabled 您需要将...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

数据推送

POST的URL及body部分最好都要做url_encode,否则会出现解析及签名问题。数据源或者API推送增量时请注意,主键值重复的doc会被覆盖。使用RDS自动同步数据有TPS及大小限制,具体值请参考系统限制项:RDS单库内所有表的更新会产生一份binlog...

数据推送

POST的URL及body部分最好都要做url_encode,否则会出现解析及签名问题。数据源或者API推送增量时请注意,主键值重复的doc会被覆盖。使用RDS自动同步数据有TPS及大小限制,具体值请参考系统限制项:RDS单库内所有表的更新会产生一份binlog...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

DDH生命周期

是 故障 稳定状态 DDH出现故障。您可以 提交工单 检查并处理问题。是 已过期 稳定状态 包年包月DDH到期时出现的状态。对DDH续费后,DDH的状态变为 运行中。续费详情,请参见 手动续费DDH。是 已释放 稳定状态 包年包月DDH过期后自动释放...

升级Linux ECS实例内核

升级须知 升级操作系统内核是一个比较复杂和风险较高的操作,可能导致系统不稳定或出现兼容性问题。在进行升级前,建议备份重要数据,了解升级过程和可能出现问题,并谨慎操作。操作步骤 以CentOS和Debian系列操作系统为例,指导您如何...

Linux系统的ECS实例运行卡顿,在/var/log/messages...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多选);进展摘要:处理人将事件升级为...

设置Pod故障处理策略

以库存不足创建ECI Pod失败为例,当Pod的故障处理策略为fail-fast时,Pod status condition为ContainerInstanceCreated的示例如下:说明 如果Pod的故障处理策略为fail-back,Pod创建失败后系统会自动尝试重调度。此时,Pod status.reason...

查看集群概况

智能运维系统通过红黄绿3种颜色来展示集群的健康状况:红色:表示集群已经出现了很严重的问题或者很严重的隐患,已经影响了您的使用,需要立即处理,否则存在数据丢失,集群故障问题。黄色:表示集群存在较严重的问题或隐患,可能...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
批量计算 对象存储 负载均衡 商标服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用