响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

数据安全基线

在前期评估工作中,一般会考虑风险发生会造成的损失程度、风险发生的概率、预先防护的成本和事后补救的成本四个维度。对于数据泄露风险,企业首先要意识到,不同业务类型掌握的业务数据不同,需要仔细对数据分级,分辨其中有哪些个人隐私...

使用配置巡检检查集群工作负载

RAM授权 请完成ACK容器服务配置巡检页面的RAM授权操作,确保当前RAM用户拥有操作当前集群配置巡检页面的权限,否则会出现权限不足无法操作配置巡检页面功能的问题。具体操作,请参见 自定义RAM授权策略。展开查看配置巡检授权代码 {...

降低实例配置

注意事项 降低实例配置可能会出现重启风险、限速风险和禁写风险。Serverless实例降低配置期间会额外增加暂停弹缩风险。警告 降低流量规格和磁盘容量之前,务必先查看监控,明确过去一段时间的峰值使用情况(建议您查看7天内的峰值数据),...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

升级实例配置

注意事项 升级实例配置会引发集群逐台重启,可能会出现如下风险:客户端会短暂断开连接并重连,可能会造成少量报错。已经发送成功的消息,升级之后不会丢失。升级期间发送失败的消息,建议重试发送,可在客户端配置重试机制。升级预计持续...

出错提示“Command 'yum-y distro-sync' returned non...

软件包开始安装过程中意外中断 软件包冲突问题,此时再次执行 yum distro-sync 会出现报错信息。yum distro-sync 中断时机不同,涉及到的报错软件也会有所不同,本示例以下图报错信息为例。执行以下命令,查看报错的软件包nginx在系统中的...

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

使用配置巡检功能检查注册集群Workload安全隐患

如果未配置,Pod有被调度到资源紧张的节点上的风险,可能会出现容器内进程OOM的风险。修改Pod Spec,增加 resources.requests.memory 字段。示例:memoryLimitsMissing 通过检查Workload的Pod Spec中是否未配置 resources.limits.memory ...

高额账单风险警示

DCDN 产品属于按量付费产品,其账单金额受计费周期(如按小时出账,按天出账、按月出账等)和账单处理时延(阿里云 DCDN 产品出账存在3~4小时延迟)等因素的影响,无法做到账户余额为0的情况下立即停机,因而可能会出现欠费金额大于0,或者...

高额账单风险警示

CDN 产品属于按量付费产品,其账单金额受计费周期(如按小时出账,按天出账、按月出账等)和账单处理时延(阿里云 CDN 产品出账存在3~4小时延迟)等因素的影响,无法做到账户余额为0的情况下立即停机,因而可能会出现欠费金额大于0,或者单...

分布式序列问题

分布式序列是否全局唯一 单库单表的分布式序列可以保证生成的...在运行过程中,不能删除 dbp_sequence 表的数据,如果删除,可能会出现不一致风险,导致无法获取错误。如果误删了数据,请点击 配置生效 按钮,数据访问代理会重新初始化序列。

更新软件

Linux发行版中的软件不断更新,以添加新功能、修复错误、提供安全更新等,您可以根据需要更新至最新版软件。本文以在CentOS、Debian、Ubuntu和OpenSUSE操作系统为例,为您介绍本文介绍如何在不同Linux发行版上,更新单个软件或全部软件...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

云盒计算资源配置最佳实践

反之,如果选择最大实例规格为ecs.g6.26xlarge的SKU,由于该规格族的vCPU和内存配比1:4,则会出现内存浪费的情况。根据业务需求选择SKU时,可能会需要多种不同配比的ECS实例,此时可以选择多种规格族混合的SKU,以减少资源浪费。例如:您...

Windows系统使用第三方杀毒防护软件可能出现问题...

一般而言,杀毒软件在正常情况下保护系统不受病毒、木马的攻击影响,但是在某些特殊情况下,可能因为兼容性问题,导致Windows操作系统出现上述异常问题。对此,本文主要介绍如下几点内容,希望对您有所帮助。杀毒软件原理 排查方法 ...

功能特性

风险事件发生时,风险事件中心推荐可执行的应急预案,供运维快速选择并自动化执行,从而通过标准化处理流程,实现故障快速恢复。故障演练 故障演练 提供了故障注入能力,通过演练平台主动触发故障,以此观测应用软件的高可用性。故障...

DDH生命周期

您可以自主迁移故障潜伏期的DDH到其他物理机,具体操作请参见 迁移有潜在故障风险的DDH。是 故障 稳定状态 DDH出现故障。您可以 提交工单 检查并处理问题。是 已过期 稳定状态 包年包月DDH到期时出现的状态。对DDH续费后,DDH的状态变为 ...

使用高可用的RDS实例

应用场景 对于高可用版的RDS实例,当主用RDS实例出现故障无法访问时,自动切换到备用RDS实例,提升系统的稳定性,减少业务中断风险风险等级 默认风险等级:高风险。当您使用该规则时,可以按照实际需求变更风险等级。检测逻辑 RDS实例...

单实例快速恢复

出现1分钟容器响应超时(可能是内存溢出、硬件故障软件Bug等原因导致),Resource Manager自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

SDK相关FAQ

什么会出现内存泄漏?setSDKAuthSDKInfo的密钥如何获取?什么情况下会返回600005页面非法修改?当使用移动卡请求一键登录不成功,可能出现的报错日志及解决方法有哪些?若出现权限相关问题,该怎样做?检查App的权限是否可以正常申请。...

使用云平台配置检查

云平台配置错误可能导致安全漏洞、性能瓶颈、数据泄露、黑客攻击等风险,严重影响云平台的可靠性。建议您定期扫描云平台的安全配置,并及时修复配置中的风险项,以提升云平台的安全性、性能和可靠性,确保业务的正常运行和数据的安全性。...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

连接保持

当Proxy在新旧主节点中进行切换时,需要保留这个状态,否则会出现字符集乱码问题。所以连接保持的核心在于保证连接切换前后的会话状态一致。说明 当Proxy将连接从旧主节点切换到新主节点的过程中,会存在短暂的新老数据库同时不可写不可读...

应用场景

并且一旦出现数据安全问题,线上业务将无法进行。随着数据恢复时间的增加,造成的损失也越大。数据库备份DBS提供的应急恢复功能,将自动获取备份集并合成快照点,可按需在短时间内恢复出(即创建)一个新的DBS沙箱实例。您可以在DBS沙箱...

自动故障剔除

自动故障剔除功能自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

如何处理健康检查导致的大量日志

方案风险说明 延长健康检查的间隔时间后,后端ECS实例出现故障时,负载均衡发现故障ECS实例的时间也变长。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到相应的CLB实例,单击实例ID。在 监听 页签下,找到目标监听,在 ...

风险治理的工作开展

合理地进行风险治理 在传统IT治理中,有时采用充分的前置防护。在业务正式上线之前,充分分析业务运营流程并评估潜在风险。将治理措施在中台部署完成后,业务才上线运营。后续的业务管理流程只能使用事先经过治理审批的既定流程。而业务...

查看实例风险

云消息队列 Kafka 版 实例的实时诊断功能能够定期对实例进行检测,支持查看诊断发现的问题、提供修复建议,并将异常的检查项上报告警给相关联系人,帮助您及时处理...如果风险修复后,出现相同的风险,系统在7天后再次发送风险报警通知。无

概述

但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障、错误的变更、突发流量,甚至到光纤挖断、自然灾害等引起的整个机房不可用情况,如何保障系统稳定性具有很大...

重启实例

当实例连接数满或出现访问异常时,您可以重启 云原生内存数据库 Tair。重启的影响与注意事项 重启可能发生 数据丢失。...单副本实例,重启会出现数据丢失,请谨慎操作。如果对数据有可靠性要求,建议升级至高可用(双副本)。

重启实例

当实例连接数满或出现访问异常时,您可以重启 云数据库 Redis 版。重启的影响与注意事项 重启可能发生 数据丢失。...单副本实例,重启会出现数据丢失,请谨慎操作。如果对数据有可靠性要求,建议升级至高可用(双副本)。

常见问题

产品常见问题 EMAS崩溃保护机制导致SDK无法初始化且功能不可用 阿里百川账号如何在阿里云平台使用 覆盖patch需要重启App生效吗 热修复支持多进程吗 后台上传补丁的时候出现,找不到补丁的情况 补丁发错了怎么办,是否有相应办法补救 针对同...

移植问题

本文介绍编译3.x和2.3.0版本的C Link SDK时,可能遇到的问题和解决方法。背景信息 如果您尚未接入物联网平台,推荐使用最新版本的SDK。更多信息,请参见 概述。在Linux系统编译SDK后,运行Demo时,为何出现如core dump等错误?SDK提供的HAL...

迁移有潜在故障风险的DDH

如果一台DDH有潜在故障风险,其物理机处于可用状态,但随时可能出现故障,导致DDH中的ECS实例出现问题。您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。前提条件 请先将DDH上的ECS实例全部停机,否则迁移...

查看实例风险

如果风险修复后,出现相同风险,系统在7天后再次发送风险报警通知。删除:风险修复并修改风险状态为 已修复 后,可以删除风险。在目标风险 操作 列,单击 删除。建议:修改 风险状态 为 已修复 后,为了避免因为一些原因,例如脏数据未...

自动故障转移和读写分离

libpq实现自动故障转移和读写分离 通过libpq函数连接多个数据库,当出现故障自动切换到可用的数据库。命令 postgresql:/[user[:password]@][netloc][:port][,.][/dbname]?param1=value1&.]示例 如下示例为连接1个RDS PostgreSQL主实例...

自动/手动主备切换

注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制;当只读节点开启了热备功能时,主备切换将在5~10秒内完成。关于如何开启只读节点的热备...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 商标服务 云数据库 RDS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用