节点异常问题排查

检查节点的安全组 关于如何检查节点的安全组,请参见 安全组概述 和 最小集群访问规则。Kubelet异常处理 问题原因 通常是Kubelet进程异常、运行时异常、Kubelet配置有误等原因导致。问题现象 Kubelet状态为 inactive。解决方案 执行如下...

合理利用存储备份保障业务数据可还原

背景 容器场景下,应用本身大多是无状态的,凭借K8s提供的故障重启自动注册和发现机制,在多实例部署的场景下,能够较大程度地保障业务的高可靠,但对于有状态服务,如中间件等,为了保障持久稳定的运行,需要考虑业务数据在问题场景下...

YARN缺陷修复公告

YARN ResourceManager删除历史应用作业时增加了日志收集已完成的必要条件,但日志收集的状态没有保留到ResourceManager State Store中,所以重启后ResourceManager加载的历史应用都是未完成状态,无法被ResourceManager自动删除掉,造成...

重启节点

重启节点的过程中,可能会出现1分钟以内的连接闪断。建议您在业务低谷期执行重启节点操作并确保应用具备重连机制。重启节点的时间长短跟您业务的数据量有关,可能需要几个小时,请谨慎操作。操作步骤 登录 PolarDB控制台。在控制台左上角,...

重启节点

重启节点的过程中,可能会出现1分钟以内的连接闪断。建议您在业务低谷期执行重启节点操作并确保应用具备重连机制。重启节点的时间长短跟您业务的数据量有关,可能需要几个小时,请谨慎操作。操作步骤 登录 PolarDB控制台。在控制台左上角,...

重启节点

重启节点的过程中,可能会出现1分钟以内的连接闪断。建议您在业务低谷期执行重启节点操作并确保应用具备重连机制。重启节点的时间长短跟您业务的数据量有关,可能需要几个小时,请谨慎操作。操作步骤 登录 PolarDB控制台。在左侧导航栏单击...

集群管理常见问题

EMR Doctor在安装和升级过程中不会重启任何服务,本身过程也不会对您现有任务产生任何影响,并且在安装结束后,EMR Doctor会将必要参数配置到现有集群中,不需要您再手动进行配置。EMR Doctor在安装和升级过程中会对YARN、Spark、Tez和Hive...

功能特性

继而在风险事件发生时,将例行、程式、标准的排查过程,通过故障决策树自动执行,并直接反馈诊断结果。通过故障诊断平台,能够极大地缩短故障排查时间。同时,屏蔽了不同运维人员在故障排查时的经验和技能差异,实现故障的快速定位。...

升级版本

升级重启说明 升级操作会触发实例自动重启,阿里云Elasticsearch支持两种重启方式。重启方式 原理 风险和建议 适用的版本升级方案 蓝绿变更重启 在集群中先增加高版本节点,再将低版本节点的数据迁移到高版本节点,最后删除低版本节点的...

查询并配置计划内事件

实例节点运维 实例节点运维 进入计划切换时间后,节点会重启并进行运维,重启和运维时间为分钟级别,在此过程中节点上的Region分片将进行迁移。迁移过程中,访问该Region的延迟将会增加,客户端应用程序会主动重试,以便路由到新的目标节点...

安全响应

漏洞类事件:漏洞类事件根据漏洞类型、是否涉及系统重启等条件,可以设定针对一批服务器进行自动化的漏洞修复,通过设定漏洞更新的时间窗口来执行。网络攻击类事件:网络攻击类事件根据攻击的严重程度可以对攻击者IP进行自动化封禁,该场景...

系统运维管理概述

事件驱动的自动化场景 当某台ECS实例的vCPU使用量达到了85%时,为了防止业务中断,可以通过系统运维管理OOS自动重启ECS实例。跨地域的运维场景 您可以将一批ECS实例借助镜像从一个地域复制到另一个地域。需要审批的场景 在购买或释放ECS...

ECS系统事件概述

如果在执行相应运维任务过程中可能影响ECS资源可用性或造成性能受损,阿里云会提前告知您执行时间、对象、影响等信息,您可以在这些系统事件的计划执行时间内,选择业务低谷期自行响应系统事件,避免业务在高峰期受到影响。说明 计划内运维...

无损下线Dubbo应用

对于任何一个线上应用,如何在服务更新部署过程中保证客户端无感知是开发者必须要解决的问题,即从应用停止到重启恢复服务这个阶段不能影响正常的业务请求。在应用执行部署、停止、回滚、缩容、重置时,需要通过无损下线的配置来保证应用...

通过云助手命令停止或重启实例

运行效果如下图所示,对3台实例执行命令输出 helloworld,然后自动重启实例。使用OOS批量执行云助手命令重启实例 系统运维管理OOS是阿里云提供的云上自动化运维服务,您可以通过模板定义运维动作,然后执行模板自动化运行运维任务。进入...

经典应用服务常见问题

发布部署过程中为什么分组被自动加锁?分组被自动加锁,是由于有其他发布单正在发布该分组内的服务器,应用页面顶部会出现提示 该应用下有服务器正在其他发布单XXX发布,单击发布单链接,可查看正在发布的应用。当正在发布的服务器发布完成...

云平台一键迁移

如果源服务器迁移至 云服务器实例 和 轻量应用服务器 时,需注意:为避免迁移失败,迁移过程中请勿停止、启动、重启或者释放目标实例。迁移前建议您备份目标阿里云云服务器实例,避免数据丢失。由于创建迁移任务后,目标阿里云云服务器实例...

新功能发布记录

2024-3-31 ACK场景下全托管多租服务接入Prometheus监控使用说明 计算巢新增使用仓库创建服务 阿里云计算巢新增了一站式软件云部署平台,只要将自己的仓库配置成符合计算巢服务格式规范的仓库,就可以将软件自动化地部署到云端,成为云上...

开启Fluid控制面组件监控

Fluid提供面向应用的数据集统一抽象、可扩展的数据引擎插件、自动化数据操作、通用数据加速、运行时平台无关等核心功能。阿里云Prometheus监控支持一键安装Fluid组件,并提供开箱即用的监控大盘。本文介绍如何为Fluid开启Prometheus监控。...

组件运维

组件运维概述 针对不同组件,ADP-Local提供了多种不同的白屏运维操作功能。包含:水平扩缩容、垂直扩缩容、组件备份还原、PVC存储扩容...还原过程将会自动重启工作负载并进行存储卷的恢复,所需时间根据数据量的大小有所不同,通常在分钟级。

设置定时任务

任务类型 主要用途 定时开机、关机、重启 在云电脑使用时间段比较确定的情况下,可以使用定时开机、关机、重启任务来实现自动化。对于后付费云电脑,定时关机也可以节省成本。定时重置 可定期让云电脑的系统盘数据恢复初始状态,常用于教育...

使用IK分词插件(analysis-ik)

二次上传同名文件不会触发集群重启,在运行过程中直接加载词库。当词典文件内容发生变化时,上传词典文件后Elasticsearch节点能自动加载词典文件,实现词典的更新操作。如果词典文件列表发生变化,例如上传新词典文件或删除词典文件,那么...

清林云

阿里云 函数计算 承载了清林云的业务API层、常用应用和自定义应用,再配合使用 Serverless工作流,使得整个流程Serverless,轻松应对清林云高峰流量和集中自动化流运行。公司介绍 清林云是一家专业的互联网业务咨询公司,为客户提供技术...

清林云

阿里云 函数计算 承载了清林云的业务API层、常用应用和自定义应用,再配合使用 Serverless工作流,使得整个流程Serverless,轻松应对清林云高峰流量和集中自动化流运行。公司介绍 清林云是一家专业的互联网业务咨询公司,为客户提供技术...

MongoDB 4.0

升级数据库大版本 数据迁移 变更实例配置 按时间点将备份数据恢复至新建实例 恢复云数据库MongoDB单个或多个数据库 升级数据库大版本:升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低峰期执行并确保应用...

MongoDB 4.2

设置数据库参数 部分参数在提交修改后会自动重启实例,需要重启的参数请参见 参数列表 页面中的 是否重启 列。重启实例 重启实例会对实例的节点执行轮转重启,每个节点会有30秒左右的闪断,如果集合的数量较多(超过1万),闪断时间也会...

实例运维常见问题

在降配过程中,集群会滚动重启,但业务的读写请求仍然可以正常执行,服务不会中断。然而,部分读写请求可能会出现延迟抖动或链接中断现象,请确保客户端已配置正确的重试机制。对读写延迟比较敏感的业务,建议在业务低峰期执行降配操作。...

产品优势

可视的执行过程和执行结果 通过提供可视的执行过程,您可以看到完整的执行过程和执行结果,具体包括:直观地看到各个任务的执行详情、参数和输出。清晰地看到执行的流程、顺序和错误跳转。免费的全托管自动化 提供全托管的自动化执行,...

连接云电脑常见问题

升级云电脑镜像的过程中,系统会自动重启云电脑,升级完成后云电脑状态恢复至升级前的状态,云电脑镜像升级成功。管理员升级云电脑镜像的更多信息,请参见 升级镜像。终端用户升级云电脑镜像 在待升级云电脑卡片上单击 更新。在对话框中...

ECS使用成熟度评估与洞察概述

自动化能力 评估用户在使用ECS和关联资源的过程中,是否使用了自动化能力提升ECS运维效率,并提供对应的优化建议。可靠性能力 评估ECS是否存在单点稳定性隐患、以及业务高可用风险,并提供对应的优化建议。弹性能力 评估ECS资源的弹性能力...

设置可维护时间窗口

事件说明 后端系统可能会在可维护时间窗口中执行的操作和影响如下:事件原因 影响类型 影响说明 实例重启 实例短时中断 操作过程中,将产生下述影响:实例通常会有5~10分钟以内的连接断开。对于表文件较多、表较多的实例标准升级过程中的...

Flow使用高阶帮助

流水线是持续交付的载体,通过构建自动化、集成自动化、验证自动化、部署自动化,完成从开发到上线过程的持续交付。通过持续向团队提供及时反馈,让交付过程高效顺畅。☞ 立即体验 使用 Flow 保障高质量的交付 Flow 提供代码扫描、安全扫描...

什么是云效

流水线是持续交付的载体,通过构建自动化、集成自动化、验证自动化、部署自动化,完成从开发到上线过程的持续交付。云效流水线 Flow 是什么 制品仓库 Packages 云效制品库 Packages 致力于帮助开发者统一管理各种开发语言在开发、构建过程...

设计原则

做好生产环境的运营 通过自动化能够帮助组织实现很多方面的转型和提效,但是生产环境的自动化管理和运营是一个复杂的积累过程,不是一蹴而就的,组织可以选择覆盖场景最多、最能提升效率的场景入手,通过不断完善自动化做好生产环境的运营...

降配集群

降配集群会触发集群重启重启时间与集群规格、数据结构和大小等因素有关,建议在业务低峰期操作。一般情况下,重启耗时较长,在小时级别。详细信息,请参见 重启实例或节点。降配过程中不会出现数据丢失的现象,但如果集群负载高或状态...

变更配置

警告 根据变更项不同,切换过程中可能会出现业务闪断或实例重启,而且与数据库、账号、网络等相关的大部分操作都无法执行,请选择在 可维护时间段 内执行变配操作。变更项 说明 业务影响 系列 支持 PostgreSQL基础系列升级高可用系列。会...

小微企业两步快走实现持续交付

过程中任何问题通过钉钉,自动化地及时反馈到指定负责人,做到准确反馈、即时响应,快速恢复。开发者根据任务安排,创建特性分支,通过线下编译和自测通过提交代码。代码提交自动触发代码扫描,通过后发起合并请求,根据代码库设置发送给...

创建云效流水线部署应用

说明 阿里云云效,云原生时代新 DevOps 平台,通过云原生新技术和研发新模式,助力创新创业和数字转型企业快速实现研发敏捷和组织敏捷,打造“双敏”组织,实现 10 倍效能提升。流水线」,又名「Flow」,是「云效」产品矩阵中一款企业级...

杭州幻熊:从一周发版一次到每日交付

流水线是持续交付的载体,通过构建自动化、集成自动化、验证自动化、部署自动化,完成从开发到上线过程的持续交付。通过持续向团队提供及时反馈,让交付过程高效顺畅。幻熊科技服务端程序和Web前端程序总共有近60条流水线。流水线整体方案 ...

托管节点池节点自动恢复

触发条件 重要 当您打开了 当节点故障时重启节点 开关,节点自动恢复的过程中则可能涉及节点的排水、替盘等操作,建议将数据保存在数据盘中。ACK会根据节点的运行状态 condition 等信息判断是否发起自动恢复任务。您可以执行 kubectl ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
机器人流程自动化 云安全中心 商标服务 视频点播 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用