AIMaster:弹性自动容错引擎

同步训练任务(常见于PyTorch任务)当任务某个实例运行异常时,如果退出码或错误日志信息满足容错条件,例如:抢占发生,则会重启任务。job-execution-mode=Sync-enable-job-restart=True-max-num-of-job-restart=3-fault-tolerant-policy=...

修改预约重启时间

在 计划内运维事件 列表中,在 云服务器 页签下,找到已经设置了重启计划的ECS实例,在 操作 列,单击 预约重启。在 预约重启时间 页面,选择 预约日期 和 预约时间。说明 预约重启时间不能超过 最晚可预约时间。其中,最晚可预约时间 比 ...

重启实例

重启实例 建议您通过控制台或调用API重启实例,而非在实例操作系统内执行reboot重启命令。在一些场景下,如离线扩容、修改主机名、系统运维事件需要重启实例时,在ECS实例内部重启(执行reboot命令)无效。通过控制台重启实例 登录 ECS管理...

参数配置常见问题

多重启节点相关操作请参见 重启节点。修改参数是立即生效吗?可以在指定时间生效吗?修改的参数会在修改参数任务完成后立即生效,若您不想立即生效,支持设置在可维护窗口修改参数。如果您需要在可维护窗口外的其他指定时间修改参数,...

概述

AliOS Things操作系统内核特性如下:可抢占式/协作式任务调度 多任务管理 软件定时器 任务间通信机制包括信号量、互斥量、队列、事件 内存管理 时间功能 随机数 系统信息 系统初始化 工作队列 版权信息 说明 Apache license v2.0 目录结构...

自动定时重启ECS云服务器

然而,在实际运行中,我们可能会遇到这样一些场景:系统更新:一些操作系统或者软件的更新可能需要重启服务器才能生效。通过定时重启能够保证这些更新的正常应用。内存泄漏:有的程序可能存在内存泄漏的问题,长时间运行后可能会消耗大量的...

续费降配

是否需要重启实例 降低实例规格:需要 若设置了重启时间,实例将在您设置的时间自动重启使规格配置生效。若未设置重启时间,必须在新的计费周期内手动重启实例,否则降配操作不会生效。变更公网带宽:不需要 转换数据盘计费方式:不需要 新...

续费降配

是否需要重启实例 降低实例规格:需要 若设置了重启时间,实例将在您设置的时间自动重启使规格配置生效。若未设置重启时间,必须在新的计费周期内手动重启实例,否则降配操作不会生效。变更公网带宽:不需要 转换数据盘计费方式:不需要 新...

配置任务流依赖检查节点

任务编排的任务流依赖检查节点可实现任务流自依赖或跨任务流间依赖,依赖的目标对象可以是某个任务流或任务节点。本文介绍配置任务流依赖检查节点的步骤。应用场景 跨任务流依赖:任务流A需要在任务流B运行成功后才能执行。例如,每周一...

全球消息路由

批量启停任务 云消息队列 RocketMQ 版 支持批量启停任务,当您的业务使用了个消息路由任务,为了提高维护操作效率,您可以使用批量启停功能一键启停任务。在 全球消息路由 页面的任务列表中,选中需要批量启停的任务,单击列表...

创建操作系统迁移任务

导入迁移源信息后,SMC控制台会自动生成迁移源记录,您需要在控制台为迁移源创建操作系统迁移任务,并完成操作系统的迁移。说明 关于操作系统迁移的更信息,请参见 操作系统迁移(Linux)和 操作系统迁移(Windows)。前提条件 已导入...

修改专属集群任务的DU数

数据传输服务DTS(Data Transmission Service)专属集群任务的性能受限于任务的DU数,您可以通过修改专属集群任务的DU数来调整该任务的规格。例如,当任务规格无法满足业务需求时,您可以通过调大目标任务的DU数来提升任务的性能。前提条件...

重启节点

PolarDB 提供了重启节点功能,您可以在控制台上手动重启节点解决数据库连接和性能问题。注意事项 重启只读节点之后新建的读写分离连接会转发请求到该只读节点。重启只读节点之前建立的读写分离连接不会转发请求到重启后的只读节点,您可以...

重启节点

PolarDB 提供了重启节点功能,您可以在控制台上手动重启节点解决数据库连接和性能问题。注意事项 重启只读节点之后新建的读写分离连接会转发请求到该只读节点。重启只读节点之前建立的读写分离连接不会转发请求到重启后的只读节点,您可以...

操作系统迁移(Windows)

微软目前已停止对Windows Server 2008 R2等操作系统提供技术支持,出于安全或业务需求的考虑,您需要将Windows Server 2008 R2及以上操作系统迁移到更高的版本。本文介绍如何通过SMC迁移Windows系统。前提条件 已完成迁移前准备工作。具体...

主机安全

定期运行基线检查以验证集群是否符合 阿里云OS加固 和等保加固标准 阿里云OS加固 对于集群节点宿主机OS系统,阿里云OS加固 功能提供了对应的加固标准,提供的操作系统包括Alibaba Cloud Linux、CentOS、Ubuntu等。Alibaba Cloud Linux 3...

重启节点

PolarDB 提供了重启节点功能,您可以在控制台上手动重启节点解决数据库连接和性能问题。注意事项 重启只读节点之后新建的读写分离连接会转发请求到该只读节点。重启只读节点之前建立的读写分离连接不会转发请求到重启后的只读节点,您可以...

操作系统迁移中问题(Windows)

本文介绍Windows操作系统迁移相关的故障问题及解决方案。异常报错提示Run OSM Check Script Error,错误码M10_1001,怎么办?异常报错提示Run OSM Check Script Error,错误码M10_1002,怎么办?异常报错提示Run OSM Check Script Error,...

操作系统镜像发布记录

本文为您介绍 容器服务 Kubernetes 版 提供的操作系统镜像的最新动态。使用说明 重要 如果操作系统版本完全停止维护(EOL),阿里云会同时停止对使用相应操作系统版本的ECS实例提供技术支持服务。Alibaba Cloud Linux 2、CentOS分别将于...

规则管理

自定义监控规则帮助您根据实际业务需求,自定义监控规则,监控任务运行状态或资源使用情况,以便及时发现并处理异常。本文为您介绍如何在规则管理页面自定义报警规则,以及添加钉钉群机器人获取Webhook地址。使用限制 自定义监控规则仅对...

统一结算

“合并开票”可以按照开票抬头名称,开票主体,发票类型等维度进行,支持个账号的消费开成一张发票,从而避免粘贴大量发票的人工操作 导出明细:基于统一结算任务,合并导出盖章版PDF月账单等账单数据。操作说明 统一结算操作流程如下图...

特性与优势

提供操作系统崩溃后的内核转储(Kdump)能力,您可根据需要在线打开或者关闭该功能,无需重启操作系统。提供内核热补丁升级(Live Patch)能力。更信息,请参见 内核热补丁概述。软件包预装和更新说明。用户态软件包保持与新版CentOS兼容...

重启实例

重启过程中实例会发生 秒级闪断,请判断业务影响后执行重启操作重启前请做好业务安排并 确保应用有重连 机制。操作步骤 访问 Tair实例列表,在上方选择地域。在目标实例的 操作 列,单击 重启。在弹出的面板中,配置 重启方式。立即重启...

重启实例

重启过程中实例会发生 秒级闪断,请判断业务影响后执行重启操作重启前请做好业务安排并 确保应用有重连 机制。操作步骤 访问 Redis实例列表,在上方选择地域。在目标实例的 操作 列,单击 重启。在弹出的面板中,配置 重启方式。立即重启...

查看训练详情

单击目标任务 操作 列下的 监控,进入任务详情页面。在 任务详情 页面,您可以查看该任务的基本信息和相关配置,包括任务配置和资源配置等。查看任务事件 事件日志中记录了任务调度以及资源相关的进度日志,您可以通过查看任务事件来定位和...

新增表实时任务

数据同步支持实时任务新增任务,并支持一键启动个上云任务,实现全量任务自动建表。本文介绍如何新增多表实时任务。前提条件 已新建Oracle和DataHub数据源,请参见 新建数据源。说明 当前仅支持Oracle LogMiner(11G)到DataHub表...

新增表实时任务

数据同步支持实时任务新增任务,并支持一键启动个上云任务,实现全量任务自动建表。本文介绍如何新增多表实时任务。前提条件 已新建Oracle和DataHub数据源,请参见 新建数据源。说明 当前仅支持Oracle LogMiner(11G)到DataHub表...

DataWorks的审计事件

DataWorks已与操作审计服务集成,您可以在操作审计中查询用户操作DataWorks产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了用户通过Open...

重启服务

您也可以在各服务的 配置 页面,选择 更多操作>重启。在重启服务对话框中,填写执行原因,单击 确定。可修改参数说明如下。参数 描述 滚动执行 默认开启。开启后,系统会按照 每批间隔时间 执行任务。您可以设置 每批间隔时间,即每隔长...

Windows 实例系统重启后显示系统恢复选项

问题现象 Windows 实例一直正常运行很天,但是重启后无法进入操作系统,桌面显示“系统恢复选项”。使用之前备份的自动快照也无法正常恢复。问题分析 这种情况可能是实例进入了 Windows 恢复环境。Windows 操作系统在遇到异常、无法启动...

云平台一键迁移

云平台一键迁移功能可以快速完成服务器的迁移任务,避免您手动登录源服务器、下载SMC客户端等繁琐的操作,提高服务器的迁移效率。本文档介绍如何通过控制台一键迁移的方式将您的Windows或Linux服务器(包括腾讯云服务器和AWS云服务器)迁移...

通过日志服务导入至数仓版

日志服务采集到日志后,可以将Nginx访问日志、Log4j日志、Apache日志以及结构化文本等日志实时同步至 AnalyticDB MySQL 数仓版(3.0)进行存储和分析。...重启投递任务:单击 停止,待投递任务停止后,单击 启动 重启投递任务

如何接入日志服务

阿里巴巴分布式任务调度系统SchedulerX 2.0提供日志服务,您无需修改代码,只需增加一个Log4j或Logback的配置,即可在控制台看到每次任务调度(包括分布式任务)的业务日志。本文介绍如何通过SchedulerX接入并查看日志服务。前提条件(可选...

源服务器迁移至目标实例

目标实例的操作系统和迁移源的操作系统需要保持一致。目标实例所挂载的数据盘的数量需要大于等于迁移源的数据盘的数量。如果目标实例的数据盘数量不满足需求,您需要挂载更的数据盘。挂载数据盘的具体操作,请参见 挂载数据盘。否则迁移...

创建桌面迁移任务

操作系统版本 限制 目前仅支持Windows源服务器迁移至阿里云 无影云电脑,且不支持以下版本:Windows 8.1及以下版本 Windows 11 Windows Server 2016及以下版本 前提条件 已导入迁移源。可通过下列任一方式导入:通过控制台自动导入迁移源 ...

常见问题排查

如果 hadoop fs 命令可以成功运行,但是无法执行分析任务,请确认YARN等任务执行框架在安装完 文件存储 HDFS 版 文件系统SDK后进行了重启。例如:您可以执行以下命令重启YARN:${HADOOP_HOME}/sbin/stop-yarn.sh${HADOOP_HOME}/sbin/start-...

桌面迁移

操作系统版本 限制 目前仅支持Windows源服务器迁移至阿里云 无影云电脑,且不支持以下版本:Windows 8.1及以下版本 Windows 11 Windows Server 2016及以下版本 操作步骤 登录 SMC控制台。在左侧导航栏,单击 迁移源。找到目标迁移源,在 ...

EDAS监控报警功能升级说明(2020年02月13日)

如果您的应用没能及时重启,但是又需要添加或修改报警规则和报警联系人的话,您必须手动在新老两个界面同时进行操作。对弹性伸缩的影响。虽然弹性伸缩是基于监控数据触发的,但此次升级不会对弹性伸缩功能产生影响,请放心使用。新老监控...

YARN高可用特性使用指南

NM有状态重启(NodeManager Restart)能持续将运行时的任务(Container)信息与状态同步至LevelDB等本地存储中,并在启动时重新加载任务状态,保证运行中任务在节点升级或重启时不受影响。更内容,请参见 NodeManager Restart。基于以上...

任务类型配置

3、当需要删除某个任务类型时,需要确认当前项目内已经没有任务被设置为这个类型的情况下才能将其删除(具体需要检查项目内所有任务分组的父任务、子任务、孙任务等,以及回收站中所有任务分组内的父任务、子任务、孙任务等)。4、任务类型...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储 CPFS 运维安全中心(堡垒机) 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用