主备切换

此类触发方式会以 短信或 站内信、邮件等形式通知到您,通知示例如下:【阿里云】尊敬的*:您的 云原生内存数据库Tair 实例:r-bp1zxszhcgatnx*(名称:*)出现异常,高可用系统已经触发切换,确保实例稳定运行。请检查程序连接是否正常,...

通过消费组读取文本日志进行模板匹配

重试等待时长 如果读取 日志聚类 结果出现异常时,等待长时间后再次重试。分隔符 文本分析作业使用分隔符(包括此处配置的分隔符和空白字符)对日志进行分词。例如日志为 11:22:33:44:55,分隔符为冒号(:),日志内容将被解析为11、22、...

Spark作业异常排查及处理

内存问题引起的报错 Container killed by YARN for exceeding memory limits 报错原因:提交App时申请的内存量较低,但JVM启动占用了更的内存,超过了自身的申请量,导致被YARN NodeManager异常终止。特别是Spark类型作业,可能会占用...

执行补数据并查看补数据实例(新版)

搜索任务 通过名称或ID搜索,添加一个起始任务,以及一个或个结束任务,平台将根据起始及结束任务分析中间任务(即中间任务为起始任务的直接或间接下游任务,为结束任务的直接或间接上游任务)。中间任务列表 平台根据起始任务及结束任务...

智能监控

即上图中的任务A、任务B、任务D和任务E出现异常(出错或变慢),也会被智能监控察觉,而任务C和任务F不受监控。如果任务D和任务E本身不需要接收报警,请联系基线责任人,从基线上移除任务D和任务E。任务A和任务B是受保障的任务D和任务E的...

检测范围说明

进程异常行为 检测资产中是否存在超出正常执行流程的行为,包括但不限于以下子项:Linux系统计划任务配置文件写入 Linux计划任务文件异常篡改 Linux可疑命令执行 反弹Shell,更信息,请参见 云安全中心反弹Shell多维检测技术详解。...

查看运维大屏

运维大屏为您展示工作空间的运维稳定性评估、重点关注的运维指标、调度资源使用及周期任务运行概况,以及数据集成同步任务的运行详情,助力您从宏观角度快速了解空间任务的整体概况,及时发现并处理异常任务,提升运维效率。使用说明 运维...

ECS系统事件概述

系统事件由阿里云定义,用于记录和通知云资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。说明 阿里云有众多产品支持系统事件,例如ECS、RDS、SLB等。本文仅说明云服务器ECS支持的系统事件,如需了解其他产品的系统...

常见问题

如果在DTS进行增量同步过程中删除了目标库中的某一个库或表,导致任务异常,您可以采取如下两种方案恢复任务:方法一:重新配置任务,待同步对象不选择导致任务失败的库或表。方法二:修改同步对象,移除导致任务失败的库或表。具体操作,...

安全告警概述

进程异常行为 检测资产中是否存在超出正常执行流程的行为,包括但不限于以下子项:Linux系统计划任务配置文件写入 Linux计划任务文件异常篡改 Linux可疑命令执行 反弹Shell,更信息,请参见 云安全中心反弹Shell多维检测技术详解。...

实例生成方式:发布后即时生成实例

即时生成实例存在时间差 为避免实例变更导致任务运行异常,发布后即时生成实例存在10分钟的时间差,即任务定时时间在发布时间点十分钟后(即实时转实例生效时间点),任务才会真实执行或根据最新的调度配置重新生成实例并调度。功能概要 ...

术语解释

崩溃/Crash 应用在运行过程中,出现异常退出。可忽略异常 指由日志捕获,且非卡死/崩溃的其他异常。ANR 即程序无响应(Application Not Responding)。如应用对用户输入事件(如按键输入、触摸屏输入、手势输入等)未在5秒内作出响应,或...

设备OTA升级失败问题

此时,对该设备再次发起新的升级批次任务,导致设备OTA升级的新任务与原任务出现升级冲突,物联网平台判断设备OTA升级的新任务升级失败。可能原因 对正在进行OTA升级的设备,再次发起升级批次任务时,选中了 是否覆盖设备之前的升级任务 为...

指标含义与异常处理建议

阿里云Elasticsearch为运行中的集群提供了项基础监控指标(例如集群状态、集群查询QPS、节点CPU使用率、节点磁盘使用率等)和高级监控报警指标(例如Cluster、Index、Note Resource等),用来监测集群的运行状况。您可以根据这些指标,...

全增量同步任务运维

完成任务配置后,您可以对已创建的任务进行管理,同时,您还可以查看任务运行的指标详情。本文为您介绍全增量同步任务的常见运维操作。背景信息 本文仅说明全增量同步任务常见的运维操作,全增量同步任务产生的实时同步子任务运维操作请...

启动实时检测与分析

EMR Doctor实时检测按5分钟为粒度对集群的实时状态进行检查,您可以通过实时检测了解集群当前的状态、出现的问题,以及发生问题的原因,并对相关问题进行修复,保证集群运行的稳定性。注意信息 如果未开通EMR Doctor,则会缺失实时检测的...

导出实时日志(公测中)

新建的任务出现任务列表中。查看实时日志导出任务任务列表中,选择目标任务,单击右侧的 查看 链接查看任务信息。暂停/启动实时日志导出任务 新建任务的运行开关默认打开,表示已生成导出任务。如需暂停日志导出任务,关闭运行开关...

异常行为分析

选择任务类型:异常行为分析,选择相应的行为数据表,填写任务名称。分区字段:选择相应的ds字段,分区字段显示有两种形式 yyyymmdd 与 yyyy-mm-dd,可下拉选择显示的样式。用户ID字段:选择能唯一区分用户的字段(如:user_id)。物品ID字...

迁移失败常见原因及解决方案

原因分析 如果持续出现创建中的状态,表示在分配资源时出现异常。解决方案 建议删除数据地址,并尝试重新创建数据地址。案例十四:出现“mgw.service.agent.dMountNasFailed”报错 现象描述 某客户创建NAS数据地址时报错,状态显示 地址...

什么是云拨测

实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过直观的数据展示和报表,您可以轻松了解网络状况、性能以及故障分析。应用场景 网络性能监控:云拨测可以帮助企业和...

工作原理

下探分析用于多维时序数据的根因定位,当监控的时序指标出现异常时,分析这个时序指标的各个维度,检测是哪个维度或者哪些维度的组合导致了指标异常。通过指标的各个维度进行根因定位,便于运维人员在服务异常时快速定位异常根因。例如网站...

常见问题

一般MaxCompute任务是混部集群上执行的,混部集群底层对离线、在线任务是共用的,因此可能出现离线任务占用了较的集群资源,导致在线任务获取不到相应的资源,出现运行缓慢甚至失败等情况。一般建议:限制离线任务的资源使用。可以限制...

事件中心

应用场景 NIS 事件由阿里云定义,用于记录和通知云网络资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。通知风险和异常 如果发生了实例资源可用性或性能受损的事件,例如因实例超规格使用造成性能受损、因运营商链路...

Kafka单表实时入湖OSS(HUDI)

任务重跑 直接重跑 不修改任务配置,直接单击同步任务 操作 列的 更>重跑 操作,重跑一次性任务。修改后重跑 编辑任务,进行修改操作后,单击 完成。此时任务的操作会变成 应用更新,单击 应用更新 会直接触发修改后的任务重跑。实时同步...

任务实例状态异常

说明 更多任务未运行的排查与处理请参见 任务未运行。父节点状态 实例状态:紫色(冻结)说明该实例被冻结了,任务将不会运行,并且阻塞下游,可以在实例详情,操作记录中查看相关记录。实例状态:黄色(等待)等待任务定时时间,点开右下...

事件中心事件源

新增异常事件 WARNING Java应用出现新增异常。错误率突增事件 WARNING Java应用服务整体错误率突增。RT突增事件 WARNING Java应用服务整体平均响应时间突增。QPS突增事件 WARNING Java应用服务整体流量突增。TopN接口错误率突增事件 ...

配置数据层

当某个单元出现异常或者不可用的情况时,可通过异地活的切流组件迅速将“问题”单元承担的流量切换至其他正常单元,保证业务的可持续性和稳定性。前提条件 配置MySQL数据层的前提条件:在两个单元环境中分别已创建一个或个同名MySQL。...

配置数据层

当某个单元出现异常或者不可用的情况时,可通过切流单迅速将数据库从主单元切换到正常单元,保证业务的可持续性和稳定性。前提条件 配置MySQL数据层的前提条件:在两个单元环境中分别已创建一个或个同名MySQL。具体操作,请参见 快速创建...

Task快速重启配置

由于作业Failover次数为独立计数,如果出现全局性异常导致大量Task同时Failover,Failover计数会按照发生异常的Task数量相应增加。操作步骤 进入Task快速重启配置入口。登录 实时计算控制台。在 Flink全托管 页签,单击目标工作空间 操作 ...

重启实例

当实例连接数满或出现访问异常时,您可以重启 云原生内存数据库 Tair。重启的影响与注意事项 重启可能发生 数据丢失。重启过程中实例会发生 秒级闪断,请判断业务影响后执行重启操作,重启前请做好业务安排并 确保应用有重连 机制。操作...

运维中心概述

异常统计:统计全局或已选项目下运行异常任务的统计信息,包括运行出错和运行总时间过长两个视角,便于您及时获取任务运行的状况,以判断资源的消耗及影响,从而作出预算准备、资源扩容或规格升级的决策。任务运维 任务运维依照调度时效...

重启实例

当实例连接数满或出现访问异常时,您可以重启 云数据库 Redis 版。重启的影响与注意事项 重启可能发生 数据丢失。重启过程中实例会发生 秒级闪断,请判断业务影响后执行重启操作,重启前请做好业务安排并 确保应用有重连 机制。操作步骤 ...

数据集成概述

脏数据 脏数据是对于业务没有意义,格式非法或者同步过程中出现异常的数据。单条数据写入目标数据源过程中发生了异常,则此条数据为脏数据。因此只要是写入失败的数据均被归类于脏数据。例如,源端是VARCHAR类型的数据写到INT类型的目标列...

导入接口介绍

如果当前加载任务存在,则当该加载任务出现终止现象时,系统会自动恢复加载。如果不存在则会停止加载。注意 加载程序会避免重新加载已经成功完成的任务,并且只会尝试处理失败的文件。目前不支持RESUME模式,不能恢复失败的加载任务。AUTO...

使用Python SDK执行滚动升级任务

(可选)执行回滚任务 如果滚动升级过程中出现异常,或者滚动升级后又需要使用历史配置,您可以执行回滚任务为伸缩组内ECS实例恢复配置。本步骤提供示例代码,演示如何回滚已经执行的滚动升级任务。创建Python脚本并输入执行回滚任务的代码...

问题汇总

任务实例状态异常 运维中心周期任务没有找到该任务 有周期任务,但是周期实例一个都没有 有周期任务,有其他周期实例,但是这个任务没有产生周期实例 有周期任务,有周期实例但未运行 任务运行必须满足的条件有哪些?任务冻结与解冻 冻结...

查询个主动运维任务信息

该接口用于查看RDS实例的计划内运维任务详情。接口说明 适用引擎 RDS MySQL RDS PostgreSQL RDS SQL Server RDS MariaDB 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成...

查询个主动运维任务信息

该接口用于查看RDS实例的计划内运维任务详情。接口说明 适用引擎 RDS MySQL RDS PostgreSQL RDS SQL Server RDS MariaDB 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成...

查询个主动运维任务信息

该接口用于查看RDS实例的计划内运维任务详情。接口说明 适用引擎 RDS MySQL RDS PostgreSQL RDS SQL Server RDS MariaDB 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成...

查询个主动运维任务信息

该接口用于查看RDS实例的计划内运维任务详情。接口说明 适用引擎 RDS MySQL RDS PostgreSQL RDS SQL Server RDS MariaDB 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
威胁情报服务 性能测试 云监控 Web应用防火墙 数据安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用