什么是故障演练

适用场景 故障演练适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

扩展MapReduce(MR2)

相比于传统的MapReudce,MaxCompute提供的扩展MapReduce模型(简称MR2)改变了底层的调度和IO模型,避免作业时冗余的IO操作。与MaxCompute相比,MR2在Map、Reduce等函数编写方式上基本一致,较大的不同点发生在执行作业时,示例请参见 ...

代码逻辑场景

受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也代表每次请求发生故障的概率。填写小于或等于0,则表示100%发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过脚本...

如何在SchedulerX 2.0平台上托管ElasticJob任务

高可用 SchedulerX 2.0采用高可用架构,任务多备份机制,经历阿里集团多年双十一、容灾演练,可以做到整个集群任意2个节点发生故障或者任意一个机房断电,任务调度都不会受到影响。与开源ElasticJob的区别 对比项 开源ElasticJob ...

如何在SchedulerX 2.0平台上托管ElasticJob任务

高可用 SchedulerX 2.0采用高可用架构,任务多备份机制,经历阿里集团多年双十一、容灾演练,可以做到整个集群任意2个节点发生故障或者任意一个机房断电,任务调度都不会受到影响。与开源ElasticJob的区别 对比项 开源ElasticJob ...

如何管理应用级别的资源和任务优先级

例如,一个数据平台的应用,每天夜里会执行成千上万的报表,如果没有资源管理,应用可能会因为超负荷而发生故障。同时,一些核心报表也可能会有极强的时效性,必须在某个时间前生成,会对任务的优先级有强烈的需求。SchedulerX提供了资源...

JVM注入动态脚本

受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也代表每次请求发生故障的概率。填写小于或等于0,则表示100%发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过脚本...

Pod诊断

节点是否不可调度 检查节点是否不可调度。节点不可调度,请检查节点调度设置。具体操作,请参见 设置节点调度。节点OOM情况 检查节点是否出现OOM。节点出现OOM问题,请收集节点日志并 提交工单 处理。关于收集节点日志操作,请参见 一键...

概述

任务调度 TS(Task Scheduler)提供分布式任务调度框架,实现任务的分布式处理,并能规范、自动化、可视和集中对金融企业不同业务系统的任务进行统一的调度和全方位监控运维管理,达到所有任务有序、高效运行的目的,极大降低开发和...

附录:SOFAStack 产品目录

任务调度 任务调度(Task Scheduler,简称 TS)提供分布式任务调度框架,实现任务的分布式处理,并能规范、自动化、可视和集中地对金融企业不同业务系统的任务进行统一的调度和全方位的监控运维管理。产品架构 产品优势 支持集群任务...

周期任务补数据

周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的调度参数会根据补数据选择的业务时间自动替换成对应的值。本文为您介绍如何...

周期任务补数据

周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的调度参数会根据补数据选择的业务时间自动替换成对应的值。本文为您介绍如何...

Pod诊断

Pod初始状态 检查Pod是否正常初始。请检查Pod状态及日志。更多信息,请参见 Pod异常问题排查。Pod申请的GPU资源 检查Pod是否申请GPU资源,排除因为未申请GPU资源导致的Pod无法使用GPU。该Pod中没有声明GPU资源,如有需要,请检查Pod...

Pod诊断

Pod初始状态 检查Pod是否正常初始。请检查Pod状态及日志。更多信息,请参见 Pod异常问题排查。Pod申请的GPU资源 检查Pod是否申请GPU资源,排除因为未申请GPU资源导致的Pod无法使用GPU。该Pod中没有声明GPU资源,如有需要,请检查Pod...

应用容灾

当灾难发生时,多活系统可以分钟级内实现业务流量切换,用户甚至感受不到灾难发生。“同城多活架构”和“异地多活架构”(代号“单元”)都是典型的应用多活实现技术。应用多活的优势 分钟级RTO:恢复时间快,阿里内部生产级别恢复时间...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

功能特性

当风险事件发生时,风险事件中心会推荐执行的应急预案,供运维快速选择并自动化执行,从而通过标准处理流程,实现故障快速恢复。故障演练 故障演练 提供了故障注入能力,通过演练平台主动触发故障,以此观测应用软件的高可用性。故障...

故障管理

通过建立一个规范遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的MTTR,最终使故障造成的破坏性趋近于0。在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的...

调度模式

本文提供了您在调用API操作RPA客户端时可以设置的客户端调度状态。实例状态 状态说明 attend 不可调度 unmanned 可调度

主备方案介绍

主备容灾:当云数据库HBase实例因不预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

并行查询使用限制和兼容性问题

串行化隔离级别事务内的查询语句无法并行。隔离级别是Repeatable-read的情况下,事务内的INSERT.SELECT/REPLACE.SELECT查询部分无法并行。与串行执行结果可能不兼容的地方 错误提示次数可能会变化 串行执行中出现错误提示的查询,在并行...

Spring任务

通过对接SchedulerX任务调度可快速实现企业运用的支持。前提条件 客户端1.7.10及以上版本 采用Spring Boot模式接入SchedulerX平台具体操作,请参见 Spring Boot应用接入SchedulerX。接入指南 接入配置 以Spring Boot接入模式为例,应用...

UpdateTaskFlowSchedule-更新任务流调度配置

其中 定时调度可配置调度一次或周期调度,事件调度可配置的订阅包括任务流和任务流节点。配置更新后,将任务流重新发布并部署,新的任务流实例将按照配置的调度设置进行调度。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算...

产品简介

移动调度中心(Mobile Dispatch Center,MDC)是基于客户端用户业务属性进行用户分组的精细移动调度服务产品,能快速有效帮助客户达成业务分组灰度测试、A/B 测试、故障调优等目标。产品优势 移动调度中心的产品优势如下:用户级精准调度...

AI负载调度

弹性调度提供差异化调度ECS和ECI资源的能力,支持自定义弹性资源优先级调度策略。在应用发布或扩容过程中,按照自定义资源策略,设置应用实例Pod被调度到不同类型节点资源的顺序。同时在缩容过程中按照原调度顺序逆序缩容。例如在扩容过程...

机器人监控

“机器人监控”主要功能为查看当前系统中所有机器人的连接状态、认证状态、调度模式以及正在运行的应用。机器人监控列表 说明:【IP】:...【调度模式】:可调度、不可调度两种状态。监控设置 更改机器人默认的认证状态,和默认的调度状态。

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

Spring任务

通过对接SchedulerX任务调度可快速实现企业运用的支持。前提条件 客户端1.7.10及以上版本 采用Spring Boot模式接入SchedulerX平台具体操作,请参见 Spring Boot应用接入SchedulerX。接入指南 接入配置 以Spring Boot接入模式为例,应用...

配置逻辑表调度属性

逻辑表调度属性用于定义逻辑表任务在调度过程中的调度规则。本文为您介绍如何配置维度或事实逻辑表的调度属性。操作步骤 请参见 数据开发入口,进入数据 开发 页面。按照下图操作指引,选择您需配置调度属性的逻辑表,进入 调度配置 信息...

配置逻辑表调度属性

逻辑表调度属性用于定义逻辑表任务在调度过程中的调度规则。本文为您介绍如何配置维度或事实逻辑表的调度属性。操作步骤 请参见 数据开发入口,进入数据 开发 页面。按照下图操作指引,选择您需配置调度属性的逻辑表,进入 调度配置 信息...

什么是应用高可用服务AHAS

多活容灾 多活容灾MSHA(Multi-Site High Availability),是在阿⾥巴巴电商业务环境演进出来的多活容灾架构解决⽅案,可以将业务恢复和故障恢复解耦,有基于灵活的规则调度、跨域跨云管控、数据保护等能力,保障故障场景下的业务快速恢复...

设计方案

整体稳定性设计方案参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制进行互相调用的微服务架构,...

离线任务调度属性配置

调度属性用于定义节点在生产环境的周期调度方式。您可以通过配置属性中调度属性,配置任务调度周期与生效日期等。本文为您介绍如何配置任务的调度属性。操作步骤 在Dataphin首页,单击顶部菜单栏的 研发。按照下图操作指引,进入离线集成...

离线任务调度属性配置

调度属性用于定义节点在生产环境的周期调度方式。您可以通过配置属性中调度属性,配置任务调度周期与生效日期等。本文为您介绍如何配置任务的调度属性。操作步骤 在Dataphin首页,单击顶部菜单栏的 研发。按照下图操作指引,进入离线集成...

配置离线管道调度

调度配置用于定义周期性调度类型的离线管道任务在调度过程中的调度规则。本文为您介绍如何配置周期性离线管道调度配置。背景信息 依赖关系是两个或多个节点之间的语义连接关系,同时上游节点的状态将影响其他下游节点的运行状态。配置了...

配置离线管道调度

调度配置用于定义周期性调度类型的离线管道任务在调度过程中的调度规则。本文为您介绍如何配置周期性离线管道调度配置。背景信息 依赖关系是两个或多个节点之间的语义连接关系,同时上游节点的状态将影响其他下游节点的运行状态。配置了...

成本估算策略介绍

Pod成本的计算公式如下所示:权重值依据集群的调度水位确定,集群中CPU调度水位和内存调度水位的比例、权重的计算方式如下所示:CPU调度水位:内存调度水位:CPU权重:内存权重:使用示例 通过以下两种示例,展示如何选择成本估算策略。...

节点管理

信息模块 具体信息 基本信息 节点服务器 IP 节点的创建时间 调度状态:可调度状态 不可调度状态 机器详情:单击 前往查看 进入云服务器管理控制台,查看节点服务器详细信息,例如基本信息及配置、付费、监控等信息。注释:系统注释信息 ...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 音视频通信 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用