步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

作业引擎版本升级

如果您的作业属于有状态计算,那么在升级版本时,首要考虑的是状态能否复用。升级前请先手动生成一个作业快照,以便升级出现异常时可以快速回滚业务。具体操作请参见 手动创建作业快照。重要 原则上同一大版本下的小版本间升级兼容,大版本...

Serverless GPU概述

Serverless GPU是一种新兴的云计算GPU服务,它采用了服务器感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细...

Serverless GPU概述

Serverless GPU是一种新兴的云计算GPU服务,它采用了服务器感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细...

2023年功能发布记录

使用fc-canary插件进行灰度发布 使用fc-release插件发布正式版本 GPU实例闲置模式(公测中)新增 GPU实例新增闲置计费模式,默认情况下,闲置模式处于关闭状态,开启闲置模式后,当预留的实例请求时,函数计算会将实例的vCPU和GPU冻结,...

设计原则

自动化监控与报警:通过自动化监控系统,实时监测云计算环境的状态,如网络、存储、计算资源等。当发生异常或故障时,及时发出警报并采取相应的响应措施;容灾演练:定期进行容灾演练,模拟灾难事件,并测试数据恢复的能力和容灾计划的有效...

高德

解决方案 经过方案评估判断,此场景类型属于无状态服务,基于阿里云Serverless成熟的生态,高德最终选择接入Node FaaS(阿里云函数计算)服务能力,出行前端搭建了场景推荐卡片服务。卡片的UI模板获取、数据请求聚合与逻辑处理、拼接生成...

配置治理项

在 治理项配置 页面,您可以通过 研发、质量、安全、计算、存储 等维度,查看对应治理项的相关信息,并为可选治理项配置启用状态排除规则。下图以研发维度为例,为您介绍治理项的相关信息及配置操作。区域 描述 ① 该区域为您展示了当前...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

自动伸缩最佳实践

本文以使用LAMMPS软件进行高性能计算介绍如何配置自动伸缩策略。背景信息 当您需要每天不定时提交作业,使用E-HPC集群几个小时进行大规模计算,然后释放节点,您可以针对不同的作业类型,配置不同的伸缩策略。配置伸缩策略后,系统可以根据...

断网续传

边缘计算服务未对实际的存储路径进行限制,如果该路径下当前用户读写权限,会造成 message-router 服务异常。获取节点个数 命令:/linkedge/gateway/build/bin/lectl config get gw_history_record_node_num 返回值:Set config success....

计算资源使用

配额组(Quota)是MaxCompute的计算资源池,为MaxCompute中的计算作业提供所需计算资源(CPU及内存)。在MaxCompute中支持根据计算作业对计算资源的需求,指定匹配的Quota,助力您高效使用计算资源。本文为您介绍如何使用MaxCompute的Quota...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

实例级别指标

函数计算推出实例级别指标功能,可以帮助您解决以上遇到的问题以及了解函数计算各个实例的健康状态。什么是实例级别指标 实例级别指标是函数实例维度的性能指标,对函数实例进行实时监控和性能数据采集,并进行可视化展示,为您提供函数...

作业启动

无状态启动 当您是新上线作业或者无法复用State时,需要选择无状态启动。此外,您需要根据业务情况决定是否打开自动调优。策略 说明 指定源表开始时间 选中 指定源表开始时间 并指定具体的时间信息。配置自动调优 打开该开关后,您需要选择...

实例级别指标

函数计算推出实例级别指标功能,可以帮助您解决以上遇到的问题以及了解函数计算各个实例的健康状态。什么是实例级别指标 实例级别指标是函数实例维度的性能指标,对函数实例进行实时监控和性能数据采集,并进行可视化展示,为您提供函数...

服务等级协议

1.5 每5分钟错误率:根据区域的不同 以每5分钟为单位按照如下方式计算:每5分钟错误率=每5分钟失败请求数/每5分钟有效总请求数x100%注:当出现平台服务故障而无法获取失败请求数时,将通过计算前7个自然日用户每分钟请求数的平均值,用该...

数据库访问失败的常见原因

数据库中函数计算连接请求,请跳转步骤 2。数据库中有函数计算连接请求,请跳转步骤 4。检查访问数据库的用户名和密码是否正确。用户名和密码正确,请跳转步骤 3。用户名和密码不正确,重新输入正确的用户名或密码。登录实例并尝试是否能...

弹性管理(含预留模式)

函数计算 为您提供按量模式和预留模式两种实例使用模式。您可以根据两种模式对应的实例总数及实例扩容速度的限制信息配置对应的弹性伸缩规则。在预留模式下,您可以通过定时修改限制和根据指标修改限制两种方式解决预留实例利用不充分的...

基本概念

本文介绍 函数计算 的专有名词的定义,方便您更好地理解相关概念并使用 函数计算。基本概念总览 分类 名称 通用概念 服务、FC函数、请求处理程序、版本、别名、标签、层、触发器、运行时、自定义域名 计费相关 按量付费、资源包 实例相关 ...

函数实例生命周期回调

函数计算 仅在客户端主动取消请求时,向相关实例发送SIGTERM信号,如有需要,您可以在容器业务逻辑内自行捕获SIGTERM信号。回调方法 当您实现并配置函数实例生命周期回调后,函数计算 将在相关实例生命周期事件发生时调用对应的回调程序。...

准备工作

3.获取 AccessKeyId 和 AccessKeySecret 进入 AK控制台 获取 AccessKeySecret:找到启用状态的 AccessKeyId 点击显示,即可获取对应的 AccessKeySecret。如果没有可用的 AccessKeyId 可点击右上角的”创建 Access Key”按钮,创建成功后,...

函数实例生命周期回调

回调方法 当您实现并配置函数实例生命周期回调后,函数计算 将在相关实例生命周期事件发生时调用对应的回调程序。函数实例生命周期涉及Initializer、PreFreeze和PreStop三种回调。更多信息,请参见 函数实例生命周期回调。Path 输入请求 ...

CREATE TABLE AS(CTAS)语句

宽容模式应该在首次启动CTAS作业时开启,如果在首次启动时未开启宽容模式,需要删除下游表并且将作业无状态重启才能生效。暂不支持同步以下Schema的变更:主键或索引等约束的变更。非空列的删除。从NOT NULL转为NULLABLE变更。重要 如果...

2023-08-21版本

除引擎内核与状态后端升级外,本次发布进一步增强了Flink与阿里云各存储和计算产品间的互操作性,提供了更丰富的连接器功能,并提升了性能和稳定性。主要包括:正式推出MongoDB CDC连接器,进入公测阶段,支持高效地从MongoDB数据库中...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

实例运行状态概览

计算节点连接健康状态 计算(Segment)节点连接健康状态。说明如下:红:节点连接数使用率大于等于95%。黄:节点连接数使用率大于等于90%且小于95%。绿:节点连接数使用率小于90%。说明 计算节点的连接数使用率为所有计算节点中的连接数...

函数实例生命周期回调

回调方法 当您实现并配置函数实例生命周期回调后,函数计算 将在相关实例生命周期事件发生时调用对应的回调程序。函数实例生命周期涉及Initializer和PreStop三种回调。更多信息,请参见 函数实例生命周期。下文介绍Initializer回调方法,...

数据组织优化

由于每次执行至少需要读写一遍数据,将会消耗计算和I/O资源,存在一定的读写放大问题,当前MaxCompute引擎能够根据系统状态自动触发执行,以确保Clustering服务的高效执行。Clustering服务针对大量文件导致的读写效率问题提供了优化解决...

函数实例生命周期回调

回调方法 当您实现并配置函数实例生命周期回调后,函数计算 将在相关实例生命周期事件发生时调用对应的回调程序。函数实例生命周期涉及Initializer和PreStop回调。更多信息,请参见 函数实例生命周期。Path 输入请求 期望的响应(可选)...

DATASOURCE:ECS:DedicatedHosts

故障潜伏期,其物理机处于可用状态,但可能导致专有宿主机中的ECS实例出现问题。PermanentFailure:故障。永久性故障,专有宿主机不可用。ZoneId String 否 是 可用区ID。 ResourceGroupId String 否 是 资源组ID。 ...

查看与修改作业运行状态

本文为您介绍如何查看和修改作业运行状态,以及不同状态所代表的含义。前提条件 其他阿里云账号或RAM用户共同使用实时计算Flink版产品时,需要为阿里云账号或RAM用户授权,以进行查看与修改作业运行状态等相关操作,详情请参见 作业操作...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

新功能发布记录

2023-06-30 云盒计算资源配置最佳实践 维修事件 云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。2023-06-30 响应云盒维修事件 新增地域 新增以下两个地域:华东2...

如何设置录制回调

视图计算录制新状态回调,录制完成后会通知用户相应的结果以及录制状态。注意事项 支持配置HTTP/HTTPS URL,向用户服务器发送POST请求、消息体JSON格式,将录制结果和状态信息实时反馈给用户,用户服务器通过200响应返回接口返回结果。URL...

功能特性

监控专有宿主机 运维 故障迁移 如果一台DDH有潜在故障风险,其物理机处于可用状态,但随时可能出现故障,导致DDH中的ECS实例出现问题。您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。迁移有潜在故障风险...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
函数计算(旧版) 轻量应用服务器 云数据库 RDS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用