故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

Group Window Aggregate

新增、删除、修改Distinct的统计指标(distinct aggregate function)或者Distinct统计指标涉及字段的计算逻辑发生变化,该修改属于不兼容修改。原始SQL。select a,sum(b),count(distinct b),max(c),count(distinct c),tumble_start(ts,...

Window TVF

新增、删除、修改Distinct统计指标(distinct aggregate function)或者Distinct统计指标涉及字段的计算逻辑发生变化,该修改属于不兼容修改。原始SQL。select a,sum(b),count(distinct b),max(c),count(distinct c),tumble_start(ts,...

2024-03-13版本

当单个可用区发生故障时,Flink作业能够在另外一个可用区正常运行,从而有效避免因单个可用区故障导致服务中断,确保作业的持续性和高可用性。同城高可用 开通实时计算Flink版 资源调整 管理项目空间 修改虚拟交换机 算子探查(公测)支持...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

标准架构

主节点提供日常服务访问,从节点提供HA高可用,当主节点发生故障,系统会自动在30秒内切换至从节点,保证业务平稳运行。标准架构高可用类型的特点如下:可靠性 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

跨地域灾备

同时MaxCompute统一元数据能力支持元数据跨地域高可用,则当主集群地域发生故障且无法恢复时,通过修改项目归属地域的元数据,将项目快速切换到备份集群地域,实现业务的无缝恢复,示意图如下所示。重要 目前跨地域灾备功能处于邀测阶段,...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

步骤五:应用容灾

确保操作人员熟悉容灾恢复流程,当主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 页面,选择 恢复网络、...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

安全体系概述

本文从运行时安全、可信软件供应链和基础架构安全三个维度介绍阿里云容器计算服务(ACS)的安全体系,包括安全巡检、策略管理、运行时监控和告警、镜像扫描、镜像签名、云原生应用交付链、默认安全、身份管理、细粒度访问控制等。...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

错误码列表

当调用 函数计算 的API发生错误时,服务端会返回对应的错误信息。本文列举了 函数计算 中的错误码。您可以根据以下错误码对照表查找对应的解决方案。错误码格式 错误码包括HTTP的Status Code和响应Body中的具体错误细节。其中响应Body中的...

产品优势

与传统依赖人力的应用交付和运维方式相比,计算巢提供了智能高效、安全可靠的服务交付和运维体验,有助于提升服务商的服务能力、降低运营成本、提升用户的部署效率和降低用户管理软件和资源的成本。智能高效 计算巢集成了阿里云一系列底层...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

2024年

当地域级别故障发生时,可以进行地域切换,在备份集群地域基于已备份数据恢复生产。功能详细说明及使用请参见 跨地域灾备。目前跨地域灾备处于邀测阶段,如您需要使用此功能,请单击 申请开通,在新功能试用申请页面申请开通使用跨地域灾备...

应用场景

本文介绍计算巢的主要应用场景。应用交付和部署高效便捷 传统模式下,服务商通过全人工或者半自动化的方式完成云资源的创建和应用部署,需要大量的人工介入,且应用部署复杂、依赖人工经验。服务商的部署场景如下:应用软件使用云服务众多...

同城高可用

同城高可用功能可有效避免单个可用区故障导致的服务中断,确保业务的稳定性。Flink支持对包年包月的工作空间开启跨可用区,以实现同城高可用。本文为您介绍如何开启并使用跨可用区,以及停止跨可用区计费等。功能介绍 包年包月工作空间...

配置网络

您在 函数计算 创建的函数,默认可以访问公网,无法访问VPC内的资源。如果您需要函数能够访问VPC内的资源,或允许指定的VPC来调用函数,那么您需要手动为函数配置网络和权限。本文介绍如何通过 函数计算 控制台为函数配置网络。注意事项 ...

更新故障时间线

PROBLEM_KEY_NODE content String Body 否 故障分析 节点内容 time String Body 否 2021-01-08 10:10:10 发生时间 problemId Long Body 否 234 故障id clientToken String Body 否 c26f36de-1ec8-496a-a828-880676c5ef81 幂等标识 返回数据...

配置网络

您在 函数计算 创建的函数,默认可以通过公网调用,无法通过VPC调用。如果您需要函数能够访问VPC内的资源,或允许指定的VPC来调用函数,那么您需要手动为服务配置网络访问能力。网络配置为服务级别,即对服务下的所有函数生效。本文介绍...

身份管理

在RAM用户职责发生变化时将其从不再归属的用户组中移除,避免权限滥用。在某个用户组不再需要某些权限时移除用户组对应的权限。RAM用户组相关操作 RAM用户组管理 RAM角色 RAM角色是一种虚拟用户,可以被授予一组权限策略。与RAM用户不同,...

身份管理

在RAM用户职责发生变化时将其从不再归属的用户组中移除,避免权限滥用。在某个用户组不再需要某些权限时移除用户组对应的权限。RAM用户组相关操作 RAM用户组管理 RAM角色 RAM角色是一种虚拟用户,可以被授予一组权限策略。与RAM用户不同,...

GetAutoScaleConfig-获取自动伸缩配置信息

调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,用来给RAM用户或RAM...

服务条款

服务条款 本服务条款是阿里云计算有限公司(以下简称“阿里云”)与您就批量计算服务(Batch Computing Service,简称BatchCompute)的相关事项所订立的有效合约。您通过盖章、网络页面点击确认或以其他方式选择接受本服务条款,包括但不...

ECS资源复用版

ECS资源复用版是MaxCompute按量付费类型中的一种实例规格,旨在将ECS闲置实例转换为可用的MaxCompute计算资源,该方式可以充分利用已有的计算资源,而不需要额外购买新的MaxCompute计算资源,从而在满足大数据处理需求的同时,提高资源利用...

内置全密态能力

全程密文 数据在客户端加密后将密文发往数据库服务端,服务端随后将加密数据和操作请求发往可信执行环境进行计算,并将由可信执行环境加密后的结果返回客户端自行解密;数据对于数据库服务端全程加密。强安全性 相同数据内容(明文)在数据...

资源调整

实时计算Flink版支持对工作空间和项目空间的资源进行调整。您可以创建多个项目空间,为每个项目空间分配单独的资源和权限,通过项目空间实现资源和权限的完全隔离。本文为您介绍如何进行工作空间和项目空间的资源调整。注意事项 当RAM用户...

历史功能发布记录(2023年及之前)

12-31 使用容器服务部署多租版全托管WordPress服务 计算巢支持用户创建包含快照策略功能的服务并使用快照回滚服务实例云盘 在创建服务时,经常会出现需要定期为云盘备份数据,以应对因误删、勒索病毒等造成的数据丢失或者应用系统故障的...

关于我们

其参与的隐私计算标准有:国家标准《个人信息去标识化效果分级评估规范》国家标准《信息安全技术多方数据融合计算安全指南》行业标准《基于安全多方计算的数据计算平台技术要求与测试方法》行业标准《基于可信执行环境的数据计算平台技术...

实例级别事件

函数计算 提供实例级别的事件,通过实例级别事件您可以了解函数实例完整的生命周期,包括实例构建、销毁的流程以及其中各步骤发生的时间点。本文介绍函数实例的生命周期以及实例级别事件的定义、转移流程、类型和查询方式。函数实例的生命...

实例级别事件

函数计算 提供实例级别的事件,通过实例级别事件您可以了解函数实例完整的生命周期,包括实例构建、销毁的流程以及其中各步骤发生的时间点。本文介绍函数实例的生命周期以及实例级别事件的定义、转移流程、类型和查询方式。函数实例的生命...

2023年功能发布记录

服务接入地址 2023年03月 功能名称 变更类型 功能描述 相关文档 实例级别事件 新增 函数计算将您的实例发生各个重要状态变化的时间点定义为各类事件,并支持在实例详情页面进行可视化展示。通过实例级别事件,您不仅可以观察到实例的生命...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 函数计算(旧版) 云服务器 ECS 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用