密钥轮转概述

如果第一次执行(突发性)密钥轮转是在响应具体事件的情形下,并且发生在运行中的系统上,则发生故障的概率会被无限放大。对数据形成逻辑上的隔离 轮转加密密钥使得轮转前后产生的密文数据形成事实上的隔离效果。特定密钥的安全事件可以被...

产品架构

高可用管理平台 HAS 在蚂蚁 SOFA 中间件以及 Café 应用发布平台的基础上,为用户应用及蚂蚁应用提供日常巡检、风险管理、应急预案、故障演练等技术风险管理能力,满足用户应用巡检、故障处置、应急管理故障演练等多种应用运维场景。...

副本集实例设置主备切换

当某个节点发生故障时,云数据库的高可用系统会自动触发切换操作,保障整体的可用性。同时,云数据库MongoDB提供主备切换功能,供用户在日常容灾演练等场景自行触发切换操作。背景信息 通过控制台或接口 SwitchDBInstanceHA 操作主备切换后...

什么是应用配置管理ACM?

凭借配置变更、配置推送、历史版本管理、灰度发布、配置变更审计等配置管理工具,ACM能帮助您集中管理所有应用环境中的配置,降低分布式系统中管理配置的成本,并降低因错误的配置变更造成可用性下降甚至发生故障的风险。迁移到MSE Nacos ...

托管节点池节点自动恢复

当节点的运行状态发生变化并持续一段时间后,ACK将判定该状态符合故障状态,存在节点故障。当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后...

什么是云监控

云监控通过提供跨云服务和跨地域的应用分组管理模型和报警模板,帮助您快速构建支持几十种云服务、管理数万实例的高效监控报警管理体系。云监控用于监控各云服务资源的监控指标,探测云服务ECS和运营商站点的可用性,并针对指定监控指标...

什么是云网管

观测平台(Observation Platform)基础设施运行状态维护管理,包含性能数据和告警数据,实现对各类监控对象的异常数据判定,网络故障的发现、分析、定位等维护管理。高效采集,分钟级故障定位发现。自定义采集方式和分析过程,兼容所有...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

创建DDH

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

常见问题旧版索引

弹性伸缩FAQ GPU FAQ 备份中心FAQ 注册集群FAQ 舰队管理FAQ 热点文章 集群网络 Kubernetes集群中访问LoadBalancer暴露出去的SLB地址不通 部署Ingress Controller使用私网SLB Kubernetes集群网络异常的排查方法 Kubernetes的Service如何进行...

创建专有宿主机

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

概述

在交通云控平台(下文以“云端”代指)完成对边缘计算终端的统一管控、配置升级、运行监测、故障报警等功能。此处所言“边缘”是相对于云计算中心而言的边缘。边缘计算终端指部署在数据源头(您的设备所在地)周边,可进行设备数据处理的...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

周期任务基本运维操作

任务运行问题诊断 问题现象:当任务到定时时间,但还未运行时,可能原因是该节点所有依赖的父节点还未运行成功、任务定时时间未到、项目下没有足够的调度资源可让任务运行、任务被冻结等。问题排查:建议您先通过DAG面板中的 上游分析 功能...

运维中心概述

运维中心功能模块 当您在DataStudio中完成节点开发,并提交和发布至生产环境后,即可在运维中心对任务进行运维操作,包括周期调度任务的自动调度手动运行、任务运行详情查看、任务运行状态监控、任务运行使用的资源监控自动运维;...

发现和排查实例问题

合理使用监控相关的功能可以帮助您及时发现和排查实例问题,在故障发生前处理掉潜在风险,避免影响业务。诊断实例的健康状态 实例健康诊断功能可以全方位诊断实例的操作系统配置、网络状态、磁盘状态等。诊断报告中针对异常诊断项目的影响...

SAP系统高可用环境维护指南

SAP高可用环境维护概述 SAP HANA高可用常见维护场景 1.主节点异常后处理 2.备节点异常后处理 3.主备节点停机维护 4.主节点停机维护 5.备节点停机维护 版本管理 版本 修订日期 变更类型 生效日期 1.0 2019/4/15 1.1 2019/7/30 1.更新故障...

SetStorage-保存用户设置的存储信息

新增入参:RoleType 新增入参:RoleFor 2023-12-13 OpenAPI 错误码发生变更、OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:400 删除错误码:501 新增错误码:500 出参 OpenAPI 返回结构...

GetStorage-获取设置的存储信息

获取威胁分析响应产品在用户SLS中创建的存储设置,包含存储天数、存储地域等信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是...

什么是故障

除主动维护停服务外,导致业务/服务全局不可用的事件均为P1 故障 P1、P2 级别相关的定义要做到可监控。核心功能 故障应急:支持故障全局应急通告,电话、短信、邮件、IM多种通知渠道,确保故障关键进展及时通知至相关人员,加快信息...

功能特性

微服务有高性能分布式服务框架、微服务治理中心、高可靠的轻量级配置中心、多活数据中心等特性,本文主要介绍这些特性。高性能分布式服务框架 提供高性能和透明化的 RPC 远程服务调用,具有高可伸缩性、高容错性的特点。支持多协议、多序列...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

功能特性

高可靠的轻量级配置中心 提供应用运行时动态修改配置的服务,并提供图形化的集中化管理界面。配置动态推送实时生效 支持按全量 IP 地址及指定 IP 地址进行配置推送,无需重启应用,并支持推送回滚。客户端信息管理 可查看客户端列表信息,...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

支持计划-健康状态看板(SHD)

2.服务范围 阿里云通过SHD展示各主流产品在不同区域的运行状态 阿里云产品计划性维护事件公告推送 阿里云产品运行异常事件推送 服务范围不包含:代码开发 不在附录列表的第三方软件配置指导以及故障排查 所有第三方软件的安装、补丁更新、...

功能架构

分布式链路 分布式链路帮助运维人员、开发人员和架构师看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、...

检测范围说明

云安全中心通过安装在您服务器上的Agent和云端防护中心的联动,为您提供服务器的安全告警、漏洞管理、病毒查杀、基线检查、攻击分析等功能。关于云安全中心检测范围说明,请仔细阅读以下内容:说明 以下收集的服务器相关信息的内容如发生...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

ECS系统事件汇总

Scheduled:因系统维护实例重启计划中 Instance:SystemMaintenance.Reboot:Executing:因系统维护实例重启执行中 Instance:SystemMaintenance.Reboot:Executed:因系统维护实例重启已完成 Instance:SystemMaintenance.Reboot:Avoided:因...

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

混合云应用双活容灾最佳实践

说明 演练前,基于MSHA流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况RT≤200ms,错误率),以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。步骤二:应用故障注入 这里使用阿里云故障演练产品,对...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

Databricks Runtime

Databricks Runtimes是在Databricks集群上运行的一组核心组件。Databricks提供了几种类型的Runtime。Databricks Runtime Databricks Runtime包括Apache Spark,但还添加了许多组件和更新,这些组件和更新极大地提高了大数据分析的可用性,...

网络资源

容灾:建立容灾和高可用的系统架构,将系统部署在多个地理位置或数据中心,并使用负载均衡和故障切换技术,以确保即使发生网络分区,系统仍然可以继续提供服务。网络闪断故障 指网络连接在短时间内频繁中断和恢复,造成网络连接不稳定的...

安全体系概述

本文从运行时安全、可信软件供应链和基础架构安全三个维度介绍阿里云容器计算服务(ACS)的安全体系,包括安全巡检、策略管理运行时监控和告警、镜像扫描、镜像签名、云原生应用交付链、默认安全、身份管理、细粒度访问控制等。运行时...

什么是移动应用

关于移动应用的定位:支撑运维事件中心的核心业务在移动端开展,如运维事件/故障的响应、转交完结等事件运行生命周期内的重要节点和操作。打通PC端(阿里云控制台)移动端(钉钉、企业微信、飞书)之间的信息互通的渠道,方便用户在多...

ECS系统事件概述

是 本地盘实例事件 本地盘实例事件包括本地磁盘事件(如本地盘损坏)和本地盘实例的事件(如因本地盘受损导致实例可能无法正常运行、本地盘实例底层宿主机出现软硬件故障等)。说明 本地盘实例事件 仅为展示发生计划内运维事件或非预期运维...

MSE注册配置中心和自建注册配置中心对比

云产品集成 云原生网关、服务治理中心、ASM、EDAS、SAE深度集成,一站式体验各类云产品。不支持。推送轨迹 当查询注册中心服务的推送和配置中心的配置变更发布和推送时,清晰地观测推送功能的履约情况,从而提高问题的排查效率。不支持。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云安全中心 负载均衡 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用