强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

演练场景说明

K8s类场景 场景名称 特性 Node演练场景 Kubernetes集群中Node资源故障场景,目前包含基础资源中的CPU、网络和进程。每个Node场景下都包含通用的Node筛选参数,用于查找目标Node。Pod演练场景 Kubernetes集群中Pod资源故障场景,包含删除Pod...

MSE注册配置中心和自建注册配置中心对比

MSE Nacos和自建Nacos对比 对比项 MSE Nacos专业版 自建Nacos 系统搭建及运维成本 资源全托管免运维,内置SLB,自动绑定域名,故障节点自动摘除。需自行购买各种资源搭建系统,运维升级需投入精力,人工成本高。易用性 系统参数已调优,...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

故障管理

在IT和互联网企业的实践中,以下情况都有可能造成故障:按计划进行的硬件、操作系统维护所引起的故障,包括更换硬盘、操作系统补丁。应用性故障,包括软件应用性能问题、应用缺陷(bug)、系统应用变更。人为操作故障:包括误操作以及不按...

查看应用分组

故障列表中的每条记录,表示资源的一个正在报警的监控项。当您禁用正在发生报警的规则后,规则对应资源的监控项将不在故障列表中显示。可用性监控 您可以查看目标应用分组内可用性监控任务,也可以创建、修改、删除、启用或停用可用性任务...

配置任务时提示资源不足怎么办?

问题描述 配置任务时,系统提示资源不足,出现报错:xxxx resource is insufficient。可能原因 所在的区域资源不足。任务跨国际站点,导致没有对应的资源。解决方案 若原因为任务跨国际站点,请修改任务配置。目前不支持跨境的双向同步,若...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...

系统故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

计费说明

每日任务实例数(个/天)100 1000 10000 100000 500000 系统计算资源√自定义计算资源×服务规格 阿里云工单系统√钉钉大群5*8答疑服务×钉钉专属群×配置费用 新客专享 1元/首月 500元/月 3000元/月 6000元/月 240000元/年 说明“√”表示...

使用标签策略实现基于资源组的标签自动继承

通过资源组标签自动继承功能,您在资源组中创建资源或者将资源加入到资源组后,该资源会自动继承资源组的指定标签。背景信息 支持资源组标签自动继承功能的云服务,请参见 支持标签策略的云服务 的 是否支持资源组标签自动继承 列。操作...

GxP欧盟附录11标准合规包

16.1 为了提供支持关键过程的计算机化系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...

购买指引

每日任务实例数(个/天)100 1000 10000 100000 500000 系统计算资源√自定义计算资源×服务规格 阿里云工单系统√钉钉大群5*8答疑服务×钉钉专属群×说明“√”表示支持,“×”表示不支持。购买时长:各版本购买时长各异。说明 试用版仅...

创建文件系统

如果您未选择资源组,在创建文件系统成功后,文件系统将自动归类到默认资源组。如果您需要新建资源组,请单击 创建资源组,并在 创建资源组 对话中配置 资源组标识 和 资源组名称,然后单击 确定。专有网络 选择已创建的VPC网络。必须选择...

功能架构

应用监控 系统能同时监控容器应用和经典应用,并通过 LDC、IDC 和单机实例等多视角、多维度逐层下钻分析,实时展现服务实例、依赖的中间件和基础资源运行状态、使用趋势和告警信息,发掘应用故障所在的层级和对象,保证应用的流畅运行。...

创建标签策略

资源自动继承资源组标签 您可以为资源组绑定标签,然后在标签策略中设置资源自动继承资源组标签,就可以实现当资源组中创建资源或者将资源加入到资源组时,该资源自动继承资源组的指定标签。规则 说明 标签键 输入标签键名称。为此标签键...

标签策略快速入门

资源自动继承资源组标签 您可以为资源组绑定标签,然后在标签策略中设置资源自动继承资源组标签,就可以实现当资源组中创建资源或者将资源加入到资源组时,该资源自动继承资源组的指定标签。规则 说明 标签键 输入标签键名称。为此标签键...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

计费常见问题

如果购买了中国内地资源包且文件系统都在同一个地域的用户,建议您与推荐的选购资源包方案结合后,再购买地域资源包或升级中国内地通用资源包的通用型基准容量。不支持抵扣项:低频存储读写流量、归档存储容量、归档存储读写流量。如果您...

使用配置审计查找未绑定指定标签的资源

您可以设置排除资源ID、资源组、地域和标签,确定检测资源的范围。本示例中,需要查找ECS、EIP、OSS和RDS中未绑定指定标签的资源,所以资源类型选中ECS、EIP、OSS和RDS。在 设置修正 页面,设置是否执行修正,然后单击 提交。您可以打开 ...

解绑和删除自定义标签

如果自定义标签不再适用于管理和查找资源,您可以解绑该资源的...删除自定义标签 解绑自定义标签后,如果该自定义标签没有绑定其他任何资源系统会在24小时内自动将其删除,不需要您手动删除。相关文档 UntagResources-为云资源统一解绑标签

Terraform支持的功能和资源

其中,部分资源支持询价、系统标签、传递资源栈用户标签、传递资源栈所属资源组和风险检查,具体如下:说明 您可以调用 GetFeatureDetails 接口,获取支持询价、系统标签、传递资源栈用户标签、传递资源栈所属资源组和风险检查的资源类型...

资产注册

前提条件 已在系统设置模块中添加云计算资源。背景信息 资产注册功能是 数据资源平台 资产管理的基础。操作步骤 登录 数据资源平台控制台。在页面左上角,单击 图标,选择 运营。在顶部菜单栏,单击 资产注册。说明 若已在 资产注册 页面,...

查看和运行SMC客户端

具体操作,请参见 故障排除。说明 如果您需要停止客户端迁移或修改客户端配置,可参考以下操作步骤退出SMC客户端。Linux Linux版本客户端默认在后台运行,可执行以下命令退出后台进程:./go2aliyun_client-abort Windows Windows版本客户端...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

创建自定义管控策略

您可以创建自定义管控策略,限制对某些资源执行某些操作,为资源目录内的资源夹和成员定义权限边界。创建方式 通过可视化编辑模式创建自定义管控策略 系统提供所见即所得的可视化编辑界面,您只需选择效果、云服务、操作、资源和条件,就...

同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

产品架构

完善的自我保护:实时监控系统资源,不占用过多带宽。非用户手动卸载情况下的异常退出时,可以进行自我保护,保证AHAS Agent在主进程消失的情况下,可以自动重启。ChaosBlade ChaosBlade是AHAS Agent的核心组件,用来解析、校验和执行服务...

查看实例的系统日志和屏幕截图

系统通过串口打印输出的日志会包含两种类型的信息,一类是系统启动开机时的日志内容,另一类是系统内核故障或异常时的日志内容。更多详情,请参见《云栖社区》博客 操作系统有异常?诊断日志来帮忙。使用限制 使用该功能时您需要注意如下...

通过云计算资源扫描创建逻辑表

您可以将已存在物理数据库中的数据表,通过云计算资源扫描方式,导入数据资源平台系统,实现逆向创建逻辑表,本文介绍如何通过云计算资源扫描方式创建逻辑表。前提条件 已新建工作组“信息中心(xxzx)”,具体操作,请参见 新建工作组。已在...

AIOps 解决方案专家服务内容说明

调研的服务范围包含:基础资源调研、业务现状调研、应用系统调研《调研报告》2 智能故障发现方案设计 基于业务数据、资源组维度建立业务组单元,将业务组单元指标通过智能AI算法进行实时分析,帮助企业快速发现故障,列出可疑根因事件,并...

操作流程

通过云计算资源 将已存在数据库中的数据表,通过云计算资源扫描方式,导入 数据资源平台 系统,实现逆向创建逻辑表。具体操作,请参见 通过云计算资源导入逻辑表。通过Excel导入 将Excel表里的逻辑表表名、字段信息、所属层级、关联信息...

单实例快速恢复

为了能够快速恢复系统故障,Hologres提供了单实例快速恢复的机制。本文为您介绍单实例快速恢复的触发条件和行为。实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器...

通过云计算资源导入逻辑表

您可以将已存在数据库中的数据表,通过云计算资源扫描方式,导入 数据资源平台 系统,实现逆向创建逻辑表。本文介绍如何通过云计算资源扫描方式创建逻辑表。前提条件 已添加工作组,具体操作,请参见 新建工作组。已新建目录,具体操作,请...

产品升级公告

但产品缩写不变:产品名称从原来的「运维编排服务(Operation Orchestration Service,OOS)」变更为「系统运维管理(CloudOps Orchestration Service,OOS)」,新产品名称更符合产品本身的定位和能力范围,即聚焦于云资源操作系统的管理和...

UntagResources-为云资源统一解绑标签

接口说明 解绑后,如果该标签没有绑定其他任何资源系统会在 24 小时内自动将其删除。支持标签的云服务,请参见 支持标签的云服务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

为什么选择安全沙箱?

当节点上某一应用异常和故障,如内存泄露、频繁CoreDump等等导致节点整体负载升高,单容器触发Host Kernel Bug导致系统宕机,单应用的故障延展到了整个节点,甚至进一步导致整个集群的不响应。安全沙箱(runV)容器通过独立的GuestOS ...

部署和使用跨可用区实例

同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
视频点播 弹性公网IP 负载均衡 云安全中心 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用