节点异常问题排查

2 Insufficient ephemeral-storage 其中调度判定节点资源不足的计算方式为:集群节点CPU资源不足的判定方式:当前Pod请求的CPU资源总量>(节点可分配的CPU资源总量-节点已分配的CPU资源总量)集群节点内存资源不足的判定方式:当前Pod...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

什么选择安全沙箱?

本文介绍安全沙箱运行时的核心优势、适用场景,并对比容器服务Kubernetes版(ACK)安全沙箱和社区Kata Containers的性能,帮助您了解为什么选择安全沙箱运行时。背景信息 相比原有Docker运行时,安全沙箱为您提供了一种新的容器运行时选项...

标签策略概述

资源组标签自动继承到组内资源资源组绑定标签后,当在资源组中创建资源或者将资源加入到资源组时,该资源会自动继承资源组的标签。标签策略模式 标签策略支持当前账号标签策略和资源目录标签策略两种。您可以根据实际的使用场景和当前...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

管理成员的常见问题

本文介绍了管理成员过程中可能遇到的常见问题。成员基本操作 管理账号、成员、资源账号、云账号、根用户、RAM用户之间的区别是什么?管理账号 管理账号(Management Account,简称MA)是一个经过 企业实名认证 的阿里云账号。您可以使用...

管理成员的常见问题

本文介绍了管理成员过程中可能遇到的常见问题。成员基本操作 管理账号、成员、资源账号、云账号、根用户、RAM用户之间的区别是什么?管理账号 管理账号(Management Account,简称MA)是一个经过 企业实名认证 的阿里云账号。您可以使用...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

点播CDN常见问题

TCP重传由于互联网中网络情况较为复杂,在出现网络拥堵、设备故障等情况下就会出现丢包,通常有3%~10%的数据会被互联网丢弃,数据包被丢弃后的重传动作是由操作系统内核层的协议栈处理的,无法记录到应用层日志中,因此这部分也会产生额外...

调度概述

ACK Scheduler是ACK基于Kubernetes Scheduling Framework扩展机制,针对不同任务负载、不同弹性资源的统一调度系统。ACK Scheduler支持不同弹性资源的混合调度、异构资源的精细化调度、批量计算的任务调度等,提升应用的性能和集群整体资源...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。按如下步骤进行故障切换:在 受保护服务器 页签,在要启动故障...

服务发布策略

蓝绿部署通过使用额外的实例资源来解决服务发布期间的不可用问题,当服务新版本出现故障时,也可以快速将流量切回旧版本。如下图所示,某服务旧版本为v1,对新版本v2进行冗余部署。版本升级时,将现有流量全部切换为新版本v2。当新版本v2...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

DATASOURCE:ECS:DedicatedHosts

故障潜伏期,其物理机处于可用状态,但可能导致专有宿主机中的ECS实例出现问题。PermanentFailure:故障。永久性故障,专有宿主机不可用。ZoneId String 否 是 可用区ID。无 ResourceGroupId String 否 是 资源组ID。无 ...

ALIYUN:ROS:CustomResource

ALIYUN:ROS:CustomResource类型用于创建自定义资源。在ROS模板中,您可以使用ALIYUN:ROS:CustomResource或Custom:String 资源类型来指定自定义资源。自定义资源为您提供了一种在ROS模板中编写自定义配置逻辑并使ROS在资源栈操作(如创建、...

作业运行常见问题

导致MaxCompute作业运行时长不达预期(作业运行慢)的原因通常可分为资源不足、作业问题、模式回退三种:资源不足 对于使用 包年包月 计算资源的作业,可能由于总体作业运行数据量大、申请资源多、作业优先级低而导致该作业出现资源等待...

ECS系统事件概述

系统事件由阿里云定义,用于记录和通知云资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。说明 阿里云有众多产品支持系统事件,例如ECS、RDS、SLB等。本文仅说明云服务ECS支持的系统事件,如需了解其他产品的系统...

标签的常见问题

本文介绍了使用标签时可能遇到的一些常见问题。哪些云服务支持标签分账?支持标签分账的云服务,请参见 支持标签的云服务 的 是否支持标签分账 列。如何为存量资源高效地绑定标签?对于未绑定标签或未划分资源组的存量资源,您可以采用...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

概述

不同的业务场景下可供使用的计算资源会有区别,数据探索支持的计算资源有:计算资源 版本要求 备注 MySQL>=5.6.10-Hive>=2.3.3-MaxCompute ALL-Spark Standalone spark 3.x Spark on yarn hadoop 3.x spark client:3.2.1 Hive Storage>=2.3...

事件中心事件汇总

MSE事件中心对注册配置中心、微服务治理、云原生网关生成的事件数据进行集成,让您感知所有MSE托管资源的事件变更,并针对异常事件进行自主排查。本文介绍微服务引擎MSE支持的所有事件,并为各事件提供处理建议。Nacos 事件Code 事件名称 ...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

应用故障自动诊断

如果发现问题,则在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

新增逻辑表质量规则

背景信息 如果逻辑表字段配置了 关联字段标准 的值,则在质量规则页面,Lindorm、RDS MySQL、PostgreSQL、AnalyticDB PostgreSQL和 PolarDB for PostgreSQL 云计算资源类型下,系统自动生成字段规则并同步显示在质量规则管理页面。...

了解数据资源平台用户和角色体系

数据资源平台提供了完善的权限管控机制,支持以租户或工作组为管控粒度,通过对用户授予不同的角色实现全局或工作组内的各组件功能权限管控。本文为您详细介绍租户、工作组粒度下的角色体系。背景信息 数据资源平台功能权限是基于角色的...

DDH常见问题

本文介绍DDH相关的常见问题及解决方案。DDH相关的常见问题及解决方案如下:什么是专有宿主机DDH?DDH有什么优势?在什么场景下需要购买DDH?DDH是裸机产品吗?DDH与弹性裸金属服务器有什么区别?怎么创建和释放DDH?怎么查看每台DDH上有...

网络资源

网络资源是指用于节点之间通信和数据传输的硬件和软件资源,除了包括广域网、局域网、交换机、路由,还包括常用到的专有网络、虚拟交换机、负载均衡、弹性公网、VPN、DNS、CDN等资源。在分布式系统中,网络资源的主要作用是支持节点之间...

阿里云资源编排服务(ROS)服务条款

阿里云对阿里云资源编排服务按“现状”提供,对资源编排服务不作任何明示或暗示的保证,包括但不限于服务的适用性、没有错误或疏漏、持续性、准确性、可靠性、适用于某一特定用途,但阿里云愿意同您一同合作解决问题,并承诺不断提升服务...

存储资源

存储资源是指用于存储和管理数据的硬件和软件资源,包括节点的本地磁盘、分布式文件存储、数据库和缓存等。存储资源的主要作用是存储和管理系统的数据。存储资源需要提供数据的持久性、可靠性和高效性,以满足系统的数据存储和访问需求。...

创建MySQL集群

主实例的数据同步到备实例,当主实例出现故障无法访问时,自动切换到备用实例。说明 高可用 支持本地盘存储和云盘存储。专属集群名称 专属集群的名称。专有网络 专属集群归属的专有网络VPC。如需创建新的专有网络,您可登录 VPC控制台...

管理MySQL集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

查看应用分组

通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在 组概览 页面,您可以查看目标应用...

云系统侧出现问题

前提条件 您已通过自助问题排查功能中的 实例问题排查>实例无法连接或启动异常>实例启动异常 诊断项对ECS实例进行了诊断排查,诊断结果中有以下一项或多项检查未通过:实例库存资源 其他云系统问题 快照或镜像问题 实例私网IP资源问题 磁盘...

删除资源栈中的资源失败怎么办?

资源栈删除失败一般是因为资源栈中的资源删除失败,本文为您介绍如何解决资源删除失败的情况。删除失败的资源还绑定其他资源 问题示例:安全组资源失败,错误码:DependencyViolation,错误信息:There is still instance(s)in the ...

资源目录中的RAM角色

资源目录移除成员时,资源目录广播该消息给可信服务,可信服务自主决定是否自动删除服务关联角色(AliyunServiceRoleFor*)。一般情况下,可信服务自动删除该服务关联角色。但某种特定情况下可能不会自动删除,此时,您可以登入...

资源组设计最佳实践

使用资源组对资源进行分类管理后,带来以下好处:提升管理效率:资源完成分组后,您能够以资源组为单位进行资源部署、资源监控和权限管理等,而不是单独处理各个资源。例如:如果您想限制某项目组的成员只拥有该项目组资源的权限,那么,...

基本概念

RDPath RDPath是指资源实体(资源夹或成员)在资源目录中的位置信息,即从资源实体当前位置(资源实体ID)向上直到资源目录(资源目录ID)的全部路径ID组合。格式:资源夹RDPath:<资源目录ID>/资源夹ID>/……/<当前资源夹ID>。成员RDPath...

UpdateTemplateScratch-更新资源场景

说明 如果资源范围较大,同步执行的时间比较长,推荐同时指定 ClientToken,以避免超时问题。Sync ResourceGroupId string 否 资源组 ID。rg-acfmxazb4ph6aiy*请求参数补充说明 关于公共请求参数的详情,请参见 公共参数。请求参数中,...

安装WordPress和phpMyAdmin环境

模板示例 创建一个WordPress可弹性伸缩的集群 可以帮助您快速安装WordPress和phpMyAdmin环境,创建包含VPC、负载均衡、弹性伸缩、ECS实例、RDS实例等资源资源栈。ROS根据需要,自动添加、配置新的实例,无须您手动操作。步骤一:创建...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 商标服务 负载均衡 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用