开启网格拓扑提高可观测性

健康状态可视化:网格拓扑以节点或边的颜色代表服务或请求的健康状态,帮助您快速找到出现问题的节点或请求。流量重放:流量重放允许您重放过去选中时间段内的流量状况,这使您有能力彻底检查感兴趣的时间段内的应用流量。步骤一:启用网格...

开启网格拓扑提高可观测性

健康状态可视化:网格拓扑以节点或边的颜色代表服务或请求的健康状态,帮助您快速找到出现问题的节点或请求。流量重放:流量重放允许您重放过去选中时间段内的流量状况,这使您有能力彻底检查感兴趣的时间段内的应用流量。步骤一:启用网格...

高可用版

支持版本 MySQL 8.0 MySQL 5.7 MySQL 5.6 拓扑图 优势 高可用性 高可用版实例有一个备节点,主节点的数据通过半同步或异步复制方式同步到备节点,当主节点出现故障无法访问时,自动切换到备节点。说明 当只读节点故障时,只读节点的备...

应用场景

出现这些故障时,如果用户业务部署在单个地区,那么就因为地区故障导致服务不可用,且不可用时间完全依赖故障恢复时间。通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。订阅规则 订阅...

CPU拓扑感知调度

ACK基于新版的Scheduling framework实现CPU拓扑感知调度,针对CPU敏感的工作负载提供更好的性能。本文介绍如何使用CPU拓扑感知调度。原理介绍 Kubernetes的节点运行多个Pod,其中部分Pod属于CPU密集工作负载。在这种情况下,Pod之间...

高可用系列

拓扑图 优势 高可用性 高可用系列实例有一个备节点,根据所选 参数模板 的不同,主节点的数据通过 半同步 或 异步 的方式同步到备节点,当主节点出现故障无法访问时,自动切换到备节点。高可用系列实例的主备节点可以部署在同一地域里...

普通公网NAT网关升级至增强公网NAT网关FAQ

增强公网NAT网关依然是支持多可用区容灾的,在创建或者升级的时候只需要您选择主可用区的交换机,备可用区的交换机不需要您选择,在主可用区出现故障的时候,增强公网NAT网关自动完成可用区容灾的切换。关联NAT带宽包的实例如何升级...

变更节点配置

规格族:统一为独享或通用,不允许独享和通用混部。节点存储类型 不支持每个节点独立变更,仅支持实例所有节点同时变更。仅支持在ESSD PL1、PL2、PL3三类云盘之间变更。节点存储空间 不支持每个节点独立变更,仅支持实例所有节点...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

开启消息订阅

DataWorks的OpenEvent通过...若您是首次使用,则会出现 单击授权 按钮,并且 添加事件分发通道 按钮将置灰,您需根据界面指引授权DataWorks访问EventBridge资源,授权后将自动在 RAM访问控制 的 身份管理>角色 中创建一个服务关联角色 ...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

基于IaC自动化部署事件总线

本文介绍如何应用IaC(Infrastructure as Code)理念自动化部署 事件总线EventBridge,帮助您解决大量云产品手工管理负担沉重的问题。背景信息 IaC是一种以代码来配置和管理虚拟机、网络等基础设施的实践方法。通过将基础设施代码化、版本...

普通公网NAT网关升级至增强公网NAT网关FAQ

增强公网NAT网关依然是支持多可用区容灾的,在创建或者升级的时候只需要您选择主可用区的交换机,备可用区的交换机不需要您选择,在主可用区出现故障的时候,增强公网NAT网关自动完成可用区容灾的切换。关联NAT带宽包的实例如何升级...

迁移有潜在故障风险的DDH

如果一台DDH有潜在故障风险,其物理机处于可用状态,但随时可能出现故障,导致DDH中的ECS实例出现问题。您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。前提条件 请先将DDH上的ECS实例全部停机,否则迁移...

分布式链路概述

分布式链路(原 SOFAStack 中间件中的 概述)逐步融合到业务智能可观测服务中,实现监控和链路分析一体化,方便用户对问题进行跟踪定位,对应用性能、调用链路进行实时分析。背景信息 分布式链路是面向分布式架构、微服务(比如 Spring ...

数据库代理常见问题

如果您在使用RDS MySQL数据库代理过程中存在疑问或遇到问题,可以参考本文查看解决方案。目录 什么是数据库代理?通用代理和独享代理有什么区别?数据库代理是否占用主实例的QPS或者TPS?数据库代理地址和常规地址是否是一个地址?开通...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

管理主备切换

背景信息 自动切换:实例默认开启自动切换,当主实例出现故障无法访问时,自动切换到备实例。主备切换的触发时机,请参见 主备切换原因。手动切换:即使自动切换是开启状态,您也可以手动进行主备切换。手动切换可用于容灾演练或多可用区...

部署和使用跨可用区实例

同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...

基础版

说明 由于基础版只有一个数据节点,没有备节点作为热备份,因此当该节点意外宕机或者执行变更配置、版本升级等任务时,会出现一段时间的不可用。如果业务对数据库的可用性要求较高,不建议使用基础版,可选择其他系列(如高可用版)。基础...

服务管控和治理

服务治理 服务治理包含服务限流、服务路由、服务鉴权、服务熔断、故障注入、故障隔离、透明劫持、服务拓扑和实时监控相关服务治理。服务限流 在高并发场景下,为保证在现有资源条件下服务正常运行,您可以使用服务限流让请求和并发在应用可...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:登录 混合云容灾管理控制台。单击 切换到...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。集群视图 集群...

常见问题

多云成本运营中,成本是账单运行分摊后产生的,默认每月4号上午10点系统会自动运行成本分摊任务,如果需调整也可在成本运行页面调整或手工运行成本分摊,4日前运行成本分摊可能会出现账单和成本对不齐的情况,而且和最终版本会有些出入,仅...

任务触发与执行问题

任务执行超时 问题现象 出现 TIMEOUT 错误。问题原因 客户端处理超时。解决方法 查看超时时间是否配置太小。建议根据任务的实际执行情况设置合理的超时时间。查看客户端错误日志 common-error.log。自定义参数不存在 问题现象 出现 javax....

集群拓扑监控

Kubernetes监控组件:ack-arms-cmonitor 安装Kubernetes组件ack-arms-cmonitor前,需先检查目标集群是否存在ARMS Addon Token,否则会出现权限不足的报错。若存在ARMS Addon Token,ARMS会进行免密授权,组件安装完成后,即可使用...

健康检查

如果您的后端应用服务器不支持HEAD方法或HEAD方法被禁用,则可能会出现健康检查失败,此时可以使用GET方法来进行健康检查。POST:GRPC监听健康检查默认采用POST方法。请确保您的后端服务器支持POST请求。如果您的后端应用服务器不支持POST...

回切至本地物理机

本文主要介绍如何利用阿里云连续复制容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到用户本地数据中心的物理服务器上。前提条件 服务器已进入实时复制状态。更多信息,请参见 启动复制。背景信息 目前阿里云的混合...

数据库代理常见问题

如果您在使用RDS PostgreSQL数据库代理过程中存在疑问或遇到问题,可以参考本文查看解决方案。什么是数据库代理?数据库代理是位于数据库服务端和应用服务端之间的网络代理服务,用于转发应用服务端访问数据库时的所有请求,提供读写分离、...

集群实例工作台

出现节点故障或需要进行负载均衡时,可发起 Unit 迁移。可发起迁移操作的 Unit 卡片上显示.图标,将鼠标悬停在 Unit 卡片上并单击 发起迁移,在弹出窗口中选择目标端节点并单击确定,即可发起 Unit 迁移。不可发起迁移操作的 Unit 卡片上...

功能发布记录

在单集群模式下,开启托管模式的网格拓扑会自动填充相关参数,提升易用性。网格拓扑服务的CLB支持按量付费规格,降低费用消耗。全部 全部 全部 开启网格拓扑提高可观测性 支持自定义请求头和响应头。支持使用VirtualService和EnvoyFilter这...

搭建高可用架构

恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使出现问题也能快速恢复到可用状态。如果是单机故障,RDS除了基础系列之外的实例都可以在短时间内进行 主备切换 快速恢复您的业务。如果是可用区...

节点池服务拓扑管理

因此,跨越不同分组节点的Service流量,大概率出现访问不可达、或者访问效率低下的问题。Service流量拓扑支持边缘节点应用只能由相同节点池的节点访问,或者只能由本节点访问。本文介绍Service流量拓扑管理功能以及如何配置Service流量...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据总线 DataHub 商标服务 负载均衡 高速通道 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用