常见问题

本文介绍了使用柔性事务的常见问题。使用柔性事务需要用控制台开启么?不需要,但是要确保 PolarDB-X 1.0 实例升级到支持柔性事务的版本。如果无法使用,请使用控制台自助升级 PolarDB-X 1.0 版本。开启柔性事务是否会影响连接池内的其他...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

产品优势

计算巢为用户提供了丰富的软件选择,覆盖常见的软件类型,包括:数据库等基础软件,CRM等应用软件,以及制造、医疗等行业软件。已经有超过600家软件服务商入驻计算巢,超过100款可独立部署的软件。用户可以通过计算巢推荐服务列表、阿里云...

云盘异步复制容灾常见问题

ECS容灾中云盘异步复制容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含entry和autoPL)...

计算资源

除以上五点外,常见计算资源风险点还有“资源相互影响”、“资源节点崩溃”、“依赖服务异常”、“服务进程无响应”、“数据格式异常”、“证书过期”等。可以使用资源隔离、配额控制、多副本冗余、服务降级、服务熔断、心跳上报、主动探活...

MSE注册配置中心高可用最佳实践

没有任何服务百分百可用,注册中心在进行变更(变配、升降级)或遇到突发情况(例如,可用区断网断电)时,都有可能导致订阅异常,影响服务消费者(Consumer)的可用性。为了应对不可预知的情况下订阅列表异常,可以在Consumer侧配置推空...

产品简介

阿里云容器计算服务ACS(Alibaba Cloud Container Compute Service)是以K8s为使用界面提供容器算资源的云计算服务,提供符合容器规范的算资源。算交付模式为Serverless形态,您无需关注底层节点及集群的运维管理。ACS支持按需弹性和...

Tair选型指南

选择容灾方案 图 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

SanityCheck:算健康检测

功能介绍 在执行DLC任务时,可能会遇到以下问题:在任务花费一定时间加载模型Checkpoint或其他初始操作后,由于申请的资源存在故障,无法顺利开始训练,需要调查定位故障问题并重新提交任务。该过程中会导致GPU资源的浪费。在任务运行...

常见问题

本文列举了阿里云 表格存储 的常见问题,帮助您快速了解 表格存储。一般性常见问题 什么是 表格存储?表格存储 面向海量结构数据提供Serverless表存储服务,同时针对物联网场景深度优化提供一站式的IoTstore解决方案。适用于海量账单、IM...

Mesh 常见问题

本文汇总了使用服务网格时可能遇到的常见问题及解决方案。服务网格目前支持的微服务框架有哪些?服务网格目前支持 Dubbo、SpringCloud 等主流微服务框架。XDS 配置不下发 问题原因:Pilot 未启动或 Pilot 与 MOSN 网络不通。解决方案:查看...

常见问题

本文介绍 PolarDB PostgreSQL版 的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前100%兼容...

支持计划

附录1 第三方软件问题与说明 针对基础级、企业级、顶级的用户 阿里云将尽最大努力为客户提供以下第三方软件在阿里云ECS服务器/操作系统环境中安装、配置和疑难排解的建议,确保其在阿里云ECS服务器/操作系统环境中正常运行。阿里云售后团队...

产品优势

自动化故障诊断和标准应急预案快速定位并恢复故障,减少因故障引起的业务中断时间。故障演练主动检验应用高可用能力。支持蚂蚁产品双中心容灾切换,满足监管合规需求。技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、...

管理MySQL集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

如何管理故障

可以对故障的最新进展、故障影响面(影响服务)、舆情反馈、Timeline时间线进行在线管理、编辑,并同步更新通告及故障状态,确保故障关键进展及时通知至相关人员。改进分析 改进分析用于记录管理故障恢复后的故障复盘。当故障处于复盘中/...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

服务管控和治理

而故障隔离能够定位到异常的服务实例,实现实例级别精细的隔离和摘流,使故障影响的范围更小、更可控。更多信息,请参见 故障隔离。服务拓扑 实际业务中,应用之间的关联与依赖非常复杂,需要通过全局视角检查具体的局部异常。您可以在...

什么是通知订阅

支持根据报警、事件、故障的优先级、影响程度等订阅条件配置差异的通知策略;聚焦核心通知,提升问题处理效率,降低通知干扰,实现更可靠、更精准的通知送达。核心功能 满足服务或流转规则被不同通知订阅对象的自定义订阅需求;满足不同...

故障复盘

减少重大故障影响:针对特大故障,设置较大的系数倍数,以凸显特大故障对故障分的影响。鼓励快速恢复:针对不同P等级故障,差异设置系数,以体现恢复时长要求。比如同时针对P1P2级重大故障,设置了“5分钟内恢复降一级,10分钟内恢复故障...

诊断规则

通过故障诊断平台,运维人员可以将诊断过程、排查顺序进行图形编排与设计,即故障诊断决策树。而后,在实际故障发生时,即可执行自动化、标准故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现...

管理集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

管理集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

创建集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

创建集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

交叉口最大承载

定义 交叉口最大承载定义为按照无交叉方式计算路口最大承载。计算逻辑 交叉口最大承载的指标计算逻辑如下图所示:

什么是故障

故障追踪:支持对故障的最新进展、故障影响面(影响服务)、舆情反馈、Timeline时间线进行在线管理、协同,基于统一视角协同处理故障,提升故障处理效率;故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构要求,形成了线上...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

围绕混沌工程的平台实践

原则5最小爆炸半径 最小爆炸半径意味着混沌工程的影响范围必须得到控制,逐渐扩大故障范围,要保证演练是可控的,因此在演练当中需要您时刻关注在稳态假设中配置好的系统指标,如果影响范围超出了预期,请立刻终止演练,并且修复问题。...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

产品正式商业发布

故障管理闭环:事件影响恶化,将升级为故障故障管理形成闭环,持续提升业务连续性。云钉一体的运维协同:基于钉钉打通多端、多团队的协同,加速运维事件处理。产品适用场景 一站式运维事件管理:满足各类监控场景下报警统一事件管理...

规格说明

可视组件:可视大屏是由多个组件构成,您可以通过对组件进行配置来完成您的可视大屏设计,同时DataV产品也开通了自定义组件开发功能,您可以根据自己的需求进行组件开发。本地部署:也叫私有部署,是同一个概念,只有尊享版支持该...

如何配置流转规则

选择 触发故障 需要配置故障影响服务、故障等级覆盖。配置完成之后点击 提交即可。仅触发报警:确定 报警触发规则:设置触发的持续时长和次数对报警进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发报警,只要将时长和次数分别设置...

什么是事件

支持将影响恶化的事件一键升级为故障,实现事件全生命周期的在线管理。核心功能 流转灵活、事件分级处理、全生命周期动态记录。流转灵活:触发的事件支持处理人灵活的响应、转交、升级故障并完结处理故障;事件分级:事件支持根据其影响...

设计原则

在分布式系统中,需要考虑的稳定性问题比较复杂,贯穿软件系统设计态、研发态、运维态、运行态,覆盖从IaaS、PaaS到上层SaaS系统,所有这些都可能会...旨在提高故障应急效率,减小故障影响,降低类似故障的再次发生,提升系统整体高可用性。

容灾恢复

解决了服务故障持续影响业务的问题,避免了雪崩效应,提高系统可用率。功能原理 单机故障剔除会统计一个时间窗口内的调用次数和异常次数,并计算每个服务对应 IP 的异常率和该服务的平均异常率。当 IP 的异常率大于服务平均异常率,且达到...

教育实训

并且整体设备运维缺乏高效易用的解决方案,运维效率低,出现故障恢复时间长,影响教学的进度。客户痛点 学习门槛高,线下准备环境浪费时间,复杂软件安装繁琐,远程指导人力消耗大 学习效果差,教与练脱节,互动性差,缺少老师临场指导 线...

创建DataV大屏(模板篇)

宜搭结合DataV在产品侧充分融合,让宜搭用户一键掌握专业炫酷的数据可视表现。本文主要介绍如何使用宜搭系统,通过创建空白应用后创建模板大屏,并配置应用中模板大屏的数据源和修改大屏标题的功能。背景信息 宜搭数字大屏视频功能...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
DataV数据可视化 日志服务 云防火墙 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用