容灾恢复

功能原理 单机故障剔除会统计一个时间窗口内的调用次数和异常次数,并计算每个服务对应 IP 的异常率和该服务的平均异常率。当 IP 的异常率大于服务平均异常率,且达到一定比例时,单机故障剔除会对该服务+IP 的维度进行权重降级。如果该...

自动优化

说明 详细内容可参考Databricks官网文章:自动优化 自动优化的工作原理 自动优化包含两个重要特性:优化Delta表的写入 在开源版Spark中,每个executor向partition中写入文件时,都会创建一个文件进行写入,最终会导致一个partition中包含...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

健康检查

概述 开启健康检查是指对地址池中的IP地址配置健康检查,开启后可实现实时监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查的类型,包括:ping监控、tcp监控、http(s)监控的配置相关。前提条件 已...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

功能概述

健康检查 针对地址池,可以配置健康检查,开启健康检查是指对地址池中的IP地址配置健康检查,开启后可实现实时监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查支持的方式:ping、tcp、http(s)。...

自动故障转移和读写分离

使用PostgreSQL的libpq或JDBC,您可以通过简单的配置实现自动故障转移(failover)和读写分离。背景信息 从PostgreSQL 10开始,libpq驱动层开始支持简单的故障转移,JDBC驱动层则支持简单的故障转移和负载均衡。libpq是PostgreSQL的C应用...

应用故障自动诊断

查看故障自动诊断报告 登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用列表,在顶部菜单栏选择地域并在页面上方选择 所属微服务空间,在 集群类型 下拉列表,选择 K8s集群,然后在页面单击具体的应用名称。在 应用总览 页面的 概览分析...

云解析DNS如何实现故障切换

本文介绍如何通过DNS实现故障隔离或故障切换。使用场景 企业的线上网站或应用,一般是使用公网权威解析产品设置智能解析,来提升用户跨运营商(或地区)的访问速度和访问质量。例如域名 dns-example.com 的智能解析配置如下:记录类型 主机...

DT-MPC v3.1

DT-MPC是一款先进的控制组件,可以实现以下功能:多变量系统的自动控制 解决流程行业内多变量系统协同控制这一难题而开发的一款安全便捷高效的智能控制组件。其运用先进控制技术,通过系统操控变量(MV)和被控变量(CV)之间的模型关系,...

通过控制台自动导入迁移源

通过控制自动导入迁移源,可视化好、操作简单。本文介绍如何通过控制台导入迁移源的操作步骤。前提条件 如果您使用RAM用户导入迁移源,则需要为RAM用户授权:需要授予RAM用户只读访问RAM权限 AliyunRAMReadOnlyAccess。具体操作,请参见 ...

搭建高可用架构

MySQL:RDS MySQL集群版实例采用计算与存储分离、一主多备的架构,支持自动故障切换、任意备节点可切换为主节点、备节点可读、按需增删节点、多可用区容灾、节点粒度的监控、集群节点拓扑管理等功能,同时还可启用MGR保障RPO=0,相比自建...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

FAQs

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。GTM 是现有云解析DNS中全局负载均衡(GSLB)的升级和替代产品,GTM比GSLB支持...

常见问题-FAQ

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。全局流量管理(GTM)的CNAME接入域名是否能直接通过URL访问?答:不可以使用 ...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

访问控制策略概述

开启防火墙开关后,如果您未配置访问控制策略,云防火墙在访问控制策略匹配环节中默认放行所有流量。您可以根据业务需要,配置不同防火墙的流量拦截和放行策略,以便更好地管控资产的未授权访问。本文介绍云防火墙访问控制策略的工作原理、...

主备双活

毛刺对比 自动容错 主备双活中我们提供了自动容错能力,在故障场景下自动进行切换,做到故障对业务完全透明。通常需要进行主备集群切换的场景如下:断网断电等机房维度故障,无法正常链接主集群,请求全部抛错。由于软件BUG造成的全集群宕...

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

快速入门

ADP-Local运维控制台 ADP-Local运维控制台(以下简称ADP-Local)提供了丰富的运维管理能力,在控制台内可以查看各组件的运行状态、监控告警信息,进行故障排除,及操作各类运维变更。在底座配置内勾选 本地控制台(adp-local)在产品的版本...

移除节点

工作原理 节点池移除节点是指将集群中的节点移出集群,ACK会自动调整期望节点数,调整后期望节点数为原期望节点数减去移除节点数。修改期望节点数,请参见 修改期望节点数。您可以通过勾选:同时释放ECS:节点移出集群后释放实例。重要 ...

基于ack-lingjun-aiast组件实现集群自动化运维

组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,灵骏AI助手的告警系统可以自动和PAI进行交互,并上报故障信息,并根据故障触发阶段和并行策略选择规避故障的方法,自动隔离故障节点,并通过checkpoint快速...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务...当故障演练自动结束、您主动终止或者演练中的任何环节出现异常后,系统都会进入恢复阶段,自动清除相应的故障,使故障演练对象恢复演练前的状态。

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

流水单据型业务场景多活实践

验证爆炸半径是否控制故障单元内:预期:UserID为2000的用户路由到杭州单元,不受北京单元故障的影响。结果:下单正常,符合预期。切流恢复 验证故障场景下的容灾恢复能力。在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

Gmail 投递帮助

Gmail发送者指南,请参考 文档。一、投递失败的原因 一般来说,投递失败会出于以下一种或多种原因:发送邮件...6、使用故障排除工具 如果按照本文中的指南进行操作后仍然遇到邮件传送问题,请尝试 对发件人的电子邮件传送问题进行故障排除

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。...当使用Connection String URI进行连接时,如果某个Mongos节点出现故障,客户端能自动进行故障切换,将请求分散到状态正常的Mongos节点上,详情请参见 分片集群实例连接说明。

处理CPU使用率高问题

CPU作为数据库最核心的资源,是日常运维中重点关注的对象。当实例CPU使用率持续较高时,很容易导致数据库...自动SQL限流:自动控制数据库请求访问量和SQL并发量,保障服务的可用性。自动SQL优化:及时发现并优化慢SQL,解决数据库的性能问题。

灾备方案

图 1.Tair 容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

通过 Goland 部署和升级插件

工作原理 GoLand 会根据用户选择的 Sidecar 注入规则(包含了使用的所有插件)和需要升级的 Sidecar 容器镜像,在本地获取远程镜像,然后扫描本地项目和 Sidecar 容器镜像的共同依赖,以升级 Sidecar 容器镜像依赖为准,将本地插件依赖做...

灾备方案介绍

图 1.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障)常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

DT-PID V2.1.0

功能说明 PID控制器是最常见的单变量基础控制器,其算法简单、鲁棒性好和可靠性高,被广泛应用于工业过程控制,广泛适用于没有精确模型的控制系统,对于可建立精确数学模型的确定性控制系统也具有较好的精确控制能力。PID控制又称为比例、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享流量包 数字证书管理服务(原SSL证书) 检索分析服务 Elasticsearch版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用