故障排查

如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

工作原理

日志被广泛地应用在系统监控和故障定位中,传统的日志分析手段以分析日志风险等级和匹配关键字为主,例如监控Error级别日志的内容和数量、监控含有Failed、Unsuccessfully等关键词的日志。但是在分布式环境和微服务架构下,以传统的人工...

基本概念

概念 描述 故障转移(Fail Over)即容灾恢复,指您的 IDC 应用出现故障时,在阿里云上恢复应用的过程。故障恢复(Fail Back)当您的 IDC 内的环境恢复以后,将应用数据迁回自有 IDC 恢复应用运行的过程。RPO Recovery Point Objective(数据...

创建集群

背景信息 关于 专属集群MyBase 的更多介绍,请参见 什么是云数据库专属集群MyBase。注意事项 泰国(曼谷)仅支持SQL Server引擎。专属集群的超配指标值默认值如下:MySQL、SQL Server引擎的 CPU超配比 默认值为:200%,Redis引擎的 CPU超...

创建集群

背景信息 关于云数据库专属集群MyBase的更多介绍,请参见 什么是云数据库专属集群MyBase。注意事项 泰国(曼谷)仅支持SQL Server引擎。专属集群的超配指标值默认值如下:MySQL、SQL Server引擎的 CPU超配比 默认值为:200%,Redis引擎的 ...

云盒计算资源配置最佳实践

反之,如果选择最大实例规格为ecs.g6.26xlarge的SKU,由于该规格族的vCPU和内存配比1:4,则会出现内存浪费的情况。根据业务需求选择SKU时,可能会需要多种不同配比的ECS实例,此时可以选择多种规格族混合的SKU,以减少资源浪费。例如:您...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

工作原理

一般是按照您配置的任务规则生成,在补运行或追赶延迟时立即生成实例。执行时间 实例开始执行的时间。如果重试任务,则表示最后一次开始执行的时间。结束时间 实例执行结束的时间。如果重试任务,则表示最后一次执行结束的时间。执行状态...

同城多活切流

选择 故障单元格,代表此时,该单元格当前出现故障,无法承接流量,MSHA自动将该单元格的流量置0,将另一个单元格置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元格前后比例的对比,和 当前切流服务,如果和您预期...

设置Pod故障处理策略

默认情况下,ECI Pod创建失败后,系统自动重试尝试创建。如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能因为库存不足等原因导致Pod创建失败,默认情况下,系统...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

Alibaba Cloud Linux 2系统中TCP拥塞控制算法BBR对...

本文为您介绍Alibaba Cloud Linux 2系统中TCP拥塞控制算法BBR(Bottleneck Bandwidth and RTT)对网络性能有影响的原因及解决方案。问题描述 符合下列条件的ECS实例中,内核TCP拥塞控制算法默认为BBR算法。该算法会在CPU使用率高、网络数据...

Fetch类FAQ

如果ER无法识别对应的算法会抛出异常,目前仅支持gzip算法,未来可能支持brotli算法。fallbackIdentity:与decompress相似,无法解压缩时不会报错,直接当作identity处理。这个异常是有意为之,因为内容是压缩过的,你的读取可能没意义,...

开启TLS加密

警告 本操作将触发重启实例,实例会出现秒级的连接闪断,请在业务低峰期执行该操作并确保应用具备重连机制。此时,您可以通过刷新控制台页面,更新TLS的开通状态。开通TLS后,您可以单击页面中的 下载CA证书,将CA证书导入至客户端中。下载...

开启TLS加密

警告 本操作将触发重启实例,实例会出现秒级的连接闪断,请在业务低峰期执行该操作并确保应用具备重连机制。此时,您可以通过刷新控制台页面,更新TLS的开通状态。开通TLS后,您可以单击页面中的 下载CA证书,将CA证书导入至客户端中。下载...

功能特性

并且,CLB 已经在大部分地域支持了多可用区部署,当主可用区出现故障时,可自动切换到备可用区上提供服务。✔ ✔ 安全防护 结合云盾,可提供5 Gbps的防DDoS攻击能力。✔ ✔ 网络类型支持 CLB 提供公网和私网类型的负载均衡服务。您可以创建...

设计方案

从提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升故障应急效率等方面做到故障发生前有效预防,故障发生时及时应对,故障恢复后回归验证。基于故障本身打造分布式系统韧性,持续提升软件质量,增强团队对软件生产运行的...

统计类算法参数调优

本文介绍统计类算法(esd、ttest和nsigma)的参数调优方法。背景信息 统计类算法(esd、ttest和nsigma)可以根据历史数据为每一个数据点计算异常分数anomalyScore。算法的输入参数(如 esd.alpha、ttest.alpha 和 nsigma.n)决定判断阈值...

生产者负载均衡

在极端场景下,可能会出现大部分消息集中在少数队列中的情况,建议设计消息组时尽量将消息离散开,不要集中在少量消息组中。使用示例 MessageGroupHash模式不需要额外设置,对于顺序消息类型默认启用。顺序消息发送,默认采用...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

算法说明

日志服务提供智能巡检功能,用于对监控指标或业务日志等数据进行全自动、智能化、自适应的异常巡检。目前智能巡检使用流式图算法、流式分解算法...在噪声较大的情况下,由于噪声的干扰,可能会出现漏报或者错报的情况。预览示例如下图所示。

产品简介

产品简介 阿里巴巴通义实验室千寻搜索算法,基于达摩院长期积累的自然语言处理技术,专注企业统一搜索场景,提供精准的多源异构搜索,以PaaS服务形式提供离线数据处理和搜索服务API。同时支持公有云、专有云、基于云原生的基础架构下混合云...

高性能版实例

SQL崩溃时,主要会出现Coredump或Out of Memory等情况,使 AnalyticDB PostgreSQL版 进入恢复模式。恢复模式中,系统会对残留的锁和内存执行一些清理操作,并通过回放WAL文件来保证数据的完整性。恢复期间,实例会暂时无法服务,完成恢复后...

使用ALS算法实现音乐评分预测(旧版)

ALS矩阵分解算法会将矩阵A分解为两个矩阵(矩阵X和矩阵Y)相乘。矩阵A=矩阵X*矩阵Y的转秩 矩阵X的列和矩阵Y的行可以称为ALS因子。假设有3个因子(性格、教育程度及爱好),则矩阵A经过ALS分解得到的矩阵X如下。矩阵A经过ALS分解得到的矩阵Y...

FailoverDiskReplicaGroup-启用异步复制组故障切换

当一致性复制组中某些复制对的主盘出现故障时,可以调用该接口恢复从盘的读写权限。接口说明 一致性复制组功能支持的地域请参见 云盘异步复制概述。一致性复制组必须处于 单次同步中(manual_syncing)、同步中(syncing)、正常(normal)...

iOS集成

目前离线活体检测SDK携带了算法模型,这些算法模型占用较大的包体积,为了对包体积进行优化,我们提供了模型动态下载的能力,使用该能力需要具备以下前提条件:License非永久授权。您的终端用户手机设备支持联网,且网络环境良好(不建议...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

内存管理

长期运行过多的小内存会出现碎片,会隔断大内存空间。blk小内存快速申请:blk小内存算法申请的内存最小为4字节对齐,小于RHINO_CONFIG_MM_BLK_SIZE大小的内存块会优先从blk算法中申请,不够的再从通过buddy申请。内存申请时,优先从对应...

负载均衡调度算法介绍

负载均衡根据配置的调度算法,将来自客户端的请求按照对应的算法规则转发至相应的后端服务器。负载均衡支持轮询、加权轮询、加权最小连接数、一致性哈希等多种调度算法,用于支持不同的业务场景。本文列出所有负载均衡系列产品支持的调度...

ST_3DGridPath

起始点和终止点是3维点数据,其中的z值可以不精确,算法会自动找到合适的z值并进行路径规划。range是路径规划的范围,通常以dsm数据为基础进行设定。barriers综合了所有的障碍物开销,通常是采用 ST_CostUnion 的结果。当params置为空时,...

ST_3DGridPath

起始点和终止点是3维点数据,其中的z值可以不精确,算法会自动找到合适的z值并进行路径规划。range是路径规划的范围,通常以dsm数据为基础进行设定。barriers综合了所有的障碍物开销,通常是采用 ST_CostUnion 的结果。当params置为空时,...

预测式外呼

调度算法会综合考虑当前坐席的在线数量、空闲情况、外呼号码的呼叫频率限制、电话接通率、通话等待时长、通话时长、话后处理时长等因素,并考虑呼损(客户接通后等待坐席服务过程中挂机)的情况下,通过自动尝试、自动调整、自动学习来控制...

停用词干预词典

选择了词典类型后,为词典命名,干预词典创建完成,词典会出现在页面的词典列表中。新增和管理干预词典内的干预词条。词典创建完成后,在列表中点击词典名称或点击词典对应的“词条管理”,即可进入到干预词典的详情页。用户可在详情页内...

通过消费组读取文本日志进行模板匹配

例如系统异常时输出Error日志,系统恢复后不再出现该日志,等下次系统异常(超过最大静默时间),再次输出Error日志时,作业提示出现新的日志类别。默认值为672,表示1天内的最大静默窗口数为672个。采样率 通过采样率调整文本分析作业...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 负载均衡 智能开放搜索 OpenSearch 数据库自治服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用