设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

V3.3.47版本说明

更新内容 复购预测、货品推荐:优化算法模型、预测任务与关联的受众、行为数据集、商品数据集、商品池之间的删除先后逻辑,完善删除限制。优化新建算法模型的配置项说明,优化剩余可用模型训练任务数、预测任务数展示方式,优化其他多处...

核心自治技术案例解析

下面是双11期间自动SQL优化一个实际案例:某自治服务接入实例,DAS于11月7日通过负载异常检测到因慢SQL引起的负载异常,自动触发SQL优化闭环,SQL语句优化上线后,经过持续24小时优化效果跟踪完成优化收益评估,优化效果显著,如优化之前后...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

评分卡训练

优化算法 在高级选项中可以配置训练过程中使用的优化算法,系统支持如下四种优化算法:L-BFGS:是一阶的优化算法,支持较大规模的特征数据集。该算法属于无约束的优化算法,会自动忽略约束条件。Newton's Method:牛顿法是经典的二阶算法,...

DAS Auto Scaling弹性能力

其中,算法将根据数据库实例过去一段时间内的磁盘使用值结合时序序列预测算法,预测出未来一段时间内的磁盘使用量,若短时间内磁盘使用量将超过用户实例的磁盘规格,则进行自动扩容。每次磁盘扩容将最少扩大5 GB,最多扩大原实例规格的15%...

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

发现并处理Redis的大Key和热Key

在使用Redis的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能引发的问题及如何快速...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

新功能发布记录

ACU时包 2023年2月 V3.1.6.4 类别 名称 说明 相关文档 新增 Roaring Bitmap函数 Roaring Bitmap是一种高效的Bitmap压缩算法,被广泛应用在各种语言和各种大数据平台,常用于去重、标签筛选、时间序列等计算中。Roaring Bitmap函数 漏斗分析...

算法效果类

我们会定期迭代模型,尽全力优化算法效果。欢迎您通过钉钉搜索群号 23109592,加入阿里云视觉智能开放平台咨询群,群内将有专员帮助您分析优化效果不符合预期的文件,为您解答相关问题。我们致力于为您提供更好的服务,也感谢您的问题助力...

AliSQL内核小版本发布记录

AliSQL是RDS MySQL的内核,除了为用户提供MySQL社区版的所有功能外,还提供了企业级备份恢复、线程池、并行查询等类似于MySQL企业版的诸多功能,赋予了RDS MySQL安全、备份、恢复、监控、性能优化、只读实例等各项能力。本文介绍AliSQL的...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

AutoML使用限制及规格

AutoML的使用限制以及规格,包括当前支持的地域,支持的搜索算法TPE、GridSearch(网络搜索)、Random(随机搜索)、Evolution(演化算法)、GP(贝叶斯优化)、PBT(异步优化算法),以及对应的应用场景。支持地域(region)当前AutoML...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

产品优势

算法优化能力 经过实战检验的业务过程智能优化算法服务,一周接入、一周上线帮助制造业直接降本增效。技术专家能力 下过车间、进过实验室的大数据技术专家直面问题,迎难而上。降低大数据和AI使用门槛,让工艺师、老师傅能够轻松使用数据与...

自动机器学习(AutoML)

AutoML使用限制及规格 AutoML的使用限制以及规格,包括当前支持的地域,支持的搜索算法TPE、GridSearch(网络搜索)、Random(随机搜索)、Evolution(演化算法)、GP(贝叶斯优化)、PBT(异步优化算法),以及对应的应用场景。...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

单实例快速恢复

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。节点恢复速度在一分钟左右,当表数量明显增加时,恢复时间会更长。Hologres...

AI加速概述

PAI-AI加速器主要用于训练加速和推理加速,它通过数据集加速、计算加速、优化算法、调度算法和资源优化技术等多种手段,提高了AI训练和推理的速度、易用性和稳定性,全面提升了AI计算的效率。本文为您介绍AI加速器的功能亮点。AI加速器功能...

什么是交通云控平台

全息数字化还原:互联网数据和设备数据融合,交通评价更精准 大规模实时仿真:城市级仿真推演时间从几小时缩短到几分钟 智能优化调度方案:6年信号优化算法沉淀、5000+高速控制策略 全域多端交互协同:云边端一体化协同,海量边缘节点云端...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

通过一致性复制组实现容灾恢复

当生产站点发生故障时,将开启读写权限的容灾站点中云盘挂载到临时创建的ECS实例上继续运行业务,直到生产站点故障修复完成。警告 故障切换功能会暂停异步复制功能,您需要确保您的生产站点发生故障时再使用故障切换功能,避免数据丢失。...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

PS线性回归

最小收敛误差 优化算法终止条件。最大特征ID 最大的特征ID或特征维度,该参数取值可以大于实际值。如果未配置该参数,则系统启动SQL任务自动计算。执行调优 核心数 默认为系统自动分配。每个核的内存大小 默认为系统自动分配。方式二:PAI...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

灾备规划

可选择的一体机型号如下所示:型号 支持服务器数量 Apsara DR100网络环境 以上灾备设备要求的网络环境包括以下两种:数据中心到阿里云之间的网络 由于优化了数据存储传输算法,混合云容灾服务并不强制要求本地数据中心与阿里云建立专线连接...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 风险识别 负载均衡 智能开放搜索 OpenSearch 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用