同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

分解类算法参数调优

本文介绍分解类算法(ostl-esd、istl-esd和istl-nsigma)的参数调优方法。背景信息 分解类算法(ostl-esd、istl-esd和istl-nsigma)适用于周期性数据,常见于QPS数据,如每天或每周在相对固定的时刻出现峰值或者谷值的数据。在使用分解...

应用场景

日志服务的查询与分析功能提供了十多种机器学习算法,包括单时序数据的多种平滑操作、预测与分解操作,多时序的聚类,多字段的模式挖掘等,可以直接应用在告警监控任务中。更多信息,请参见 机器学习函数。机器学习服务提供流式统计或图...

Designer概述

深度学习框架组件 包括基于PAI-Easy系列的视觉类算法、语音类算法、自然语言处理算法,以及TensorFlow、PyTorch等深度学习框架。自定义算法组件 包括SQL脚本、Python脚本、PyAlink脚本等自定义算法组件,可以满足您更加定制化的算法工作流...

设置宕机自动迁移

若您未开启宕机自动迁移,DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。警告 本地SSD型DDH(例如本地SSD型i2)不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障,您可以 提交工单 申请人工迁移,但迁移后本地...

什么是混合云容灾服务

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达率 100%。发布 H5 离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...

概述

物联网边缘计算提供算法应用,供您为视频设备配置算法,处理视频数据。同时提供算法服务,支撑您管理算法任务。背景信息 当前物联网行业中,算法开发没有统一的算法定义和开发规范,自主开发的成本高,是业务中的一大痛点。物联网边缘计算...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

机器学习(MADlib)

聚类问题:提供K-Means算法实现聚类分析。关联分析:提供Apriori算法实现关联分析,解决如“啤酒与尿布”的关联问题。时序分析:提供ARIMA自回归移动平均模型预测时间序列数据的未来值。其他:数据降维如通过PCA主成分分析模型来提炼主因子...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

服务下线通知

温馨提示 尊敬的阿里云用户您好,非常感谢您对阿里云自然语言处理产品的支持,由于 NLP基础服务1.0 所依赖的组件不再维护,为了提供更稳定与高性能的算法服务,提供更清晰简化的使用体验,我们于2020年12月正式发布了 NLP基础服务2.0,2.0...

通过一致性复制组实现容灾恢复

当生产站点发生故障时,将开启读写权限的容灾站点中云盘挂载到临时创建的ECS实例上继续运行业务,直到生产站点故障修复完成。警告 故障切换功能会暂停异步复制功能,您需要确保您的生产站点发生故障时再使用故障切换功能,避免数据丢失。...

故障排查

本文介绍您在使用 ACK Serverless集群 时可能遇到的故障以及解决方案。如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常...

【通知】NLP1.0相关商品停止售卖通知

为了提供更稳定与高性能的算法服务,提供更清晰简化的使用体验,阿里云将于2022年7月1日起停止售卖NLP1.0相关商品。请您选择功能更多、体验更加完善的NLP2.0版本。停售时间 2022年7月1日 停售说明 尊敬的阿里云用户您好,非常感谢您对阿里...

PS-SMART多分类

参数服务器PS(Parameter Server)致力于解决大规模的离线及在线训练任务,SMART(Scalable Multiple Additive Regression Tree)是GBDT(Gradient Boosting Decision Tree)基于PS实现的迭代算法。PS-SMART支持百亿样本及几十万特征的训练...

PS-SMART回归

参数服务器PS(Parameter Server)致力于解决大规模的离线及在线训练任务,SMART(Scalable Multiple Additive Regression Tree)是GBDT(Gradient Boosting Decision Tree)基于PS实现的迭代算法。PS-SMART支持百亿样本及几十万特征的训练...

智能异常分析概述

聚类 将物理或抽象对象的集合分成由类似的对象组成的多个的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象不同。无监督 根据类别未知(未被标记)的训练样本解决模式识别...

统计类算法参数调优

本文介绍统计类算法(esd、ttest和nsigma)的参数调优方法。背景信息 统计类算法(esd、ttest和nsigma)可以根据历史数据为每一个数据点计算异常分数anomalyScore。算法的输入参数(如 esd.alpha、ttest.alpha 和 nsigma.n)会决定判断阈值...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

云盘异步复制概述

启动云盘异步复制功能 通过异步复制功能实现容灾恢复 您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制提供的故障切换以及反向复制功能对主盘进行容灾恢复。通过异步复制功能实现容灾恢复 删除云盘异步复制关系 创建...

支持的数据脱敏算法

本文介绍支持的数据脱敏算法算法分类 分类描述 算法描述 输入参数 适用类型和典型场景 哈希脱敏 不可逆算法。适用于密码或需要通过对比进行敏感数据确认的场景。支持常见的哈希算法,并支持偏移量(加盐值)配置。MD5 Salt值 敏感类型:...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

创建DDH

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

资产安全概述

脱敏算法 脱敏算法模块可以看到目前支持的所有脱敏算法,主要包括 遮盖脱敏(如张三,脱敏为*三)、哈希脱敏(如加盐MD5)两大类算法。动态脱敏 不改变底层数据的存储,只在数据进行消费时,进行数据的脱敏。典型应用场景:数据分析场景的...

GTM如何实现同城容灾

创建1个全局访问策略,解析请求流量 选择 全局,主地址池集合 选择「业务中心01」地址池和「业务中心02」地址池,负载均衡策略 选择 返回全部地址,此设置可实现两个数据中心同时提供服务和发生故障时系统自动摘除故障地址的效果。...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

资产安全概述

脱敏算法 脱敏算法模块可以看到目前支持的所有脱敏算法,主要包括 遮盖脱敏(如张三,脱敏为*三)、哈希脱敏(如加盐MD5)两大类算法。动态脱敏 不改变底层数据的存储,只在数据进行消费时,进行数据的脱敏。典型应用场景:数据分析场景的...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 智能开放搜索 OpenSearch 负载均衡 风险识别 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用