故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...
故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...
未配置风险:消息堆积是消息队列RocketMQ的典型场景和能力,但是对于部分需要实时处理消息的场景,需要及时关注并控制未处理的消息量,避免因为消费堆积造成业务受损。配置时机:建议业务上线且流量平稳后配置告警。建议阈值:业务侧上线后...
未配置风险:消息堆积是消息队列RocketMQ的典型场景和能力,但是对于部分需要实时处理消息的场景,需要及时关注并控制未处理的消息量,避免因为消费堆积造成业务受损。配置时机:建议业务上线且流量平稳后配置告警。建议阈值:业务侧上线后...
业务挑战 业务数据量大,对可用性高要求,同时成本控制高要求。消息数据来源众多,数据结构变更频繁。特征数据schema日增字段近千个。有大量离线分析结果数据需要导入在线存储,并提供毫秒级、高并发在线访问。自建开源HBase缺少运维平台,...
应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的消费完整性问题,是一种为业务兜底的策略,不应该被用作业务流程控制。以下场景建议使用消息重试 业务处理失败,且失败原因跟当前的消息内容相关,比如该...
3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...
背景信息 高可用架构应用集群具备的特点如下所述:轻量应用负载均衡可以将公网访问的流量分发到后端多台轻量应用服务器上,在增强应用吞吐能力的同时,可以消除服务器的单点故障,提升应用可用性。通过自定义镜像功能,您可以快速创建部署...
通过查看指定日志的上下文信息,您可以在业务故障排查中快速查找相关故障信息,方便定位问题。应用场景 例如,O2O外卖网站在服务器上的程序日志里会记录一次订单成交的轨迹:用户登录>浏览商品>选择物品>加入购物车>下单>订单支付>支付扣款...
选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...
同时,在业务流量动态涨跌波动时,使容器按照承载业务的标准部署单元进行扩缩容,从而具备按业务需求量申请资源成本的智能化策略的削峰填谷能力。稳定运行的云原生业务 云原生化进行后,业务持续运行过程中需要根据业务的动态变化制定相应...
通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...
由于备案、故障或机房迁移等原因生成的补偿续费订单,不予退款。适用场景 适用于想更加灵活地按需使用负载均衡实例,并且业务用量经常有变化、资源使用有临时性和突发性的场景。登录 传统型负载均衡CLB控制台。在 实例管理 页面,找到目标...
主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...
Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...
本章节介绍MyBase Redis自治服务(CloudDBA)的功能。背景信息 数据库自治服务DAS(Database Autonomy Service),是一种基于机器学习和专家经验实现...通过该功能您可以应对可预期的数据库负载地周期性变化,在满足业务需求的同时控制成本。
阿里云全球加速服务联合日志服务提供访问日志功能,用于记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。本文介绍全球加速访问日志功能相关的资产、费用以及使用限制等信息。简介 您可以为全球加速实例的一个...
混合云接入是阿里云为部署在非阿里云的业务流量提供的Web应用防护和管理方案。如果您的业务部署在第三方公共云、私有云、线下IDC机房等,您可以通过混合云接入方式,通过 Web应用防火墙(Web Application Firewall,简称WAF)统一管控和运...
创建轻量应用服务器时,您需要配置地域、镜像、套餐以及购买时长等信息,您可以根据业务需要进行个性化配置。本文介绍如何创建一台轻量应用服务器。背景信息 如果您部署的应用访问量较高,可以使用轻量应用负载均衡将流量分发到后端不同的...
数据闪回确保用户数据不丢失:业务可能由于服务器重启或者意外故障、游戏中出现漏洞等原因,需要将游戏数据恢复到此前某个时间点,Tair 支持将实例整体或指定Key的数据恢复至指定的秒级时间点,同时也支持选择将数据恢复至新实例或当前实例...
削峰填谷 在业务高峰期,如秒杀或团队抢购活动中,用户请求量大,流量暴增,某些业务系统可能无法承受。引入消息队列后,利用消息队列的抗堆积能力,这些业务系统作为消息的消费方,可以根据自身应用的能力进行消息的消费,不受大流量的...
为避免过期版本实例存在的安全和稳定性风险,同时保证您业务的连贯性,服务网格 ASM支持通过原地升级或金丝雀升级的方式升级控制平面和数据平面。本文介绍ASM实例升级前后的注意事项和说明、升级路径、升级流程和操作步骤等。前提条件 已...
您可以使用拓扑分布约束来控制Pod在不同故障域之间的分布,提升对底层基础设施故障的容忍能力。关于如何在ACK集群中使用拓扑感知调度能力,例如使Pod在多个拓扑域中重试或将Pod调度到属于同一低延时部署集的ECS中,请参见 拓扑感知调度。...
当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...
IPS阻断分析 全量活动搜索 日志 支持安全日志、流量日志和操作日志,存储6个月 业务可视 安全组可视 自定义分组 应用分组可视 支持的地域 支持区域 仅杭州地域 请参见 支持的地域 请参见 支持的地域 请参见 支持的地域 性能 公有云版本可...
相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...
建议您将全量备份时间设置为业务低峰期的某个时间点。全量备份保留个数 全量备份保留个数。单击 确定。恢复实例数据 登录 HBase管理控制台。在顶部菜单栏的左上角,选择实例所属的地域。在 集群列表 页,单击目标实例ID。在左侧导航栏选择 ...
如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...
本文介绍在远程连接轻量应用服务器过程中可能存在的问题、排查思路和相应的解决方案。排查思路 如果无法远程连接轻量应用服务器时,阿里云推荐您按照以下思路排查问题。以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低...
变更管理分为组织变更与变更支持:组织变更:确保组织中的变更顺利实施,并通过管理变更的人为方面来实现业务连续稳定运行的实践。变更支持:正确地评估变更风险、对变更进行合理授权、管理变更时间表,通过增加成功变更次数来实现业务的...
当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...
消息在队列中的存储情况如下:消息存储管理粒度说明 云消息队列 RocketMQ 版 按照服务端节点粒度管理存储时长而非队列或主题,原因如下:消息存储优势权衡:云消息队列 RocketMQ 版 基于统一的物理日志队列和轻量化逻辑队列的二级组织方式...
本文介绍轻量应用服务器支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项 实例健康诊断功能支持诊断项分类如下表所示。诊断项分类 说明 计算服务健康诊断 诊断轻量应用服务器底层的资源和虚拟化层,确保轻量应用服务器底层...
边车 边车(Sidecar),Sidecar 是一个轻量级的网络代理,它们与应用程序部署在一起,对所有流入与流出的网络请求进行拦截,实现各种网络策略,例如服务发现与负载均衡、流量拆分、故障注入(fault injection)、熔断器以及分阶段发布等...
本项目计划、实施时间和工作量评估是基于本SOW约定范围制定的,如果项目范围发生调整,双方应依照本工作说明书附件一《项目变更流程与项目变更控制申请单》中规定的程序评估对项目价款、计划和工作量的影响,并在签署《项目变更控制申请单...
通过了解 云消息队列 RocketMQ 版 客户端的消费原理和消息堆积的主要原因,帮助您可以在业务部署前更好的规划资源和配置,或在运维过程中及时调整业务逻辑,避免因消息堆积和延迟影响业务运行。背景信息 消息处理流程中,如果客户端的消费...
Q:对比原生MySQL,PolarDB 单表最多支持存储多少数据量?A:PolarDB 不限制单表大小,但单表大小受磁盘空间大小限制,详情请参见 使用限制。兼容性 Q:是否兼容社区版MySQL?A:PolarDB MySQL版 可以100%兼容社区版MySQL。Q:支持哪些事务...
12、非SQL占用CPU等原因导致的数据库实例负载高问题 13、业务SQL执行等过程异常报错问题 14、数据库的性能等问题导致整体业务受影响 15、未能定位具体原因的业务系统处理能力无法达到预期 大数据产品问题诊断与处置 依托大数据专家的海量...
本文为您介绍GxP欧盟附录11标准合规包的业务背景、应用场景,以及合规包中的默认规则。业务背景 GxP欧盟附录11(GxP EU Annex 11)是欧盟对于计算机化系统使用的规范性要求,主要针对在制药、生物技术和医疗器械领域中使用计算机化系统的...
阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)...