故障演练

所以可以故障模型再一次升级,并得到一些推论:故障是来自于硬件(如IaaS层),软件(如PaaS或SaaS)的故障。并且有个规律,硬件故障的现象,会在软件故障现象上有所体现。故障隶属于单机或是分布式系统之一,分布式故障包含单机故障。...

跟踪概览

跟踪是一种重要的配置机制,您可以使用跟踪功能,将云服务中发生的事件保存到指定的OSS存储空间或SLS Logstore中,以便后期分析和长期存储。操作审计仅默认为每个阿里云账号记录最近90天的事件,您必须创建跟踪才能记录更长时间的事件,...

批量创建时间节点

什么事情 2018-01-01 18:01,谁什么事情 2018-01-01 18:01,谁什么事情 时间线节点 clientToken String Body 否 e0b6735e-1a04-4d6b-a625-d2350612492c clientToken 返回数据 名称 类型 示例值 描述 requestId String 10...

使用OSS加速器

OSS推出加速器功能,可以将OSS中的热点文件(Object)缓存在NVMe SSD高性能存储介质上,提供毫秒级低延迟和高吞吐量的数据访问服务。说明 无地域属性存储空间不支持使用OSS加速器。前提条件 OSS加速器功能目前在 华东1(杭州)、华北6...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

核心优势

高可用超性价比 HBase增强版对MTTR(平均故障恢复时间)了深度的优化和改进,故障恢复速度可以达到HBase的10倍以上。并且其基于日志即存储思想和PACELC理论构建的分区多副本复制架构,可以提供多种数据一致性等级,方便应用在一致性、...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

地址池配置

同时当地址池所属地址池集合整体不可用时,可以做故障切换。地址池配置包括:地址池名称、地址池类型、负载均衡策略、输入地址、地址归属区域订正、地址工作模式等相关信息。地址池配置参数说明 地址池名称 配置便于记忆和识别的地址池名称...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

围绕混沌工程的平台实践

本文主要介绍AHAS Chaos是如何围绕混沌工程来打造故障演练服务,您可以了解到混沌工程的基本知识和AHAS Chaos的优势。混沌工程和故障演练 首先您需要了解混沌工程和故障演练的关系。以下是混沌工程官方定义:混沌工程是在分布式系统上进行...

什么是物模型

功能说明 物模型是物理空间中的实体(如传感器、车载装置、楼宇、工厂等)在云端的数字化表示,从属性、服务和事件三个维度,分别描述了该实体是什么、能做什么可以对外提供哪些信息。定义了物模型的这三个维度,即完成了产品功能的定义...

消息存储和清理机制

评估和控制存储成本:云消息队列 RocketMQ 版 消息一般存储于磁盘介质上,您可以通过存储机制评估消息存储空间,提前预留存储资源。消息存储机制 原理机制 云消息队列 RocketMQ 版 使用存储时长作为消息存储的依据,即每个节点对外承诺消息...

常见问题

做故障诊断时,执行诊断功能 3 分钟,随后自动切回到正常运行状态。Node.js 性能平台运行时提供了哪些额外的功能 Node.js 虚拟机 V8 的运行时内存状态监控;libuv 运行时状态监控;在线故障诊断功能:堆快照、CPU Profile、GC Trace 等。...

本地盘最佳实践

使用部署集提高可用性 为保证数据的可用性,建议您在应用层数据冗余。您可以使用部署集将业务涉及到的几台ECS实例分散部署在不同的物理服务器上,保证业务的高可用性和底层容灾能力。详情请参见 创建部署集。本地盘数据迁移到云盘 如果您...

数据库代理常见问题

如果您在使用RDS MySQL数据库代理过程中存在疑问或遇到问题,可以参考本文查看解决方案。目录 什么是数据库代理?通用型代理和独享型代理有什么区别?数据库代理是否占用主实例的QPS或者TPS?数据库代理地址和常规地址是否是一个地址?开通...

常见问题

Q:单节点故障的情况下是否可以保证RPO为0?A:可以。Q:升级规格配置(比如从2核8 GB升级到4核16 GB)后端是怎么实现的?对业务有什么影响?A:PolarDB 的代理(Proxy)和数据库节点(Node)均需要升级到最新的配置,采用多个节点滚动升级...

NAS监控概述

通过查看NAS文件系统的监控信息,您可以了解文件系统的使用情况。通过对文件系统的重要监控指标设置报警规则,您可以及时获知指标异常并快速处理异常。本文介绍NAS支持的监控项以及其报警规则说明。背景信息 云监控(CloudMonitor)是一项...

高压缩引擎(X-Engine)介绍

成本低廉,如支持通过压缩减少数据所占磁盘空间、使用廉价存储介质等,确保可以使用较小的代价保存海量的数据。具备一定的读写能力,能够满足低频读写的需求。MySQL作为世界上使用最广泛的开源数据库系统,一直缺乏一个既能满足大容量低...

使用SDK示例代码消费订阅数据

完成数据订阅通道的配置后,您可以使用DTS提供的SDK示例代码来订阅数据变更信息,本文介绍该示例代码的使用说明。操作步骤 重要 若数据源是PolarDB-X 1.0或DMS LogicDB,消费订阅数据的操作步骤请参见 使用SDK示例代码消费PolarDB-X 1.0...

使用SDK示例代码消费订阅数据

在完成数据订阅通道的配置(创建好订阅任务和消费组)后,您可以自行编写SDK示例代码或使用DTS提供的SDK示例代码来订阅数据变更信息,本文介绍示例代码的使用方法。操作步骤 重要 如果数据源是PolarDB-X 1.0或DMS LogicDB,消费订阅数据的...

专线连接类

如果不通,则需您向运营商报告故障,同时,您可以 提交工单 向阿里云报告故障,阿里云会检查专线接入情况。阿里云与用户的分工界面在阿里侧交换机的端口,接入设备正常,但端口不通则属于运营商线路中断,需要您向运营商报告故障。带宽不...

CLB健康检查FAQ

负载均衡健康检查服务也是集群方式的,这样可以避免单点故障。负载均衡的代理分布到很多节点上,因此看到的健康检查日志访问频率和控制台设置的频率不一致,这是正常现象。负载均衡因后端数据库故障导致健康检查失败,如何处理?问题现象 ...

K8s应用运维管理最佳实践

为了便于故障自愈和优雅上下线,Liveness存活探针的各参数配置应当保证应用可以正常启动,若应用正常启动时间较长,可以配置更长的首次启动延迟时间(InitialDelaySeconds)。相关文档,请参见 配置应用生命周期的钩子和探针 如果部署的...

组复制简介

数据 强 一致性 在组复制中,事务总是先传输到集群中其他节点,然后写入Binlog文件,这保证无论主节点在什么时刻发生故障,重新启动后数据都不会比集群选出的新主节点多。旧主节点故障重启后,能够自动加回集群,拉取它缺失的Binlog,就...

开发Link Visual的功能介绍

App可设置当前设备存储介质录像模式为(不录像/事件录像/全天录像),要求开机上报 按需 App和设备开发者需要关注并处理该物模型 StorageStatus 属性 存储介质状态 App可获取当前设备存储介质状态,要求设备开机及存储介质状态变更时上报 ...

常见问题

Q:单节点故障的情况下是否可以保证RPO为0?A:数据库集群参数为默认设置时RPO不为0,通过调整 sychronous_commit 参数值后可以保证RPO为0。具体参数默认值说明请参见 集群参数默认值说明。Q:升级规格配置(比如从2核8 GB升级到4核16 GB)...

实例列表

什么是实例列表 主要指全局流量管理(简称GTM)的实例列表相关信息,包括:实例ID、CNAME接入域名,健康检查任务数、报警通知条目数、运行状态、实例套餐版本,到期时间,操作等,可帮助用户全局了解GTM实例相关信息。为什么要有实例 GTM为...

IO加速

如果您希望提升磁盘IO效率和系统的响应速度,可以使用RDS MySQL通用云盘的IO加速功能,该功能可以帮助扩展缓存池的大小,实现缓存加速,提升RDS实例的整体读写性能。本文介绍IO加速功能的技术原理、使用方法和性能测试详情等信息。背景 将...

通用云盘IO加速功能技术介绍

基于冷热数据分离的思想,通过扩展Innodb的缓存池(Buffer Pool),将数据页缓存到Buffer Pool Extension中,将温数据存放在Buffer Pool Extension中,使得Innodb可以灵活使用多种存储介质,从而获得QPS性能提升。技术架构 缓存池拓展的...

常见问题

无论 SOFARegistry 是否宕机,SOFARPC 框架对服务提供者调用失败的情况,了两方面的容错处理:调用重试:您可以配置调用重试,当发生非业务错误导致的请求失败时(例如网络超时等),会尝试重试(随机调用一个服务提供者重试)。...

通用云盘IO加速功能

如果您希望提升磁盘IO效率和系统的响应速度,可以使用RDS MySQL通用云盘的IO加速功能,该功能可以帮助扩展缓存池的大小,实现缓存加速,提升RDS实例的整体读写性能。本文介绍IO加速功能的技术原理、使用方法和性能测试详情等信息。背景 将...

通用云盘IO加速功能

如果您希望提升磁盘IO效率和系统的响应速度,可以使用RDS MySQL通用云盘的IO加速功能,该功能可以帮助扩展缓存池的大小,实现缓存加速,提升RDS实例的整体读写性能。本文介绍IO加速功能的技术原理、使用方法和性能测试详情等信息。背景 将...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用性和连续性的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...

什么是云原生内存数据库Tair

什么选择云原生内存数据库Tair 丰富的产品形态 从访问延时、持久化需求、整体成本这三个核心维度考量,基于DRAM(Dynamic Random Access Memory)、NVM(Non-Volatile Memory)和ESSD云盘等存储介质,推出了 内存型、持久内存型、磁盘型 ...

上海博卡:借助云效+ACK实现3分钟快速发布

什么做持续交付?因为我们服务的客户都是小商户为主,通常有需求或者遇到问题都不愿意等待一周或者几天时间,大多数时候都需要我们快速解决,并且因为我们客户量比较大,使得我们必须快速反应,做到持续交付,交付周期可能是一天一次,...

客户案例

而 OceanBase 提供的丰富的分区方式及 OLAP 能力有效地解决了不同场景下,业务指标的构建问题,这对于我们业务开发工作者来说可以更多的关注我需要什么样的指标,而不用考虑如何从存储系统中得到这些数据。大数据处理能力:随着阿里巴巴...

常见报错及解决方案

Q:谐云组件故障排查思路 A:elasticsearch《故障排查思路》mysql《故障排查思路》redis《故障排查思路》harbor《故障排查思路》通用排查《中间件通用故障排查思路》ingress《故障排查思路》rocketmq《故障排查思路》kafka《故障排查思路》...

常见问题

Q:单节点故障的情况下是否可以保证RPO为0?A:可以。Q:升级规格配置(比如从2核8 GB升级到4核16 GB)后端是怎么实现的?对业务有什么影响?A:PolarDB 的代理(Proxy)和数据库节点(Node)均需要升级到最新的配置,采用多个节点滚动升级...
共有107条 < 1 2 3 4 ... 107 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 应用高可用服务 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用