服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

数据分析整体趋势

近些年来,随着业务数据量的增多,企业需要能够对数据进行分析,助力商业决策,更好地发挥数据价值,而传统开源及商业关系型数据库通常为单机版,在海量数据分析场景下扩展能力有限,性能无法满足需求。以Teradata,Oracle Exadata为代表的...

智能搭建操作说明

Quick BI接入阿里巴巴通义千问大模型能力,打造智能小Q分析助手,智能搭建为智能小Q核心能力之一,聚焦一键生成报表、对话式的图表创建和配置、一键智能美化、智能洞察归因,帮助您更高效地进行报表搭建和数据分析。本文为您介绍智能搭建...

什么是云拨测

数据可视化:通过直观的数据展示和报表,您可以轻松了解网络状况、性能以及故障分析。应用场景 网络性能监控:云拨测可以帮助企业和个人用户实时监控网络状况,确保业务运行的稳定性和可用性。业务可用性验证:通过模拟真实用户请求,云拨...

可视化图表概述

涵盖了趋势、比较、分布、关系、空间、时序6个分析大类,同时支持自定义图表类型,可以满足您灵活多样的可视化分析需求。图表的适用场景 每种图表都有其适用场景和数据要素(即,构成图表的字段)。例如地图,主要用于查看某一数据指标在...

指令支持列表

创建图表/报表 功能名称 能力介绍 指令描述示例 支持的范围 创建图表 通过自然语言描述您的数据分析需求,AI将自动为您创建对应的图表“使用 XX数据集,展示 各省份的签单金额”指标看板、交叉表、明细表、线图、柱图、饼图、散点图、排行...

标准架构

Tair 标准架构具有数据高度一致、架构简单、性价比高等特点,可满足多种场景下的需求,但标准架构不支持增加数据分片或只读节点,仅提供高可用(双副本)与单副本实例类型。说明 如需增加数据分片或实现读写分离,请选择 集群架构 或 读写...

查看智能洞察事件列表

智能洞察详情 应用服务整体平均响应时间突增 应用服务整体平均响应时间突增 类型的事件详情页面显示了事件发生时间点、根因分析故障传播链。在智能洞察详情页面,您可以执行以下操作:单击 根因分析 区域的疑似根因链接,在疑似根因面板...

集群版-双副本

数据分片(data shards)每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

集群架构

数据分片(data shards)每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

AIOps 解决方案专家服务内容说明

AIOps解决方案专家服务主要围绕企业AIops的技术需求提供对应的解决方案支持及咨询服务,依托阿里巴巴多年AI能力沉淀,以及阿里云专家经验,通过算法对监控指标进行建模与实时智能分析,当业务异常发生时,实时进行告警关联分析与收敛,帮助...

Multi-Master基础架构

FTS 容错服务(Fault-Tolerance Service),用于检测Segment节点及辅助协调节点的健康状态,并在Segment节点发生故障时进行Segment节点的Primary与Mirror角色的切换。Catalog 以系统表Catalog等信息为代表的全局元信息存储。Main Master ...

用云成本需求分析

在计划阶段,通过对用云成本进行需求分析,确保相关人员的业务需求都被识别和跟踪,并在规划和实施阶段有针对性的采取措施,使资源利用率达到最优,进而使用云成本在组织内部做到可管可控、可持续经营。捕获成本需求 企业级客户主要从以下...

功能特性

创建实例 自动切换 在实例主节点发生故障时将自动切换,实现实例的故障自愈,切换通常需要30秒左右完成。主备切换 全量备份与全量恢复 对当前实例通过内存快照方式对全量数据进行备份并保存在云存储中,可通过全量恢复将数据恢复至备份时。...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

企业版和标准版功能对比

支持 支持 高可用性 单可用区高可用 多节点的架构可用于保障集群的高可用,当系统发生故障时,可读写的主节点和只读节点之间会自动进行故障切换(Failover)。支持 支持 多可用区高可用 PolarDB MySQL版 支持创建多可用区的集群。相比单...

可观测性的设计原则

可观测性设计是指为了更好地监控、分析和管理系统运行状态而进行的设计。在云原生、微服务等技术越发流行的今天,系统的可观测性变得越来越复杂。云上的可观测性主要从监控指标、链路追踪、日志记录、监控看板和事件告警五大方面来进行设计...

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

发现并处理Redis的大Key和热Key

在使用Redis的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能引发的问题及如何快速...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

阿里云上稳定性保障服务(容灾)内容说明

1.服务概述 1.1 服务说明 帮助客户在云上建立容灾能力,当灾难发生时,在保证生产环境的数据尽量少丢失的情况下,保证生产系统的业务不间断运行,促进故障逃逸能力的提升。1.2 适用的客户场景 云上容灾服务适用于客户同一个地域(Region)...

什么是应用诊断分析平台ATP

差异分析 有时我们需要对比查看多份分析结果,比如查看应用一小时时间间隔的两份分析结果,以此来判断应用某些指标的变化趋势,并进一步做故障排查,针对这种需求,我们提供了 差异分析,它将两次分析结果一起呈现,方便用户对比。差异分析...

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

RDS与自建数据库对比优势

备节点的故障发现时长为秒级,在99%的场景下,备节点从故障发生到节点恢复不超过10分钟。在好的架构下才能实现高可靠性。实现RPO=0的成本极高,需要单独购买研发服务。数据可靠性一般,取决于单块磁盘的损害概率。实现RPO=0的成本极高,...

附录:SOFAStack 产品目录

运维管理 SOFAStack CAFE(Cloud Application Fabric Engine)云应用引擎,提供应用管理、发布部署、运维编排、监控分析、容灾应急等全生命周期管理的 PaaS 平台产品,满足金融场景中经典架构和云原生架构的运维需求,帮助传统架构平滑过渡...

跟踪概览

跟踪是一种重要的配置机制,您可以使用跟踪功能,将云服务中发生的事件保存到指定的OSS存储空间或SLS Logstore中,以便后期分析和长期存储。操作审计仅默认为每个阿里云账号记录最近90天的事件,您必须创建跟踪才能记录更长时间的事件,...

什么是多活容灾

RPO针对的是数据丢失,而RTO针对的是服务丢失,RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。好的容灾系统需要尽量满足用户的需求,但是容灾系统的设计往往受多种条件的制约,如可用的技术、现网状况、用户...

功能特性

抗D包 调查分析/防护分析 攻击分析 业务接入DDoS高防实例进行防护后,您可以查询DDoS高防实例上发生的攻击事件记录和详情,帮助您了解攻击来源IP、攻击类型分布、攻击来源地区分布等信息,实现攻击防护流程的透明化,提升防护分析体验,还...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

东软案例

故障数据全量回溯分析。AI辅助异常检测等场景。客户价值 一体化指标、日志、代码链路、网络包等结构化、半结构化、无结构数据存储、检索、分析能力,降低开发部署复杂度。云端低成本海量运维数据存储,TCO大幅降低。高性能、高通量监控数据...

功能特性

云监控 慢Query日志Query Log 慢Query的查询与分析可以帮助您对系统中发生的慢Query或失败Query进行诊断、分析和采取优化措施。慢Query日志查看与分析 表统计信息日志Table info 提供表统计信息日志系统表table_info按日收集实例内表的统计...

App端性能体验功能说明

性能监控产品通过轻量级的集成接入即可拥有实时、可靠、全面的应用崩溃、ANR、自定义异常等捕获能力,及卡顿、启动分析等性能能力,支持多场景、多通道智能告警监控,帮助开发者高效还原异常、卡顿用户的访问路径和业务现场,缩短故障排查...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

专家成长计划服务内容说明

云存储问题处理详解专题 8 全面介绍磁盘的基础知识,Linux和Windows操作系统的磁盘分区和文件系统结构,以及关键扇区的含义和作用,查看和编译磁盘结构的主要工具,例如Linux系统下的fdisk,并重点针对常见的磁盘故障进行了场景化的分析,...

分析负载均衡7层访问日志

本文基于日志服务的可视化和实时查询分析能力,为您介绍负载均衡(SLB)7层访问日志查询分析的典型案例。前提条件 已采集到SLB 7层负载均衡日志。具体操作,请参见 开通访问日志功能。背景信息 对于大部分云上架构而言,负载均衡是基础设施...

功能特性

EMR on ECS 功能集 功能 功能描述 参考文档 集群管理 创建集群 您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。创建集群 释放集群 在完成EMR集群任务后及时释放集群,可以释放资源...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域,...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域...

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云安全中心 检索分析服务 Elasticsearch版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用