功能特性

性能监控 告警配置 云数据库ClickHouse提供集群状态监控及报警功能,通过对重要的监控指标设置报警规则,让您及时得知指标数据发生异常,帮您迅速定位处理故障。设置报警规则 参数管理 内核参数管理 支持集群内核参数的白屏化查看、修改、...

东软案例

客户感言 利用阿里云新一代 云原生模数据库 Lindorm“灵动”引擎驱动的政府、企业数字信息系统智能运维解决方案,东软做到了实时、海量、异构监控数据一站式存储,实现指标、日志、代码链路和网络包等异构数据融合分析,高可靠数据保障和...

UpdateMeshFeature-更新服务网格的功能配置

cb8963379255149cb98c8686f274x*Tracing boolean 否 启用链路追踪(需要开通 可观测链路 OpenTelemetry 版)。取值:true:启用链路追踪。false:不启用链路追踪。默认值:false。false TraceSampling float 否 链路追踪采样百分比。100 ...

EnableCenVbrHealthCheck-开启边界路由器(VBR)健康...

开启边界路由器(VBR)的健康检查功能,确保及时发现出现故障的物理专线,也可修改VBR的健康检查配置。接口说明 您可以通过为 VBR 实例设置健康检查,监测本地数据中心与阿里云之间物理专线的连接状况,以便及时发现问题。在使用健康检查...

产品优势

服务部署后,计算巢提供阿里云自助服务和全链路检测能力,实现一键排查、智能故障检测,提升业务稳定性。计算巢为用户提供了丰富的软件选择,覆盖常见的软件类型,包括:数据库等基础软件,CRM等应用软件,以及制造、医疗等行业软件。已经...

硬件功能说明

监控 设备级监控 智能接入网关的主备IPSec链路故障链路级监控 设备上线提示信息。阈值报警 实现监控项超过设定阈值后自动发送报警通知的功能。健康检查 说明 健康检查功能默认不开放,您可以向客户经理申请开通健康检查功能。支持通过...

功能特性

维度链路查询:根据 TraceId 按不同条件(错误、超时等)从个维度检索调用链,分析链路信息,查询各场景下的调用链集合。视角链路展示:提供链路图、链路详情、时序图、时间轴等,全方位可视化地展示系统性能。业务日志关联查询:...

概述

通过分布式链路跟踪,运维人员、开发人员和架构师能看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障...

什么是消息演练

单个或个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

ConnectionDisconnect

ConnectionDisconnect事件提示您智能接入网关的主备IPsec链路都出现故障。告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

通过Jaeger上报.NET应用数据

通过Jaeger为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用OpenTracing/...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用...

本地IDC通过ECR主备专线链路上云方案

本文介绍如何组合使用物理专线和专线网关ECR,实现本地数据中心IDC通过ECR主备专线链路上云并和云上专有网络VPC互通。场景说明 本文以下图场景为例,为您介绍IDC通过ECR主备专线链路上云方案。某企业在上海拥有一个IDC,其中部署有数据库...

本地IDC通过ECR实现负载专线链路上云方案

本文介绍如何组合使用物理专线和专线网关ECR,实现本地数据中心IDC通过ECR实现负载专线链路上云并和云上专有网络VPC互通。场景说明 本文以下图场景为例,为您介绍IDC通过ECR负载专线链路上云方案。某企业在上海拥有一个IDC,其中部署有数据...

如何集成PTS的OpenAPI搭建压测平台

一次压测的对象就是一个场景,每次压测都有唯一标识的任务ID,一个场景可以包含一个或链路,一个链路可以包含一个或个API,如下图。更信息,请参见 压测场景的结构和数据分配 和 创建压测场景。链路:指一组压测API的有序集合...

故障基础数据管理

服务组与故障业务线的关系:一个服务组对应故障中一个角色,但可以服务故障业务线 服务组与工单问题分类的关系:一个服务组可以服务工单个问题分类 服务组与组织架构的关系:一个服务组可以服务个组织架构,一个组织架构可以拆分为...

创建压测场景

一个压测场景包含一个或个并行的业务(即串联链路),每个业务包含一个或个串行的请求(即API)。API是场景压测中的必需元素,用来定义串联链路中每个阶段URL的具体信息。API是由用户行为触发的一条端上请求。例如,电商网站的登录、...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

计费规则

可观测链路 OpenTelemetry 版 对链路上报和存储、指标存储进行按量付费。本文介绍按量计费模式的计费项和付费方式。重要 本文所涉及价格请以 产品定价页 为准。基本概念 请求链路(Trace):一个请求链路代表一个事务或者流程在(分布式)...

通过Jaeger上报.NET应用数据

通过Jaeger为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用OpenTracing/...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

判断条件-事件判断组件

选择行为 选择 发生 或 未发生发生发生过事件,并且属性、次数均满足要求的用户进入后续链路。未发生:不满足事件或属性、次数要求的用户进入后续链路,包含发生过事件但属性或次数不满足的用户。说明 当限制属性有条,若属性之间的...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

产品优势

链路覆盖 渠道、全链路服务支持方案,多年技术能力的沉淀与输出。提供从推流、视频处理、内容分发到播放的全套解决方案。提供上下行码率自适应、窄带高清™转码、截图、录制、视频审核、时移、数据监控、云导播、超低延时直播、实时...

计费规则

可观测链路 OpenTelemetry 版 对链路上报和存储、指标存储进行按量付费。本文介绍按量计费模式的计费项和付费方式。重要 本文所涉及价格请以 产品定价页 为准。基本概念 请求链路(Trace):一个请求链路代表一个事务或者流程在(分布式)...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更信息,请参见 云...

通过一致性复制组实现容灾恢复

当生产站点发生故障时,将开启读写权限的容灾站点中云盘挂载到临时创建的ECS实例上继续运行业务,直到生产站点故障修复完成。警告 故障切换功能会暂停异步复制功能,您需要确保您的生产站点发生故障时再使用故障切换功能,避免数据丢失。...

事件分析概述

链路追踪:提供事件轨迹能力,还原事件整体链路状态,帮助您快速排除故障,定位链路问题。低成本 事件总线EventBridge 支持事件以云服务事件总线和自定义事件总线形式接入,云服务事件总线支持接入所有阿里云产品事件,无缝支持云服务事件...

智能负载均衡

功能项 未启用智能负载均衡 启用智能负载均衡 容灾能力 节点单活的接入防护能力 统一容灾切换 基于节点负载均衡的接入防护能力 基于智能DNS的自动网络故障容灾切换 访问加速 无 就近接入防护及就近回源的最短链路 业务价值 对于各类...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生
共有189条 < 1 2 3 4 ... 189 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用实时监控服务 可观测链路 OpenTelemetry 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用