自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

迁移可用区

例如,单可用区实例可以承受服务器和机架级别的故障,而多可用区实例可以承受机房级别的故障。对于包含主备节点的实例,建议迁移至多个可用区,实现实例的跨可用区容灾。从多个可用区迁移至一个可用区 迁移至主可用区 和 迁移至备可用区 ...

政企安全加速

开启 离线模式:支持源站故障过程,边缘节点可基于自身缓存内容进行响应,为源站恢复争取时间。开启 防篡改:支持源站分发内容防恶意篡改,保证内容传输过程中的一致性。开启 源站防护:提供SCDN回源节点的IP地址信息,便于用户在源站或源...

专线连接类

本文介绍物理专线连接的常见问题。通过物理专线接入阿里云之后,是否可以访问不同地域?阿里云支持哪些类型的物理专线?物理专线支持的最大带宽是多少?物理专线是否支持动态路由协议?物理专线是否支持多条专线链路的容灾?如何实现物理...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

常见问题

任务常见问题 如何接入链路追踪?任务常见问题 应用发布过程,任务执行卡住或变慢 单击运行一次后,系统提示输入实例参数,如何处理?权限问题 如何给其他账号授权 通过控制台授权系统提示“没有权限”接入问题 无可用机器(no worker ...

常见问题

任务常见问题 如何接入链路追踪?任务常见问题 应用发布过程,任务执行卡住或变慢 单击运行一次后,系统提示输入实例参数,如何处理?权限问题 如何给其他账号授权 通过控制台授权系统提示“没有权限”接入问题 无可用机器(no worker ...

常见问题

任务常见问题 如何接入链路追踪?任务常见问题 应用发布过程,任务执行卡住或变慢 单击运行一次后,系统提示输入实例参数,如何处理?权限问题 如何给其他账号授权 通过控制台授权系统提示“没有权限”接入问题 无可用机器(no worker ...

索引

任务常见问题 如何接入链路追踪?任务常见问题 应用发布过程,任务执行卡住或变慢 单击运行一次后,系统提示输入实例参数,如何处理?权限问题 如何给其他账号授权 通过控制台授权系统提示“没有权限”接入问题 无可用机器(no worker ...

索引

任务常见问题 如何接入链路追踪?任务常见问题 应用发布过程,任务执行卡住或变慢 单击运行一次后,系统提示输入实例参数,如何处理?权限问题 如何给其他账号授权 通过控制台授权系统提示“没有权限”接入问题 无可用机器(no worker ...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

场景一:在链路中未透传引流请求头

OpenTelemetry自动插装支持多种常见的分布式链路上下文透传标准(如W3C TraceContext、W3C Baggage、B3等)。以上述的自动插装社区文档为例,该文档提供了W3C TraceContext和W3C Baggage的透传示例;配置完成后,您可以利用W3C ...

什么是备份数据量

常见概念 在数据库备份DBS业务场景下,含有常见以下几个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量等。概念 说明 数据库磁盘空间 数据库磁盘空间由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲...

应用防护规则常见问题

本文列举了应用防护规则常见的问题。请求链路页面添加规则是给单台机器添加还是给所有机器都添加?添加规则会推送到所有机器。流控规则中的来源应用是什么意思?Sentinel支持按调用来源限流。流控规则中来源应用(针对应用)指的是调用该...

应用诊断

应用诊断是对应用的单独故障诊断,可以由链路诊断触发或人工触发。高可用管理平台通过应用诊断初步定位问题,锁定可疑应用,再通过 Arthas 和线程分析进一步确认问题。目前,应用诊断支持用户应用和蚂蚁应用。应用诊断是故障诊断的原子能力...

常见问题旧版索引

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?产品FAQ 授权管理FAQ 集群管理FAQ 节点与节点池FAQ 容器网络FAQ Service FAQ Ingress FAQ DNS FAQ 应用FAQ 存储FAQ-CSI 存储FAQ-Flexvolume 容器安全FAQ 为什么可观测监控 ...

读多写少型业务场景多活实践

导购链路对商品应用是强依赖,强依赖故障将导致业务不可用,因此故障的爆炸半径应该控制在单元内。创建故障演练。创建杭州单元商品中心故障的演练,具体操作,请参见 创建演练。故障注入。在多活容灾的 监控大盘 页面 异地双活 区域,查看...

通过Zipkin上报Go应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Zipkin为Go应用埋点...

常见问题FAQ

云投屏产品FAQ问题 M21播放盒子常见问题 Q:遥控器无法控制屏幕 A:请尝试将遥控器与屏幕重新配对。操作步骤如下:拔掉盒子的电源,然后重新插上,盒子开机。在盒子开机后10分钟内,同时按住遥控器的“OK键”(中间大圆圈按键)和“返回键...

关键技术竞争力

三位一体的业务可观测能力 TRaaS 技术风险防控平台提供多元框架协议,采集监控、链路、日志等多样数据,并支持按业务场景进行多维聚合,以业务监控为核心建立业务连续性保障体系,通过监控下钻、链路分析、日志关联、故障决策树诊断,共同...

通过Jaeger上报Python应用数据

通过Jaeger为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Jaeger为Python应用...

FAQs

重要 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;DNS切换同步时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL缓存设置以及网络环境不同,所以全网生效时间...

什么是容器报警演练

不同于其他故障演练模块对系统注入真实故障,报警演练只会对集群的API Server投递事件,由事件触发报警链路,不会对系统造成真实故障。无侵入。无需在用户集群中安装探针以注入故障,所有事件投递都是通过API Server来进行网络请求。

故障止损恢复

建议在故障应急协同群中推荐输出常见的快速恢复能力,并提供PC、手机端的一键快速执行能力,减少研发在各自平台上查找快恢入口的时间,也解决研发在外无电脑应急的尴尬局面。快恢能力主要包含人工梳理快恢预案、通用垂直专项快恢能力:人工...

诊断决策树

对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 故障诊断>诊断决策树。单击 新建,在 创建诊断决策树 页面,配置诊断决策树信息,包括决策树...

升级任务的链路规格

若现有的迁移或同步任务的链路规格不能适应业务需求时,您可以考虑升级链路规格以提升传输数据的性能,确保任务的顺利执行并...常见问题 升级迁移或同步任务的链路规格,是否会影响任务运行?不会影响。任务的链路规格是否支持降级?不支持。

通过Jaeger上报Python应用数据

通过Jaeger为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Jaeger为Python应用...

Trace 链路追踪

成员方法:setTag(tag,value)tag String-Tag 名称,可以自定义,一般从 opentracing.Tags 中获取(里面定义了常见的 host、url、statusCode 等链路信息 Key)value String-Tag 名称对应的值 b.成员方法:log(key,value)key String-自定义的...

托管节点池节点自动恢复

当节点的运行状态发生变化并持续一段时间后,ACK将判定该状态符合故障状态,存在节点故障。当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后...

源站探测

全球加速提供源站探测功能,您可以通过全球加速的监听创建源站探测任务,实时监控从探测点经过全球加速至源站的全链路网络质量,从而快速定位网络故障,针对性的进行网络优化。源站探测介绍 您可以为全球加速的监听创建源站探测任务,源站...

概述

分布式链路跟踪系统(Distributed System Tracing,简称 DST)是面向分布式架构、微服务(Spring Cloud、SOFAStack、Service Mesh 等)架构等云原生架构的一种具有应用可观察性(Observability)的金融级解决方案。通过 DST,运维人员、...

流水单据型业务场景多活实践

在 读多写少型业务场景多活实践 中,已经将导购链路进行了异地多读改造,而该业务后续在一次大促期间,遭遇了一次订单应用大面积故障,导致大促期间下单业务长时间无法使用,于是下单业务的容灾建设也提上了议程。下单业务是典型的流水单据...

NVMe协议介绍

NVMe共享盘可以帮助应用实现高可用、高并发、可扩展的业务,可以帮助基于传统SAN的业务无缝上云,共享盘常见的应用场景包括数据共享、高可用故障转移、分布式缓存加速、机器模型训练等。数据共享 NVMe最简单的应用场景为数据共享,当数据被...

同城多活架构实践

演练预期:电商首页展示的查询链路对商品应用是强依赖,强依赖故障将导致业务不可用,且故障的爆炸半径应该控制在单元格内。创建故障演练。创建杭州单元格B下的商品应用故障演练(例如网络丢包)。具体操作,请参见 创建演练。故障注入。在...

概述

链路追踪:支持网格外部应用调用网格内部应用并形成一个完整的链路追踪信息 链路数据透传:支持应用调用上下文中存放数据,达到整个链路上的应用都可以操作该数据。故障剔除:目前支持 bolt 协议。它会自动监控 RPC 调用的情况。协议支持 ...

如何接入链路追踪

在微服务分布式场景下,全链路追踪功能给业务提供了各个服务点执行情况的可视化快速分析定位能力。在定时任务场景下,业务执行链路可能比常规实时业务的执行链路更长,接入全链路追踪有助于查询任务执行耗时、分析执行异常等问题。本文介绍...

如何接入链路追踪

在微服务分布式场景下,全链路追踪功能给业务提供了各个服务点执行情况的可视化快速分析定位能力。在定时任务场景下,业务执行链路可能比常规实时业务的执行链路更长,接入全链路追踪有助于查询任务执行耗时、分析执行异常等问题。本文介绍...

如何接入链路追踪

在微服务分布式场景下,全链路追踪功能给业务提供了各个服务点执行情况的可视化快速分析定位能力。在定时任务场景下,业务执行链路可能比常规实时业务的执行链路更长,接入全链路追踪有助于查询任务执行耗时、分析执行异常等问题。本文介绍...

IDC通过BGP主备专线链路上云方案

阿里云为您提供以下两种解决方案:IDC通过静态路由主备专线链路上云方案 IDC通过BGP主备专线链路上云方案 两种方案均通过主备物理专线将您本地IDC接入阿里云,在为您提供高可靠,低延迟连接的同时,可以有效避免上云链路单点故障的问题。...

常见问题

本文汇总了分布式链路跟踪服务(DST)在使用过程中的一些常见问题及对应的解决方案。应用正常运行却无法在控制台被展示 多维查询没有结果,或者搜索链路为空 如何配置 tracer,以便按照小时分割 trace 日志?RPC Tracer 打印不出 rpc-...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 数据库自治服务 应用实时监控服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用