什么是故障

故障追踪:支持对故障的最新进展、故障影响面(影响服务)、舆情反馈、Timeline时间线进行在线化管理、协同,基于统一视角协同处理故障,提升故障处理效率;故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上...

产品优势

微服务引擎MSE是一个面向业界主流开源微服务框架SpringCloud、Dubbo以及多语言等一站式微服务平台,支持服务网格生态,标准、灵活、精准的控制流量,帮助提升系统整体的可用性,并且MSE在高可用、性能、安全方面大量增强,让您的应用获得...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

直播公告(2020~2022年)

阿里巴巴重磅开源云原生网关Higress 2022-11-16 云原生网关的可观测性最佳实践 随着分布式微服务的快速发展,可观测性成为软件平稳运行的主要手段之一,其重要程度日益凸显。网关作为业务流量的入口,其可观测性的重要性不言而喻。MSE云...

常见问题

本文汇总了使用验证码时的常见问题。产品QA Q1:验证码的生命周期是怎样的?生命周期流程图如下:整个流程中只需初始化一次验证码,无需再多次调用 initAliyunCaptcha 方法。阿里云验证码2.0不支持单个页面注册多个验证码实例,多次调用初始...

什么是微服务引擎MSE

微服务引擎MSE(Microservices Engine)是一个面向业界主流开源微服务生态的一站式微服务平台,提供注册配置中心(原生支持Nacos、ZooKeeper、Eureka)、云原生网关(原生支持Ingress、Envoy)、微服务治理(原生支持Spring Cloud、Dubbo、...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

创建MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

分析请求调用链路

在分布式微服务调用场景下,TraceId会从最前端的应用节点透传至下游链路各个节点,可根据此TraceId在 EDAS控制台 或 ARMS控制台 查询整体链路处理过程。Service:当前应用的请求处理入口,如Spring Cloud服务、Dubbo服务、HSF服务等。API:...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

分析请求调用链路

在分布式微服务调用场景下,TraceId会从最前端的应用节点透传至下游链路各个节点,可根据此TraceId在 EDAS控制台 或 ARMS控制台 查询整体链路处理过程。Service:当前应用的请求处理入口,如Spring Cloud服务、Dubbo服务、HSF服务等。API:...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

高阶使用

本文通过示例为您介绍E-MapReduce中的Flume组件,如何配置拦截器(Interceptor)、Channel选择器(Channel Selector)和Sink组逻辑处理器(Sink Processor)。拦截器 拦截器的位置在Source和Channel之间,用于修改或丢弃Event。拦截图示意...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

应用场景

媒体处理可以将多媒体数据转码成适合在全平台播放的格式,并基于海量数据对媒体的内容进行审核、添加标签、版权保护等,广泛应用于视频网站、在线教育、电视传媒和泛娱乐视频等各类视频处理场景。本文为您介绍媒体处理服务常见的应用场景。...

EDAS直播公告

2022-09-06 EDAS 3.0微服务测试最佳实践 微服务应用上云已经是趋势所在,在微服务和云原生的背景下,阿里云已经提供了一站式微服务应用托管方案,降低了应用研发及运维的成本,但应用的测试及质量成本仍然很高,微服务测试将发力降低应用...

多语言版本分片模型

SchedulerX可以对多重任务进行调度(定时、编排、重刷历史数据等),提供Java、Python、Shell和Go等多语言分片模型,帮助您处理大数据业务需求。背景信息 分片模型主要包含静态分片和动态分片。静态分片:主要场景是处理固定的分片数,例如...

2022年

企业级分布处理方案 支持ElasticJob开发的执行对接。兼容ElasticJob 2022-01-26 变更类型 功能描述 相关文档 新增 支持概览页。支持日志服务。支持查看堆栈。控制台可以直接查看任务运行的堆栈,方便排查任务卡住的问题,使用时需要...

多语言版本分片模型

SchedulerX可以对多重任务进行调度(定时、编排、重刷历史数据等),提供Java、Python、Shell和Go等多语言分片模型,帮助您处理大数据业务需求。背景信息 分片模型主要包含静态分片和动态分片。静态分片:主要场景是处理固定的分片数,例如...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

强弱依赖治理概述

随着分布式微服务的发展,系统正在变得越来越复杂,一个普通的应用也可能依赖了很多其他的服务。在没有明确强弱依赖关系的前提下,系统很难进行限流降级、优化改造等操作。强弱依赖治理就是通过科学的手段持续稳定地得到应用间依赖关系、...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

设计方案

整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布应用架构,再到服务细分通过轻量级的通信机制进行互相调用的服务架构,...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

运维服务内容说明

2.服务范围 运维产品范围:阿里公共云云产品(详见 附录一:运维服务产品清单)阿里云运维服务范围 包含:阿里云 产品使用咨询、问题处理故障救援、配置指导、最佳实践等。阿里云 产品相关的操作或系统问题的技术指导。阿里云 管理控制台...

概述

通过分布链路跟踪,运维人员、开发人员和架构师能看清楚复杂的大规模服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障...

应用场景

下文以支付转账为场景说明消息队列如何实现以下功能:异步解耦 分布事务的数据一致性 削峰填谷 异步解耦 传统处理方式 最常见的一个场景是支付转账成功后,需要生成交易双方的账单,并更新用户权益,发送用户通知。传统的做法有以下两种...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

报表嵌入数据权限控制和传参的安全增强方案

说明 传参嵌入使用说明:在嵌入式集成场景下,结合全局参数注参的方式可以实现同一张报表千人千面的看数效果。传参嵌入仅面向专业版100个通用用户数及以上企业客户开放。注意事项 使用Ticket报表嵌入方案,需要关注以下几点:目前仅支持将...

什么是事件

流转灵活:触发的事件支持处理人灵活的响应、转交、升级故障并完结处理故障;事件分级:事件支持根据其影响面和重要程度可以设置为P1~P4层级的优先级和高低的事件影响程度,最终实现事件分级处理,关键事件优先响应、完结;全生命周期动态...

常见问题FAQ

云投屏产品FAQ问题 M21播放盒子常见问题 Q:遥控无法控制屏幕 A:请尝试将遥控与屏幕重新配对。操作步骤如下:拔掉盒子的电源,然后重新插上,盒子开机。在盒子开机后10分钟内,同时按住遥控的“OK键”(中间大圆圈按键)和“返回键...

故障处理流程

SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,查看运营商网络状态。硬件排查。查看安全组规则...

组件中心

中间件 分布链路跟踪 一款实时监控并管理企业应用性能和故障的云服务,其提供数字化性能管理解决方案,帮助企业在分布架构下快速发现并准确定位应用全生命周期的性能问题。任务调度 提供分布任务调度框架,实现任务的分布式处理,并...

同城多活常见问题

基本概念 逻辑集群概念 可用区概念 同可用区多个逻辑集群优先 支持 不支持 故障场景RPC切零 支持 不支持 支持的服务 服务 消息 分布任务 服务 消息是基于Shutdown机制实现多活么?不是。因为这样会涉及业务重启恢复,如果每次容灾...

设置Pod故障处理策略

如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会自动进行重调度,尝试重新创建Pod。您可以通过添加 k8s.aliyun...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 视频点播 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用