附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

发现并处理Redis的大Key和热Key

在使用Redis的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能引发的问题及如何快速...

概览

产品优势 智能阈值与单指标或多指标报警规则相比,优势如下:报警降噪 智能阈值会采集每个实例的指标数据,利用鲁棒性时序分解和预测等模型适配,适应不同实例指标的数据水位和业务变化,并基于历史报警聚和相似度匹配,进一步过滤异常...

ECS系统事件汇总

您可以开启操作系统的Kdump服务,排查崩溃原因,避免再次引发同类问题。具体操作,请参见 Linux实例如何开启Kdump服务 或 开启Windows实例的内核转储(Kernel Memory Dump)功能。SystemFailure.Stop 因系统错误实例停止 严重 Instance:...

通过向导模式配置离线同步任务

背景信息 数据集成离线同步,为您提供数据读取(Reader)和写入插件(Writer)实现数据的读取与写入,您可通过向导模式和脚本模式配置离线同步任务,实现源端单表同步至目标端单表、源端分库分表同步至目标端单表两数据同步场景。...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败...以下图为例,故障执行失败的原因是没有在脚本中找到名。

使用可视化演练

可根据需要选择环境故障演练或是服务依赖故障演练。运行环境 可选择 机器负载高、内存消耗高、磁盘无剩余空间 或 磁盘读写过高 场景。服务依赖 可选择 本地服务丢失、本地服务延迟、调用下游服务丢失 或 调用下游服务延迟 场景。...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

分析预警

本文为您介绍辅助线、趋势线、预测、异常检测、波动原因、聚六种 分析方式。背景信息 分析预警支持从多个角度对当前数据进行分析,通过该功能可以直观了解数据的变化趋势和异常点。分析预警目前支持辅助线、趋势线、预测、异常检测、波动...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

什么是性能分析

性能分析服务为移动App提供实时线上性能数据的“采集-分析-...性能分析服务支持Android/iOS应用类型,帮助客户建立5分钟线故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升App使用体验。

MSE注册配置中心和自建注册配置中心对比

升级和扩缩容 免去手动配置和升级,同时运维操作过程支持无损上下线能力,避免升级、扩缩容等运维操作引起的线故障。需要手动操作,繁杂且效率低,容易引起线故障。高可用 多可用区部署,故障自动检测及恢复,SLA保障率高达99.95%。需...

接入说明

您可使用热修复功能在不发布新版本的情况下热修复线故障,注意仅在紧急情况下使用此功能。使用限制 Android 热修复功能暂不支持以下机型或场景:Dalvik 的 X86 机型 OPPO Android 11 机型 三星 5.0.X 机型 API Level 21~23 且打开了 Jit...

什么是崩溃分析

崩溃分析服务旨在帮助开发者快速定位和解决移动应用...崩溃分析服务支持Android/iOS应用类型,帮助客户建立5分钟线故障感知能力,并与性能分析、远程日志服务配合使用,构建异常“感知>定位>恢复”的运维能力闭环,有效提升App使用体验。

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

热修复简介

热修复(Hotpatch)用于在不发布新版本的情况下热修复线故障(Bug)。使用场景 每一次热修复,都是一次 紧急发布。因此,mPaaS 限定了热修复的使用范围是:在来不及发布版本的情况下,需要立刻解决线上客户端问题。根据最佳实践,热修复...

实时概览

崩溃分析服务支持Android、iOS应用类型,帮助客户建立5分钟线故障感知能力,并与性能分析、远程日志服务配合使用,构建异常“感知>定位>恢复”的运维能力闭环,提升App使用体验。操作步骤 登录 EMAS管理控制台,查找您的项目,单击项目,...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

演练概述

基于阿里巴巴多年业务的真实线故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构应用、Java应用进行故障演练。完整的故障演练...

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

流利说

解决方案 流利说基于数据库自治服务DAS的 7*24异常检测、SQL诊断引擎、自动SQL限流、自动性能扩展、自动SQL优化 和 智能压测 六项核心能力构建了“基础服务自治平台”的数据库部分,通过 DAS服务接口 实现了线故障修复自动化、数据库优化...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

本文介绍跨可用区容灾启动复制的操作步骤。保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有...后续步骤 步骤故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

功能概览

步骤故障切换 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步完成后再启动切换。这样可以保证容灾端与生产端数据完全一致,无数据丢失。该切换模式适用...

运维事件中心的审计事件

运维事件中心已与操作审计...CreateProblemTimeline 创建故障时间线节点。CreateProblemTimelines 批量创建时间节点。CreateRichText 创建富文本。CreateRouteRule 创建流转规则。CreateService 创建服务。CreateServiceGroup 创建服务组。...

测试体系

由于是使用线上流量做测试,可以保证用例的丰富性和真实性,更容易发现传统测试容易遗漏的缺陷,节省人力成本同时,有效避免线故障。双引擎自动回归平台(简称双引擎或者doom)是一个将线上真实流量复制并用于自动回归测试的平台。通过...

创建故障时间线节点

创建故障时间线节点。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST...

EDAS直播公告

安利的企业微服务架构转型之路 云途时代数字化转型实践 EDAS 3.0核心功能演示 2020-05-15 微服务治理实践之金丝雀发布 应用的有些故障是因为发布直接或间接引起的,因此提升发布的质量,减少错误的发生,是有效减少线故障的一个关键环节...

查询故障时间线列表

查询故障时间线列表 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/...

更新故障时间线

更新故障时间线。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/...

删除故障事件线节点

删除故障事件线节点。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST...

可运维性咨询服务内容说明

乙方专家团队通过对甲方应用系统和云平台的调研,评估系统是否具备故障演练和逃逸能力,并基于阿里巴巴多年业务的真实线故障库的积累,通过模拟调用延迟、服务不可用、机器资源满载等,真实检验应用的高可用能力,同时考察相关人员对问题...

自建VPN无法连通

其他ECS实例无法通过该网关连接线下服务器,但在网关的安全组里添加入方向来源为0.0.0.0/0且包含所有协议端口的规则后,其他ECS实例可以连通线下服务器。问题原因 安全组未正确添加规则。解决方案 当前的网络故障现象如下。VPN隧道建立正常...

可视化图表概述

Quick BI提供了40余种图表样式,包含了表格类、指标线/面图类、柱/条图类、饼/环类、气泡/散点类、漏斗/转化关系类、地理类和其他类;涵盖了趋势、比较、分布、关系、空间、时序6个分析大类,同时支持自定义图表类型,可以满足您灵活...

Quick BI如何给故事线添加节点

问题描述 用户在使用故事线的时候,发现只有故事节点文案编辑,并没有增加节点按钮。问题原因 故事线节点就是图表组件。解决方案 增加图表组件就是增加可选故事线节点。适用于 Quick BI 故事线

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生、故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 短信服务 云消息队列 RocketMQ 版 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用