概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

AIOps 解决方案专家服务内容说明

基于调研与评估的结果,为客户设计智能故障发现解决方案,包含:多账号统一监控数据接入,并根据应用分组为客户设计AI算法能力用于实时故障发现,并根据分析结果智能定位根因,提供实时异常检测的稳定性方案,保障客户业务稳定性。...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

同城多活常见问题

“5”:基于MSHA流量封闭能力,业务故障时,在业务监控层面看到,A区域业务监控指标下跌,B区域正常。此时业务方可快速决策将A切流至B,避免定位问题及决策的时间开销。“10”:基于MSHA自上而下的流量规则管理和集成数据库同步能力,可...

故障基础数据管理

P4 故障场景监控覆盖 基于故障等级定义场景,配置对应的监控项接入7*24监控值班,同时对接入的监控数据额外提供基于算法的智能告警,或者接入研发可自闭环的风险预警,保障业务故障的监控发现率,减少故障持续时间,降低故障影响。...

强弱依赖治理概述

故障根源定位:后台系统的故障,往往通过上一级的业务故障表现出来。故障处理讲究的是争分夺秒,良好的强弱依赖,对于系统自动化诊断有非常大的助力作用。依赖容量评估:正常调用链路下的系统容量需要评估。例如当某个弱依赖挂掉时,需要...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

故障演练

故障演练就是这个背景下诞生的,沉淀通用故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

标准版-单副本

使用场景 纯缓存类业务场景 单副本架构不能提供数据可靠性,如果发生节点故障,您需要重新对业务进行预热,因此,在对数据可靠性要求较高的敏感性业务中,建议选用双副本架构。对Redis协议兼容性要求较高的业务 标准版完全兼容Redis协议,...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将会丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

客户案例

业务挑战 一致性,一致性是金融业务的生命线,为了应对硬件或者系统故障(IDC/OS/机器故障),传统的数据库在这方面为业务提供多种选择。最大可用模式在主库故障情况下可能造成数据丢失。最大保护模式会提高全年的不可用时间,并造成性能...

功能特性

规格介绍 通用型 DDH通用型规格包括通用型g7,通用型g6和通用型g5等。规格介绍 计算型 DDH计算型规格包括计算型c7、计算型c6、计算型c5等。规格介绍 内存型 DDH内存型规格包括内存型r7、内存型r6、内存型r5等。规格介绍 增强型 DDH增强型...

设置IP白名单

重要 请勿在这些分组里增加自己的业务IP,避免相关产品更新时覆盖掉您的业务IP,影响业务正常运行。为防止误修改或删除白名单分组,2020年12月之后的新建实例,hdm_security_ips 白名单分组对用户不可见。通用白名单模式设置IP白名单 访问 ...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

设置白名单

重要 请勿在这些分组里增加自己的业务IP,避免相关产品更新时覆盖掉您的业务IP,影响业务正常运行。为防止误修改或删除白名单分组,2020年12月之后的新建实例,hdm_security_ips 白名单分组对用户不可见。通用白名单模式设置IP白名单 访问 ...

附录:SOFAStack 产品目录

业务日志关联查询 自定义配置应用系统的业务日志,自动关联业务报错和摘要信息,快速定位问题及跟踪业务信息。应用场景 问题的分析和快速定位 在分布式场景下,服务调用错综复杂,问题分析与定位非常困难。分布式链路跟踪系统能迅速定位到...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

应用防护

如果您主机中的部分应用进程已自动接入指定应用分组,需要将该主机中未接入防护的应用进程接入其他应用分组,或者您的业务使用的框架为:JIRA、Confluence、WebLogic、WebSphere,您需要使用手动接入方式。如果需要将同一服务器接入多个...

关键技术竞争力

基于混沌工程的红蓝攻防能力 TRaaS 基于混沌工程、建立演练机制,提供故障注入、演练编排体系能力,支持在不同环境、不同阶段,主动对业务系统进行故障注入,从而在主动观测单应用健壮性的同时,验证整个体系的故障发现能力、应急响应能力...

围绕混沌工程的平台实践

在场景真实性上AHAS Chaos也做了严格的筛选,无论是基础设施还是应用层针对的都是通用的组件,是被大多数的系统和业务所依赖的,例如CPU、磁盘、网络、MySQL等,此外AHAS Chaos还提供了阿里云组件的故障注入能力。演练经验。如果说演练场景...

基本概念

设备 一般指IP网数通类网络通信设备,比如交换机、路由器、防火墙等,根据业务场景也可以涵盖无线网络AP/AC的管理和运维。电路(链路)根据管理域链路包括单端链路和双端链路,业务类型包括自有业务或者对接外部的如专线等。安全域 设备等...

如何实现无损发布或无损上下线

问题现象 您的应用在发布、重启等操作时,上游服务(发起调用的服务)可能会请求到正在停止的下游服务(被调用的服务),导致出现业务流量的错误(例如链接超时、业务报错等)。问题原因 下游服务在请求发起后才开始停止,导致请求不被响应...

MongoDB 4.0

实例管理 功能 通用型云盘版 功能影响及建议 创建单节点实例 单节点实例的故障恢复时间较长,无SLA保障。变更单节点实例配置 变更配置的完成时间与多种因素(如网络、任务队列、数量大小)有关,建议您在业务低峰期执行变配操作,并确保您...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

MongoDB 4.2

数据安全性 功能 通用型本地盘版 独享型本地盘版 独占物理机 独享型云盘版 功能影响及建议 添加白名单分组 设置白名单 删除白名单 本操作不影响实例的运行,但是删除白名单可能会造成访问失败。添加安全组 移除安全组 云数据库MongoDB实例...

MongoDB 7.0

数据安全性 功能 独享型云盘版 通用型云盘版 功能影响及建议 添加白名单分组 设置白名单 删除白名单 本操作不影响实例的运行,但是删除白名单可能会造成访问失败。添加安全组 移除安全组 云数据库MongoDB实例只能添加与自身网络类型相同的...

MongoDB 6.0

数据安全性 功能 独享型云盘版 通用型云盘版 功能影响及建议 添加白名单分组 设置白名单 删除白名单 本操作不影响实例的运行,但是删除白名单可能会造成访问失败。添加安全组 移除安全组 云数据库MongoDB实例只能添加与自身网络类型相同的...

MongoDB 5.0

数据安全性 功能 独享型云盘版 通用型云盘版 功能影响及建议 添加白名单分组 设置白名单 删除白名单 本操作不影响实例的运行,但是删除白名单可能会造成访问失败。添加安全组 移除安全组 云数据库MongoDB实例只能添加与自身网络类型相同的...

专家成长计划技术培训课程

现场面授(特殊情况可调整为线上钉钉群直播)深入运维故障处理技术 弹性计算方向 弹性计算通用技术 1天 30人 该课程的创新点在于全面深入的理解和云计算相关的基础技术,并通过相关产品演示,能够让学员全面理解云计算相关技术,如虚拟化、...

创建RDS SQL Server实例

如果选择通用云盘,您还可以开启通用云盘的IO突发功能,该功能开启后,业务波动较大、业务波峰较频繁时,通用云盘的实例将能够提供更高的IO能力。更多详情,请参见 通用云盘简介。配置实例网络,网络类型 固定配置为 专有网络。选择 VPC。...

基线检查

说明 新购买的资产默认归属在 所有分组>未分组 中,如需对新购资产自动应用该策略,请选择 未分组。如果您需要添加新的分组或修改已有分组,请参见 管理服务器。添加自定义策略 您可通过添加自定义策略,检查您的资产在操作系统自定义基线...

基本概念

分组 物联网平台支持建立设备分组分组中可包含不同产品下的设备。通过设备组来进行跨产品管理设备。网关 能够直接连接物联网平台的设备,且具有子设备管理功能,能够代理子设备连接云端。子设备 本质上也是设备。子设备不能直接连接物...

监控和分析

监控云上资源,系统的安全状况,找出业务系统可能存在的漏洞,对可疑活动的告警作出反应,或是针对企业日常活动中的安全事件进行追溯,是构建业务安全机密性、完整性、可用性重要的一环。监测控制 通过运用云上的多种监测控制手段,以此来...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 负载均衡 云数据库 Redis 版 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用