事件告警概览

故障排查:通过审计日志和告警来分析系统故障或性能问题的原因。功能特性 实时检测事件:当您设置告警规则后,操作审计将实时检测云上异常事件,快速发现风险。支持设置告警规则:操作审计内置关于账号安全、权限管理、资源管理等多条告警...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

解密ADB高效基因检测系统

基于阿里云云原生数据仓库AnalyticDB MySQL版向量分析构建的高效基因检测系统,能够在几十分钟内完成整个病原体的查询检测,大大提升了基因分析性能,为疑难杂症的确诊以及精准治疗提供有力支持。背景信息 病原体基因检测为医生诊断疑难...

应用场景

电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测故障发现以及业务趋势分析。设备通过工业接口协议将自身状态数据和生产业务数据接入工业设备网关,然后通过 MQTT 协议发送到物联网平台...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

检测镜像是否符合规范

ecsgo-helper.sh image-online-diagnostic 等待检测工具检测系统配置,检测结果类似如下信息。各检测结果说明,请参见 检测项说明。OS:CentOS 7.9.2009 Kernel:3.10.0-1160.76.1.el7.x86_64 Arch:x86_64 RTC-Mode:utc Boot-Mode:Legacy-...

备份和恢复数据

当出现系统故障或错误操作时,如果在此之前已经创建了快照,您可以使用该快照恢复数据。本文以Windows客户端为例,为您介绍如何利用系统快照和自定义快照备份和恢复数据。背景信息 自定义快照:您可以根据业务需要在某一时间点创建快照,...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

概述

事件驱动应用通常需要依赖内部状态,例如欺诈检测、风控系统、运维异常检测系统等。当您的行为触发某些风险控制点时,系统会捕获这个事件,并根据您当前和之前的行为进行分析,决定是否对您进行风险控制。企业应用 从企业应用的角度,Flink...

出错提示M199源系统迁移环境检测不通过

问题原因系统迁移环境检测不通过。解决方案 您可以根据出错提示信息,选择对应的解决方案:出错提示“Minimum memory requirements are not met”出错提示“A YUM/DNF repository defined multiple times”出错提示“Newest installed ...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

应用场景

风控监测系统 实时计算Flink版可以处理复杂的流处理和批处理任务,也提供了强大的API,执行复杂的数学计算并执行复杂事件处理规则,帮助企业对实时数据进行实时分析,提高企业的风控能力。例如检测APP中的点击行为、识别loT数据流不规则...

功能概览

生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。更多信息,请参见 跨地域容灾。跨可用区容灾 当生产站点因为不可抗力因素(比如机房...

云安全中心免费版简介

说明 您需要在 漏洞管理 页面手动执行一键扫描才能检测系统中的应急漏洞。漏洞管理介绍 异常登录 安全告警功能为您提供基础登录检测功能(非常用地登录和暴力破解)的检测和告警。帮助您及时识别异常登录,降低系统被黑客攻击的风险。安全...

设计原则

因此,数据容灾对于企业来说是非常必要的,数据灾备是企业保护核心数据的重要手段,能有效降低勒索病毒、系统故障、自然灾害和运维事故导致的数据丢失和损坏问题,同时满足行业安全和合规要求,可以保障企业的正常运行和稳定发展。...

镜像检测项说明

本文介绍镜像检测支持的检测项,并提供修复建议操作供您参考。Linux检测项 Linux操作系统镜像检测项的详细说明及修复建议如下...GUESTOS.BootMgr 检测系统引导管理器(BootMgr)是否缺失。如果缺失会导致系统无法启动。请配置正确的BootMgr。

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

镜像检测概述

镜像检测功能主要检测镜像是否为有效镜像、镜像是否可以创建出功能齐全的ECS实例等。您可以在创建镜像、导入镜像等环节使用...GUESTOS.BootMgr 检测系统引导管理器(BootMgr)是否缺失。如果缺失会导致系统无法启动。请配置正确的BootMgr。

跨地域容灾

生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。准备工作 在实现跨地域容灾之前,您需要选择一个不同于生产环境的地域作为容灾目标地域...

跨地域容灾

生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。本文介绍跨地域容灾的操作步骤。前提条件 在实现跨地域容灾之前,您需要选择一个不同于...

数据治理中心概述

治理项:用于任务提交、发布后的分析环节,检测系统存在的待治理优化问题。治理项包括强治理项和可选治理项,强治理项默认全局开启,且不可更改,可选治理项可根据需求选择是否启用。例如,治理项可以配置为 任务运行时间超长、连续出错...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...

单实例快速恢复

为了能够快速恢复系统故障,Hologres提供了单实例快速恢复的机制。本文为您介绍单实例快速恢复的触发条件和行为。实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器...

客户案例

业务挑战 一致性,一致性是金融业务的生命线,为了应对硬件或者系统故障(IDC/OS/机器故障),传统的数据库在这方面为业务提供多种选择。最大可用模式在主库故障情况下可能造成数据丢失。最大保护模式会提高全年的不可用时间,并造成性能...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

安全告警概述

安全告警检测项 下表列出了云安全中心威胁检测模块支持的所有告警检测项,并按照操作系统、分析对象、攻击手法等维度进行分类,帮助您更全面地了解云安全中心的威胁检测能力。这些告警类型是云安全中心根据威胁检测引擎提供的能力,结合...

开通与收费

针对同一检测内容同时检测多个风险场景,相比1.0版同等使用方式下降低 50-70%,具体计费规则请参考 定价详情。内容安全 增强版 按量付费会根据不同的内容类型(图片、文本 和语音等)、检测量级进行计量和出账。前往 内容安全增强版开通页...

什么是消息演练

验证服务依赖:通过演练的故障注入,检测系统对消息组件的依赖程度,探索消息失效的情况下,自身服务是否能够运行正常。降级备案方案:评估消息服务在故障情况下,降级预案是否运行正常,上下游通知服务是否具有容错机制。定位故障根源:...

Windows系统实例的宕机问题排查

当Windows操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统事件来定位原因并解决。...

配置算法实例

算法实例是根据算法模板创建的具体实例,可以根据您设置的检测参数结合算法模型,完成对相关数据中异常信息的检测及诊断,协助您更好地解读设备数据,监测设备运行状态,及时发现潜在故障。前提条件 已创建算法实例。具体操作,请参见 创建...

组复制简介

该层除了负责消息的传递,还负责故障检测和集群成员的管理。XCom层(Paxos Layer):基于Paxos协议实现,与组通讯层共同实现组复制层与集群的通讯,以及消息传递的全局有序性和集群成员的角色切换。它能够保证所有节点收到数据的顺序一致,...

图片审核增强版异步检测API

取值:baselineCheck:通用基线检测 baselineCheck_pro:通用基线检测_专业版 baselineCheck_cb:通用基线检测_海外版 tonalityImprove:内容治理检测 aigcCheck:AIGC图片检测 profilePhotoCheck:头像图片检测 advertisingCheck:营销...

处理挖矿程序最佳实践

服务器被挖矿病毒入侵后,挖矿病毒会消耗服务器的资源、降低生产效率、影响系统稳定性,对受感染的个人或企业用户构成严重的威胁。被入侵后,您需要及时响应并处理挖矿病毒,加固系统安全。本文介绍如何处理挖矿病毒。背景信息 挖矿程序的...

图片审核增强版AIGC场景检测服务

阿里云内容安全图片审核增强版推出AIGC场景图片检测服务,支持检测AIGC生成的图片是否有违规风险、AIGC生成的图片是否含有疑似侵权的元素以及判断图片是否由AIGC生成。本文介绍图片审核服务的AIGC场景检测功能。一、使用场景 阿里云内容...

挂载文件系统失败故障排查

Windows系统挂载NFS协议的通用型NAS文件系统失败排查思路 Windows系统挂载NFS协议的通用型NAS文件系统失败可能存在多种原因,您可以根据以下步骤依次排查。账号检查。确认ECS实例和挂载点属于同一个账号。如果ECS实例和挂载点不属于同一个...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储 CPFS 云安全中心 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用