网络架构容灾

如果为了满足业务对延迟等需求,必须选择相同接入点,也必须保证两条专线在两个不同的接入设备上,这样即使有一台设备故障导致其中一条线路异常时,也可以保证另外一条线路正常运转。专线/VPN主备:在物理专线、IPSec-VPN连接、BGP动态路由...

灾备规划

GB/T 20988-2007标准是中国国家标准化管理委员会制定的信息系统灾难恢复规范。附录中有某行业RPO/RTO的等级规范示例,如下所示。更多信息,请参见 GB/T 20988-2007标准。混合云容灾服务提供了简单的配置来满足不同的RPO和RTO要求。例如,...

预警规则

流程说明 操作流程 创建钉钉机器人并配置订阅内容,请查阅 钉钉机器人管理 配置预警规则,在 系统管理>预警规则 界面,在 价签缺电预警或显示延迟预警 中单击 设置,输入设置的阈值,单击 确认,完成设置。预警处置,当接收到钉钉推送消息...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

短信核验FAQ

说明 如您确认填写的信息正确无误,但系统还是提示您 该条验证库里找不到记录,该问题可能是系统原因造成,实际备案信息已进入管局进行审核中,请您耐心等待管局审核。工信部短信核验信息输入错误怎么办?可能原因:您的信息输入错误或输入...

存储资源

存储资源是指用于存储和管理数据的硬件和软件资源,包括节点的本地磁盘、分布式文件存储、数据库和缓存等。存储资源的主要作用是存储和管理系统的数据。存储资源需要提供数据的持久性、可靠性和高效性,以满足系统的数据存储和访问需求。...

事件管理

支持将影响恶化的事件一键升级为故障,实现事件全生命周期的在线化管理。集成告警数据:可集成多种告警源例如:ARMS、SLS、云监控、Prometheus、Dynatrace等数十种监控系统。同时支持自定义集成,可自动解析告警信息。事件分类与分派:首先...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

测试指标

系统处理能力 定义及解释 系统处理能力是指系统在利用系统硬件平台和软件平台进行信息处理的能力。系统处理能力通过系统每秒钟能够处理的交易数量来评价,交易有两种理解:一是业务人员角度的一笔业务过程;二是系统角度的一次交易申请和...

物联网连接管理技术服务条款

您充分理解并同意,由于物联网连接管理技术服务属于根据您的需求定作的服务,请您在定作销售页面下单时务必认真填写并仔细核对下单信息,因您自身原因下单错误导致阿里已按订单定作发货,或您已经将卡激活使用的(指已经将卡插到设备上产生...

ARMS告警精细管理最佳实践

本文介绍ARMS告警管理如何应对大规模系统的告警配置。背景知识 在告警管理中有一个非常重要的指标Mean Time To Contain(MTTC),MTTC描述了从检测到故障事件到控制和解决该事件所需的平均时间。它是一个关键指标,因为它衡量了一个组织对...

替换主机

背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例...

Windows系统实例的宕机问题排查

当Windows操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统事件来定位原因并解决。...

词汇表

负载均衡 负载均衡是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务器来扩展应用系统的吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。更多信息,请参见 什么是负载均衡。高速通道 高速通道(Express ...

产品概述

部署在生产现场的两台工业边缘数采一体机实现高可靠的SCADA系统设备资产统一管理 企业需要管理和运维下属多级组织的各种设备资产,通过制定统一的设备资产模型和资产管理指标,通过不同业务实体划分来管理和采集生产设备的实时数据,而在...

三网合一卡2.0使用入门

步骤四:验证重启是否切网成功 设备手工重启后自动切换网络,查看运营商信息是否更新 步骤五:验证网络故障设备自动重启切网 登录阿里云控制台,对当前使用的运营商卡片进行停机操作,模拟断网场景,在 步骤二 的基础上等触发检测后,设备...

公共云基础服务说明书

阿里云售后团队向客户提供的关于第三方软件的建议只适用于有经验的系统管理员或其他相关IT人员。阿里云不负责以上第三方软件的安装、调试或更新,或对建议的实施。第三方软件目录及问题服务范围举例:第三方软件目录 服务范围:示例 非服务...

什么是云网管

资源管理(Resource Management)基础设施资产及其配置管理和统计,系统纳管资源可自定义,范围不仅包括设备、主机和IoT之类物理资源,也包括IP地址、业务链路等逻辑资源。灵活的资源产品定义,实现异构资源纳管和盘点统计。支持基础设施...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

NAT网关故障排查指南

如果您存在多台Linux操作系统的ECS实例通过NAT网关并发访问基于Linux操作系统服务端的场景,由于Linux操作系统内核实现的原因,可能存在TCP连接请求被Linux操作系统内核丢弃而导致连接超时或失败的情况。更多信息,请参见 Linux内核协议栈...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

配置健康检查

如果本地数据中心网络设备配置了控制面板策略CoPP(Control Plane Policing)(如思科设备)或者本机防攻击策略(如华为设备)可能会导致健康探测报文被丢弃,造成健康检查链路震荡,建议本地数据中心网络设备取消CoPP限速配置。...

设备详情

生活物联网平台提供查看产品的详细信息,可以在设备调试界面进入设备详情页面查看产品的设备信息、Topic列表、运行状态、事件管理、服务调用、设备影子、文件管理、日志服务及在线调试。前提条件 查看设备详情前需完成新增测试设备,详细...

从TR专线迁移至ECR专线访问云资源

步骤二:为物理专线2创建并开始故障演练任务 您需要为VBR2所在的物理专线2创建并开始故障演练任务,将物理专线2和VBR2通过模拟故障进行状态中断。具体操作,请参见 创建故障演练任务 和 开始故障演练任务。步骤三:删除VBR2与TR的关联转发 ...

回切至本地物理机

背景信息 目前阿里云的混合云容灾服务对本地的数据中心做保护,并实现在本地虚拟机出现故障的时候以秒级RPO、分钟级RTO在阿里云ECS上进行恢复。但是对于完整的容灾场景,还要求在本地虚拟机出现问题后,可以选择将云上恢复出来的ECS回切到...

无影魔方AS05

V6.4.0-2023年8月 变更类型 变更点 变更说明 新增 新增外设故障诊断功能 无影云电脑 外设管理面板的 操作 列新增 诊断 功能,从而检查USB外设的连接链路是否正常。优化 提升网络检测能力 在原有网络检测能力的基础上,增强IP地址冲突、外网...

接入ARMS监控

故障演练时通过接入应用实时监控服务ARMS(Application Real-Time Monitoring Service)可以对演练过程的指标进行监控,包含JVM内存、JVM线程数、JVMGC相关、网络出入口流量、磁盘、CPU等指标。本文介绍如何在故障演练中接入ARMS并监控演练...

禁用或启用实例

管理员或DBA不允许其他用户在DMS对某个实例进行查询、变更等操作时,可以主动禁用实例,禁用后,该实例将无法在DMS中检索到,也无法在DMS中继续使用。如需解除已禁用实例在DMS中的限制,可以启用实例。除此之外,您还可以查看实例被禁用...

故障排查

背景信息 故障排查步骤如下:排查路由问题。排查第3/4层(网络/传输)问题。排查第2层(数据链路)问题。排查第1层(物理)问题。排查路由问题 本地接入设备能ping通云上边界路由器网关VBR的IP,并且已建立了BGP对等会话,如果您的本地...

基于执行命令的分批发布

系统运维管理 OOS(CloudOps Orchestration Service)(OOS)简介 系统运维管理,简称OOS,是全面、免费的云上自动化运维平台,提供运维任务的管理和执行。典型使用场景包括:事件驱动运维,批量操作运维,定时运维任务,跨地域运维等,OOS为...

如何管理事件

本文档主要介绍如何管理事件。事件来源 通过流转规则触发的系统事件;通过手动新增的人工事件。事件的状态 已分配:事件已分配处理人,可点击“接手”按钮进行接手;已响应:事件已被处理人接手响应,在处理完事件后,可点击“完结”按钮...

支持计划

2.1阿里云支持计划服务范围 阿里云支持计划服务范围包含:阿里云产品的最佳实践 阿里云产品相关的技术问题、故障处置 阿里云API 和阿里云SDK问题的故障处置 与阿里云资源相关的操作或系统问题的技术支持 与阿里云的管理控制台或其他阿里云...

IIS Web网站访问故障

本文介绍IIS(Internet Information Service)作为Web服务的网站,访问故障相关的问题及解决方案。本文介绍的IIS Web网站访问故障相关问题如下:访问部署在Windows实例上的基于IIS搭建的Web网站时,提示“500-内部服务器错误”,如何处理?...

切换接入点

智能接入网关实例绑定云连接网后,系统采取就近原则,自动连接智能接入网关设备至最近的接入点,您可以根据实际需求切换智能接入网关设备的接入点。云连接网在全球范围内拥有多个接入点,接入点信息如下表所示:区域 接入点 中国内地 西安...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

概述

卓越运营是指在商业运营中注重细节、流程和效率,从而使...在云原生时代,架构与应用部署方式的变化是非常频繁的,通过获取系统内部的信息,来主动发现问题显得非常重要,构建可观测系统可以协助企业提升发现问题-判断和决策-解决问题的能力。

运维服务内容说明

1.服务概述 阿里云运维服务(Alibaba Cloud Managed Services),基于阿里巴巴数字化运维解决方案,提供专属运维服务专家,帮助企业客户做好云上运维管理,降低运维开销和风险,提升运维效率和业务连续性,增强系统安全性和合规性,助力...

组件概述

ack-node-repairer 可选组件 ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。ags-metrics-collector 可选组件 为基因计算客户使用的监控服务组件,可以通过该组件监控基因工作...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云安全中心 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用