主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

挂载文件系统失败故障排查

通过控制台挂载文件系统失败可能有哪些原因?Linux挂载NFS协议文件系统失败自动检查脚本 Linux挂载NFS协议文件系统失败可能存在多种原因,您可以执行以下步骤通过自动检查脚本定位问题。登录挂载文件系统失败的Linux服务器。下载自动检查...

ECS系统事件概述

应用场景 通知风险和异常 针对未在ECS控制台展示的系统事件(包括影响ECS资源可用性和造成性能受损的系统事件),例如因系统维护重启实例等运维事件、实例到期等费用预警事件,阿里云会将系统事件推送至ECS控制台展示,部分高危事件还会...

常见问题

以Windows10 64位系统为例,步骤如下:进入 系统 页面,路径为 控制面板\系统和安全\系统。单击 高级系统设置。在 系统属性 对话框,单击 环境变量。在 用户变量 列表选中 NODE_OPTIONS=-max-http-header-size= value ,然后单击 删除。...

故障排查

如果您使用的系统是Windows,请执行以下命令开启守护进程:cd C:\Program Files\Docker\Docker DockerCli.exe-SwitchDaemon 如果您使用的系统是Linux,请执行以下命令开启守护进程:service docker restart 如何通过查看日志排查故障?...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

功能更新记录

全部地域 2021-09-15 故障场景参数分层 将故障场景的配置参数分为故障配置(故障的基础参数配置)、影响范围(故障的爆破半径)、通用配置(场景通用参数,如“debug日志开关”等)、流程配置(节点等执行方式手动/自动、容忍度等),从而...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

Mesh 常见问题

XDS 配置不下发 问题原因:Pilot 未启动或 Pilot 与 MOSN 网络不通。解决方案:查看 MOSN 连接 Pilot 是否正常。进入 MOSN 容器,执行如下命令,如果和pilot没有链接则检查pilot的地址是否填写正确 netstat-na|grep 15050 进到MOSN容器,在...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多选);进展摘要:处理人将事件升级为...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

接入ARMS监控

操作步骤 登录 AHAS控制台,在左侧导航栏选择 故障演练>我的空间。单击 新建演练,选择 新建空白演练,进入 演练配置 页面。单击 新建空白演练 后,在 演练配置 页面,填写 演练名称、演练描述、演练标签 和 演练空间。配置项 配置说明 ...

订阅事件通知

前提条件 您需要登录 消息中心,确保 云数据库故障或运维通知 的通知开关处于开启状态并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。创建报警联系人和报警联系组,并将报警联系人添加到报警联系组。具体...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

云虚拟主机控制台功能指引

⑤ 操作系统 成功购买云虚拟主机后或者需要更换主机操作系统时,您可以在待查看的云虚拟主机对应的 操作系统 列,查看当前云虚拟主机的操作系统类型(包括Linux操作系统和Windows操作系统)。云虚拟主机管理控制台 云虚拟主机管理控制台有...

ECS系统事件汇总

系统事件用于记录和通知云资源信息,例如运维任务执行情况、资源是否出现异常和资源状态变化等。您可以通过系统事件获取ECS资源的风险和异常信息,例如 某一实例到期、实例因底层升级需迁移或因系统维护重启了某一实例等,然后及时响应和...

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

卸载客户端

前提条件 如果您是在服务器上手动卸载客户端(即服务器管理员通过应用程序在服务器上卸载客户端等方式),执行卸载操作前,您必须先在云安全中心控制台关闭该服务器的 恶意主机行为防御 和 客户端自保护 开关。您可以在 主机资产 页面该...

添加RDS for MySQL数据源

但是由于VPC网络实现机制的原因,有时控制台显示的实例ID并不是DataV数据源配置VPC网络需要的实例ID。因此您需要通过数据库产品的OpenAPI获取DataV需要的VPC实例ID,通常为数据库实例详情中的 VPCCloudInstanceId 或 VPCInstanceId,具体...

添加RDS for MySQL数据源

但是由于VPC网络实现机制的原因,有时控制台显示的实例ID并不是DataV数据源配置VPC网络需要的实例ID。因此您需要通过数据库产品的OpenAPI获取DataV需要的VPC实例ID,通常为数据库实例详情中的 VPCCloudInstanceId 或 VPCInstanceId,具体...

物理端口监控及预警

通过阿里云的云监控服务,高速通道的物理端口监控和预警功能可以实时监测连接状态,并可以根据您配置的报警规则发送报警通知,使您能够迅速识别并应对专线故障,确保业务的稳定运行。前提条件 您已经完成物理专线连接。具体操作,请参见 ...

配置管理

数据管理DMS开放了系统层面的配置,管理员角色可通过对这些配置进行更改,来实现更灵活的管理需求。本文档介绍配置管理的方法。前提条件 系统角色为管理员。查看系统角色的具体步骤,请参见 查看我的系统角色。操作步骤 登录 数据管理DMS 5...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

访问控制策略常见问题

本文介绍使用云防火墙访问控制策略管控业务流量时可能遇到的问题及其解决方案。功能特性类问题 访问控制策略授权规格是否支持扩展?VPC间的防护流量是否支持扩展?云防火墙是否支持封禁IPv6地址段?主机边界防火墙和安全组有什么区别?普通...

混合云应用双活容灾最佳实践

背景信息 A企业是一个零售行业电商交易平台,业务系统部署在自建IDC机房,存在以下痛点:业务仅在IDC单机房部署,缺少容灾能力。IDC容量不足,物理机器升级替换周期长,不足以支撑业务的快速发展。业务在快速发展过程中,多次遇到容量不足...

云防火墙开关常见问题

本文介绍开启或关闭防火墙开关时可能遇到的问题,包括开启防火墙对业务的影响、开墙后的路由和流量变化等。为什么当前账号无法开启云防火墙?互联网边界防火墙 开启防火墙开关对业务有什么影响?互联网边界防火墙的作用是什么?互联网边界...

漏洞管理常见问题

因此,您可以通过以下方式查看当前软件版本的漏洞信息:在云安全中心中查看当前软件版本及漏洞信息 您可以在 云安全中心控制台 风险治理>漏洞管理 页面,查看云安全中心在您的服务器上检测到的系统软件版本及漏洞信息。系统软件漏洞各项...

归档存储服务等级协议

阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)...

设备本地日志

您可以在物联网平台控制台日志服务页,查询设备本地日志,进行故障分析。前提条件 设备已使用Android SDK或C SDK开发完成,并上报日志。具体操作,请参见 设备日志上报。如果设备通过SDK开发实现了日志上报开关功能,则需要在 设备管理>...

OpenSensitiveFileScan-编辑敏感文件扫描开关

编辑敏感文件扫描开关。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中...

运维服务内容说明

1.服务概述 阿里云运维服务(Alibaba Cloud Managed Services),基于阿里巴巴数字化运维解决方案,提供专属运维服务专家,帮助企业客户做好云上运维管理,降低运维开销和风险,提升运维效率和业务连续性,增强系统安全性和合规性,助力...

压测Spring Cloud服务

在日常开发中,开发人员或测试人员需要评估服务的性能是否符合预期,避免因功能迭代导致服务性能下降而引发故障。服务压测功能可以让您低成本地评估服务性能,做到1分钟创建压测场景,5分钟获取性能指标。背景信息 在大促活动中,应该准备...

新功能试用申请

MaxCompute通过创建External Volume去挂载OSS的一个路径或者 Bucket,利用MaxCompute权限管理系统对用户访问External Volume做细粒度的权限控制,同时利用MaxCompute引擎处理External Volume内部的文件数据,在湖仓一体场景中完成湖仓融合...

功能架构

作为一个企业级产品,系统提供资源租户隔离、访问鉴权控制和监控配置模板等企业级特性。并且提供数据高可用、服务高可靠、双机房容灾部署等平台特性。基于系统丰富数据和强大功能,可以支撑容灾巡检、故障重放、弹性扩缩、微服务治理和全...

自治中心

说明 例如在可限流时间段(默认可限流时间段为00:00~23:59)内,自定义触发条件为当CPU使用率大于70%,同时活跃会话数大于16,且该现象持续时间超过2分钟时触发自动限流,同时自动开始跟踪,如果发现故障未消除,则自动回滚该限流操作。...

AIOps 解决方案专家服务内容说明

调研的服务范围包含:基础资源调研、业务现状调研、应用系统调研《调研报告》2 智能故障发现方案设计 基于业务数据、资源组维度建立业务组单元,将业务组单元指标通过智能AI算法进行实时分析,帮助企业快速发现故障,列出可疑根因事件,并...

ADP底座介绍

ADP底座包含了两个部分:ADP容器底座:整个应用运行时的公共底座,是一个K8s为基础的容器云平台,他是应用自有组件和中间件的部署、运维的基础设施,为上层业务应用的运行和管理维护提供必要的系统支持。ADP-Local:跟随软件产品交付部署到...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 文件存储NAS 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用