功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

终端访问控制系统FAQ

本文档介绍了使用终端访问控制系统常见问题和对应的解决方案。有线网络可以通过添加Mac白名单的方式来放行打印机等哑终端设备,无线网络如何支持无法安装客户端的终端入网?终端访问控制系统支持管理哪些类型的终端?管理员在推送Windows...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

Tair选型指南

选择容灾方案 图 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

自助救治损伤的ECS实例Linux系统

适用的症状和原因 在某些情况下,Linux操作系统会出现启动异常,此时,在阿里云ECS控制台显示的实例状态可能是运行中,但实例内的应用不可访问,实例内的网络不可达,既无法ping通,也无法通过workbench或者ssh建立连接。如果您在阿里云ECS...

演练场景说明

网络故障系统运行过程中时常遇到的问题,所以需要提升系统在网络异常情况下的容错能力。Java 场景名称 特性 虚拟机场景 故障演练支持的虚拟机场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段...

同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

查看服务器信息

区域 说明 服务器监控 在该区域内,系统显示服务器的流量、vCPU、内存以及系统盘的使用情况。您也可以单击 详情,查看更多详细数据。本文提供了查看流量使用的示例,具体操作,请参见 示例:查询流量使用情况。说明 如果您购买的是每月无...

查看实例的系统日志和屏幕截图

云服务器ECS是虚拟化的云上服务,您无法接入显示设备,也无法手动截屏。但是ECS缓存了实例最近一次启动、重启或者关机时的系统日志,并且支持实时获取实例屏幕截图。您可以利用这些功能分析排查实例故障,例如诊断操作系统无响应、异常重启...

标准版-双副本

阿里云自研 故障探测切换系统(HA)阿里云Redis服务封装HA切换系统,实时探测主节点的异常情况,可以有效解决磁盘IO故障,CPU故障等问题导致的服务异常,及时进行主从切换,从而保证服务高可用。主从复制机制 阿里云针对Redis主从复制机制...

概述

数据库治理的常见问题 系统对外提供查询接口,由于SQL语句涉及多表Join,因此可能会触发慢查询,最终导致DB连接池/Tomcat线程池满,应用整体不可用。在应用启动时,数据库Druid连接池处于初始化,同时伴有大量请求进入,可能导致Dubbo的...

标准架构

阿里云自研 故障探测切换系统(HA)阿里云 Tair 服务封装HA切换系统,实时探测主节点的异常情况,可以有效解决磁盘IO故障,CPU故障等问题导致的服务异常,及时进行主从切换,从而保证服务高可用。主从复制机制 阿里云针对 Tair 主从复制...

通用性能

系统指标 指标详细 维度 能力 说明 系统部署 Agent自动注册 按规模可选择Agent集群式入网,高可用执行分钟级故障切换 系统性能 自动化峰值调用性能:100/分钟 自动化任务下发 并发调用性能:100台设备并行配置 系统稳定 系统动态扩容能力:...

ECS系统事件概述

系统事件由阿里云定义,用于记录和通知云资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。说明 阿里云有众多产品支持系统事件,例如ECS、RDS、SLB等。本文仅说明云服务器ECS支持的系统事件,如需了解其他产品的系统...

替换主机

背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例...

通信监测

通信监测功能可以查询指定AppID下全链路通话数据(包含通信质量和频道数据)。通过阅读本文,您可以了解通信监测的查询方法和通信监测作用。...操作系统分布 显示用户数最高的十个操作系统,以及使用该操作系统的人数和占比情况。

通信监测

通信监测功能可以查询指定AppID下全链路通话数据(包含通信质量和频道数据)。通过阅读本文,您可以了解通信监测的查询方法。操作步骤 登录 音视频通信...操作系统分布 显示用户数最高的十个操作系统,以及使用该操作系统的人数和占比情况。

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

替换主机

背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 执行替换主机操作会有如下影响:系统会将主机设置为停止分配实例。迁移走本...

cli

答:cli组件支持文件系统操作命令,使用方法类似Linux常见Shell命令,简单举例如下:lsfs-列出当前系统注册的文件系统节点 命令显示:/data 表示当前文件系统(littlefs)注册的节点为/data df-显示文件系统当前使用情况(单位:KB)命名显示...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

本地设备通过公网无法连接Redis的常见问题排查

Windows Windows系统会在4次Ping之后显示测试结果,如下图。如果返回信息类似 0 packets received,100.0%packet loss,说明网络未连通。请检查您使用的连接地址是否为实例的公网访问连接地址。如果返回信息类似 Unknown host 或 Name or ...

ECS无法连接Redis的常见问题排查

Windows Windows系统会在4次Ping之后显示测试结果,如下图。如果Ping不通,说明网络未连通。常见的原因和解决方法 ECS实例与Redis实例可能 不在同一VPC。请确认ECS实例与Redis实是否在同一VPC,具体步骤请参见 如何确认ECS和Redis的网络...

网络诊断

重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。前提条件 已创建ACK...

应用场景

能够解决 多源监控集成:支持多个常见监控系统集成,简单配置即可完成集成对接。报警统一处理:所有报警进行集中降噪处理,抑制收敛,避免报警风暴。事件闭环管理:对报警生成事件,进行全生命周期管理,不遗漏重大事件。体系化故障闭环...

使用可视化演练

右侧显示系统整体的架构。展示了应用之间的调用关系。您可在右侧架构中单击某个应用,展示应用详情视图。在页面右上角,您可单击 应用筛选,选择需要展示的应用。演练状态观测。当有演练进行时,会将演练中的应用进行标识,让您直观地观察...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

查看事件与监控信息

故障列表 故障列表显示当前应用分组正在报警的全部资源,如果正在报警的规则被禁用,则故障列表中不再显示被禁用规则的故障信息。可用性监控 查看服务实例可用性的监控信息。组进程监控 查看组进行监控的进程ID、动态规则匹配和状态等信息...

什么是容器报警演练

不同于其他故障演练模块对系统注入真实故障,报警演练只会对集群的API Server投递事件,由事件触发报警链路,不会对系统造成真实故障。无侵入。无需在用户集群中安装探针以注入故障,所有事件投递都是通过API Server来进行网络请求。

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

系统故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

HaaS EDU场景式应用整体介绍

2.1 首页系统信息屏 这是系统启动后的默认屏幕,包含了许多的知识点:OLED显示屏驱动与显示 系统版本获取 系统联网与IP地址获取 网络时间获取 Wi-Fi状态获取 蓝牙连接 电池电量获取 通过本案例的学习,能完整学习到AliOS Things操作系统...

查看应用分组

创建应用分组后,您可以查看应用分组的组内资源、监控视图、故障列表、可用性监控等数据,并执行相关操作。通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择...

Windows 实例系统重启后显示系统恢复选项

问题现象 Windows 实例一直正常运行很多天,但是重启后无法进入操作系统,桌面显示系统恢复选项”。使用之前备份的自动快照也无法正常恢复。问题分析 这种情况可能是实例进入了 Windows 恢复环境。Windows 操作系统在遇到异常、无法启动...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

功能内容配置介绍

PC端常见问题 功能说明:发送时机:开启本功能后,在PC端,用户进入聊天窗时,在聊天窗右侧显示“辅助栏”,在辅助栏显示常见问题”模块。卡片样式:详见上方截图示例。您可以在页面右侧实时预览配置。卡片功能:您可以按分类配置常见...

设置Pod故障处理策略

以库存不足创建ECI Pod失败为例,当Pod的故障处理策略为fail-fast时,Pod status condition为ContainerInstanceCreated的示例如下:说明 如果Pod的故障处理策略为fail-back,Pod创建失败后系统会自动尝试重调度。此时,Pod status.reason...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储NAS 数据库自治服务 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用