网络类场景

网络类场景包含网络延迟、网络丢包和篡改域名解析等场景。帮助您在网络异常的情况下验证应用或服务的容错能力。网络延迟 网络延迟场景可以指定网络延迟因素(例如网卡、本地端口、远程端口、目标IP等)和延迟时间,对应用或服务注入网络...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

服务等级说明

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

SLA服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户的应用程序或数据信息受到黑客攻击而引起的;(4)用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)用户的疏忽或由用户授权的操作所引起的...

使用Windows实例搭建AD域

如果您的计算机信息中自动加上了AD域域名,则表示该客户端已成功加入AD域。相关操作 当您在ECS实例上成功搭建AD域并将客户端加入AD域后,您可以根据实际需要进行相关操作,例如创建用户、创建组织单位等。更多信息,请参见 Active ...

常见问题

RUN fsck MANUALLY.”的错误 访问实例异常时的问题排查和指引 避免无法启动Linux实例升级内核系统 Linux实例常用内核网络参数介绍与常见问题处理 如何使用Windows事件查看器查看实例运行日志 Windows Update补丁更新失败 如何通过工具自动...

什么是云拨测

故障定位与诊断:云拨测利用先进的Traceroute诊断技术,快速发现并定位网络故障,提供详细的故障报告和解决建议。实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

故障排查

ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 容器服务ACK应用故障排查 如何升级集群?排查故障的...

通用服务条款

您承诺不应大量占用,亦不得导致如程序或进程等大量占用阿里云云计算资源(如云服务器、网络带宽、存储空间等)所组成的平台(以下简称“云平台”)中服务器内存、CPU或者网络带宽资源(比如但不限于互联网挖矿等行为),并给阿里云云平台...

VPC常见问题

本文介绍并解答VPC的常见问题。专有网络与经典网络的区别是什么?ECS实例是否可以绑定多张网卡?每个专有网络可以有多个路由器吗?每个路由表可以建立多少条路由条目?每个专有网络能够容纳多少个交换机?每个专有网络支持云资源使用多少个...

网络概述

ACK常见网络能力一览表 分类 常见网络能力 网络插件 参考文档 Terway Flannel 网络配置管理 IPv4/IPv6双栈 支持 不支持 创建Kubernetes托管版集群 创建Kubernetes专有版集群 节点维度网络配置 支持 不支持 配置Terway网络下节点级别网络 ...

弹性加速计算实例EAIS安全性说明

弹性加速计算实例EAIS的云上安全性,是阿里云在面对当前的网络安全形势和挑战时所采取的措施,以及提高用户在资源和网络访问控制、EAIS资源操作、故障隔离和风险检测等方面的安全性所具备的能力。说明 通过在ECS实例(非GPU实例)上绑定...

运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

Node.js 性能平台服务条款

5.3 对于因电信系统或互联网网络故障计算机故障或病毒、信息损坏或丢失、计算机系统问题或其它任何不可抗力原因而产生损失,阿里云不承担任何责任。6、隐私权政策 6.1 除本服务条款另有约定外,您及阿里云都应对因本服务而获得的对方的...

ECS无法连接Redis的常见问题排查

本文介绍ECS连接Redis失败的常见问题的解决办法。ECS连接问题排查流程图 步骤一:报错信息是否为 invalid password、WRONGPASS、NOAUTH Authentication required 如果报错信息为 connection timed out 或者无明确的报错信息,请跳过步骤一...

物联网络管理平台

物联网络管理平台,是阿里云面向物联网领域开发人员推出的网络管理平台,旨在帮助开发者搭建无线空口数据通道,实现终端(如传感器等)数据通过无线技术上报云端。物联网络管理平台可与阿里云物联网平台搭配使用,确保参与物联网开发的每个...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

网络智能服务

网络智能服务NIS(Network Intelligence Service)是为您在云上建站提供规划、部署与运维能力的智能化自助服务平台,可以帮助您更方便地规划与使用网络网络智能服务既可以为您规划网络时提供参考数据,也可以协助您发现并解决网络的异常...

网络连通性

本文为您介绍网络连通性有关的常见问题。Flink全托管集群如何访问公网?如何访问跨VPC的其他服务?如何设置白名单?如何排除网络问题?如何查看公网带宽情况?Flink全托管集群如何访问公网?背景说明 Flink全托管集群默认不具备访问公网的...

OSS文件上传和下载失败的排查方法

若存在网络故障,请使用ping命令测试与OSS的网络连通性,确保网络正常后再进行下一步排查。检查上传文件的大小是否超过限制。通过OSS控制台上传、简单上传、表单上传、追加上传的方式上传单个文件,文件的大小不能超过5 GB。如要上传超过5 ...

监控与日志

流日志功能 专有网络VPC提供流日志功能,可以记录VPC网络中弹性网卡ENI(Elastic Network Interface)传入和传出的流量信息,帮助您检查访问控制规则、监控网络流量和排查网络故障。关于流日志的详细信息,请参见 流日志概述。创建流日志时...

云数据库Redis版是否支持主从节点的故障切换?

云数据库Redis版支持自动执行主从节点的故障切换。主从(Master-Replica)节点之间的同步和故障切换,由系统来自行管理,无需用户来维护。

专家成长计划技术培训课程

现场面授(特殊情况可调整为线上钉钉群直播)云上存储运维工程师专家培训(专项)1天 30人 本课程将全面介绍块存储、OSS、日志服务三大产品的常见问题的定位、排查和处理,使学习者深入故障处理和排查能力。本课程包含一定的实验动手操作,...

故障基础数据管理

P4 故障场景监控覆盖 基于故障等级定义场景,配置对应的监控项接入7*24监控值班,同时对接入的监控数据额外提供基于算法的智能告警,或者接入研发可自闭环的风险预警,保障业务故障的监控发现率,减少故障持续时间,降低故障影响。...

故障管理

为降低故障的影响,阿里集团故障管理体系从整体体系化治理的角度出发,将影响真实业务的场景定义、发现和应急能力以及后续治理都纳入故障管理的范围。结合阿里集团创新性的“风险预警”,从“隐患”就开始管理,同时覆盖造成一定影响导致...

应用故障自动诊断

网络问题 机房发生网络故障导致应用运行异常。查看故障自动诊断报告 登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用列表,在顶部菜单栏选择地域并在页面上方选择 所属微服务空间,在 集群类型 下拉列表,选择 K8s集群,然后在页面单击...

网络资源

网络资源是流量入口和数据交互的基础设施,常见的网络资源风险点如下:网络带宽不足 指网络连接的带宽无法满足系统或应用程序的需求,导致网络传输速度慢,影响系统的响应和性能。针对网络资源带宽不足的情况:带宽监控预警:实时监控网络...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

演练原子操作

故障演练原子操作指最小单元的故障。在 故障演练>演练原子操作 页面中,展示了平台上可用于故障演练的原子服务。可根据原子服务状态分类,查看当前环境中的故障原子操作信息,包括原子操作名称、操作编码、添加时间、状态、被引用次数等...

如何管理故障

可以对故障的最新进展、故障影响面(影响服务)、舆情反馈、Timeline时间线进行在线化管理、编辑,并同步更新通告及故障状态,确保故障关键进展及时通知至相关人员。改进分析 改进分析用于记录管理故障恢复后的故障复盘。当故障处于复盘中/...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

获取计算机

1.组件介绍 说明 必要前置组件:无 利用本...流程搭建示例 搭建流程 利用 获取计算机名 组件,获取计算机名 利用 记录日志 组件,打印指定变量的值 执行结果 如下图所示,该流程成功执行完后,会自动将获取到的计算机名称打印在日志面板中。

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

故障注入

服务 配置注入故障的服务。单击 切换输入模式 可在手动填写与下拉选择之间切换。方法 配置故障注入的方法。星号(*)表示所有方法。运行模式 配置故障注入规则的运行模式,取值如下:拦截模式:满足条件的故障注入请求会被注入。观察者模式...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用