安装故障演练探针

对指定机器进行演练时,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。背景信息 一次完整的故障演练包括以下四个阶段:安装探针>创建演练>执行演练>停止演练 操作步骤 登录 AHAS控制台。在左侧导航栏选择 探针管理,...

演练概述

完整的故障演练包括以下四个阶段:安装故障演练探针 对指定机器进行演练,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。创建演练 配置演练基本信息、演练对象和演练全局参数。可同时选择多个故障类型。执行演练 将...

演练场景

重要 请确保集群中已安装故障注入组件。该组件可以通过 容器应用服务(AKS)>集群管理>组件管理 进行安装。如果选择 用户应用,需进行以下配置。配置项 说明 故障注入应用 选择注入故障的应用。支持选择多个应用。工作空间组 选择注入故障...

停止演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 自动停止 在创建演练过程中需设置自动恢复时间和保护策略,起到自动停止演练的作用。具体步骤,请参见 创建演练。当演练时长超过设置的自动...

执行演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 演练任务创建完成后,您可以直接执行演练。在左侧导航栏中选择 故障演练>我的空间。在演练列表中单击目标演练任务右侧 操作 栏的 ...

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

微服务强弱依赖治理

前提条件 安装故障演练探针,详情请参见 管理探针。开通微服务引擎MSE并为应用接入探针,详情请参见 应用接入MSE。操作步骤 登录 AHAS控制台,在左侧导航栏选择 故障演练>演练方案。在左侧导航栏选择 演练方案>微服务演练。在 微服务演练 ...

接入主机

在 探针管理 页面,选择 探针安装>故障演练探针。在 安装探针 页面,选择您要安装的环境,单击目标主机名称 操作 列的 手动安装,然后在弹出的对话框中 点击复制,复制命令。登录主机,执行复制的命令。重要 Linux操作系统请使用Root用户...

接入ECS

在 探针管理 页面,选择 探针安装>故障演练探针。在 安装探针 页面,单击 阿里云ECS。您可以选择以下任意一种方式安装探针:重要 Windows操作系统目前仅支持手动安装。自动安装:单击目标主机右侧 操作 列的 单击安装。在 安装探针 对话框...

接入容器服务K8s版

在 探针管理 页面,选择 探针安装>故障演练探针。在 安装探针 页面,单击 容器服务,然后在 参数 页签,可查看安装该组件的默认参数值。在 ack-ahas-pilot 页面右侧的 创建 面板中,选择集群,单击 创建。结果验证 创建完成后,您可以登录 ...

接入自建Kubernetes集群

在 探针管理 页面,选择 探针安装>故障演练探针。在 安装探针 页面,单击 自建Kubernetes。选择以下任意一种方式安装Helm Chart包。方式一:单击下载 Helm Chart包。方式二:执行相应的命令下载。类别/地域 下载命令 公网 wget ...

Mesh 常见问题

故障注入未生效 故障注入可能发生在客户端,也可能发生在服务端,通常用来注入一段时间异常或者直接注入异常。注入规则没生效时,先检查自己的注入规则是否配置正确,如客户端注入需填写客户端的应用名,服务端注入需填写服务端的应用名。...

安装和使用GitLab

安装GitLab 本文介绍以下两种方式,安装方式差异说明如下,您可以根据需要选择其中一种方式:差异 Linux安装包 Docker Engine 安装方式 可以在Linux系统的ECS实例中直接运行安装包进行安装。通过在Docker Engine上运行GitLab容器来实现安装...

API概览

故障演练 API 标题 API概述 CreateFailoverTestJob 创建高速通道故障演练任务 调用CreateFailoverTestJob接口创建高速通道故障演练任务。StartFailoverTestJob 开始高速通道故障演练任务 调用StartFailoverTestJob接口开始高速通道故障演练...

管理探针

安装高可用探针(AHAS探针)如果您需要使用架构感知、故障演练功能,则需安装此探针。登录 AHAS控制台。在左侧导航栏选择 故障演练>概览。在 概览 页面的 欢迎体验故障演练 区域单击 安装演练探针。请选择您要安装的探针环境,根据不同的...

什么是容器报警演练

容器演练是针对Kubernetes集群定制的故障演练,可以对Kubernetes集群中至关重要的高可用特性进行验证。目前AHAS仅支持容器演练中的报警演练。...无需在用户集群中安装探针以注入故障,所有事件投递都是通过API Server来进行网络请求。

产品专家服务说明

第三方软件的安装、测试、故障诊断、优化等日常运维服务。安全事件入侵源定位及溯源追踪。强对抗性清理。其他不属于云安全中心产品专家服务的需求。客户与阿里云分工说明 责任主体 具体分工 客户与阿里云 客户购买云安全中心产品专家服务,...

阿里云上稳定性保障服务(容灾)内容说明

第三方软件的安装、测试、故障诊断、优化等日常运维服务。注:对于不在阿里云云上容灾服务范围内的第三方软件问题,客户可登录阿里云社区获取免费咨询,或联系云市场商家寻求帮助。3.前提条件 客户应提前至少10个工作日申请该服务,以便于...

可运维性咨询服务内容说明

第三方软件的安装、测试、故障诊断、优化等日常运维服务。3.前提条件 客户应提前至少15个自然日申请该服务,以便于阿里云评估甲方需求实现可能性,确认是否承接该服务申请。甲方应在项目开始时提供必要的办公条件包括办公桌、办公椅、洗手...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

安装cloud-init

如果您的自定义镜像未安装cloud-init,请手动安装,保证运行该镜像的ECS实例能成功完成初始化配置。本文介绍如何安装并配置cloud-init。关于cloud-init的更多信息,请参见 cloud-init官方文档。操作场景 阿里云所有公共镜像默认安装cloud-...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

支持计划

任何未经认证的IM沟通群及非阿里云服务支持企业服务群服务支持 所有第三方软件的安装、补丁更新、测试、故障诊断、优化等日常运维服务 注:对于不在阿里云服务范围内的第三方软件问题,客户可登录阿里云开发者社区提交问题咨询,由丰富经验...

支持计划FAQ

与阿里云产品相关的部分第三方软件配置指导以及故障排查 服务支持计划服务范围不包含:代码开发 不在附录列表的第三方软件配置指导以及故障排查 所有第三方软件的安装、补丁更新、测试、故障诊断、优化等日常运维服务 注:对于不在阿里...

探针安装常见问题

常见问题 本文介绍了以下常见问题:AHAS架构感知和故障演练探针limits配置 ECS探针安装常见问题 容器服务安装ack-ahas-pilot常见问题1 容器服务安装ack-ahas-pilot常见问题2 容器服务安装ack-ahas-pilot常见问题3 容器服务安装ack-ahas-...

支持计划-健康状态看板(SHD)

阿里云产品计划性维护事件公告推送 阿里云产品运行异常事件推送 服务范围不包含:代码开发 不在附录列表的第三方软件配置指导以及故障排查 所有第三方软件的安装、补丁更新、测试、故障诊断、优化等日常运维服务 注:对于不在阿里云服务...

运维与监控FAQ

云助手故障排查问题 Linux系统ECS实例安装云助手Agent失败,提示No such file or directory.因为ECS实例中已经安装了云助手。请参见以下步骤修复。详情请参见 安装云助手Agent。rpm安装包:运行以下命令,强制覆盖安装。rpm-i-force aliyun...

支持计划-服务报告

服务范围不包含:代码开发 不在附录列表的第三方软件配置指导以及故障排查 所有第三方软件的安装、补丁更新、测试、故障诊断、优化等日常运维服务 注:对于不在阿里云服务范围内的第三方软件问题,客户可登录阿里云社区获取免费咨询,或...

安装探针概述

为您的主机等资源安装应用高可用探针后,即可使用AHAS架构感知和故障演练功能,能直观地看到应用对基础架构的依赖关系、组件间的依赖关系,以及对指定机器进行故障演练。接入 AHAS架构感知和故障演练可以接入云服务器ECS、自建Kubernetes、...

查看应用分组

创建应用分组后,您可以查看应用分组的组内资源、监控视图、故障列表、可用性监控等数据,并执行相关操作。通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

常见问题FAQ

如无法排除故障:售后服务热线 400-0099998转1号键,进入报单,报单时请提供:门店名称、门店编号、门店具体地址、门店联系人姓名、手机号、故障现象。5.右上角无网络 故障示意图如下:如门店单台设备显示无网络,见下遥控器按键说明,按...

产品架构

产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:支持在控制台一键安装AHAS Agent,如果是公网则需要用户手动...

安全注意事项

安装注意事项 边缘一体机应在符合 安装环境要求 的环境下使用,否则可能造成设备故障,由此引发的设备功能异常或部件损坏、人身安全事故、财产损失等不在设备质量保证范围之内。边缘一体机,必须安装在室内环境,并确保室内环境:无漏水、...

管理组件

chaosblade-operator 面向云原生领域的混沌实验注入工具,配合金融云高可用管理平台使用,可以实现针对基础资源、用户应用、蚂蚁产品的故障演练。否 使用 高可用管理产品 HAS 时必须安装,否则无需安装。mosn-ingress 用于 Ingress 路由...

激活一体机

边缘一体机应在符合安装环境要求的环境下使用,否则可能造成设备故障,由此引发的设备功能异常或部件损坏、人身安全事故、财产损失等不在设备质量保证范围之内。安装激活环境要求 安装和使用边缘一体机时,需满足一定的安装环境要求。本文...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用