什么是故障演练

故障演练与AHAS服务体系 故障演练作为AHAS的一部分,与AHAS其他功能组成了一套完善的可用保障服务,可以帮助用户实现包括架构、业务、人员的全面可用提升。故障演练在其中承担着问题发现、问题验证、可用经验沉淀的作用。

如何结束 AHAS Agent 进程?

AHAS 为应用可用探针(即 AHAS Agent)提供进程自动拉起功能,即定时检查 AHAS Agent 进程是否存在,如不存在,自动拉起该进程。这一功能保证了进程可用性,避免进程因异常挂掉或机器重启等原因,需要手动拉起的情况。所以,您在服务器...

使用VNC远程可视化

弹性性能计算提供VNC远程可视化功能,您可以通过控制台Web方式访问远程可视化图形界面。本文介绍如何连接可视化服务和停止可视化服务。前提条件 已安装VNC服务。开启方式如下:创建新的集群时,您可以在 软件配置 页开启VNC功能,系统将...

名词解释

本文列出了应用可用服务AHAS的主要术语。多活容灾相关术语 同城双活 同个城市部署两个数据中⼼,并行的为业务访问提供服务。异地多活 不同城市部署多个数据中心。多活一方面是多数据中心之间地位均等,正常模式下协同⼯作,并⾏的为业务...

如何卸载应用防护的Java Agent和SDK埋点?

背景信息 应用可用服务AHAS会利用探针(Agent)从您的系统中采集所需的信息,包括以下两种Agent:应用可用探针(即AHAS Agent):这是安装在操作系统上的独立进程,用来采集架构信息。使用架构感知、故障演练功能前需安装此探针。应用...

通过RAM用户分权管理集群

修改RAM用户的控制台权限 默认情况下,RAM用户具有弹性性能计算控制台的所有页面的访问权限,控制台左侧导航栏将显示全部功能菜单项。修改RAM用户的控制台权限功能可以控制RAM用户访问弹性性能计算控制台时,左侧导航栏的菜单项显示。...

使用可视化演练

运行环境 可选择 机器负载、内存消耗、磁盘无剩余空间 或 磁盘读写过 场景。服务依赖 可选择 本地服务丢失、本地服务延迟、调用下游服务丢失 或 调用下游服务延迟 场景。设置自动恢复时间。单击 执行演练。当演练进行时,您可在图示...

管理队列

登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,选择 资源管理>节点与队列。在 集群 列表中选择目标集群。在 节点类型 列表中选择计算节点。按照需要进行以下操作。创建新的队列 单击打开 队列 下拉列表,然后...

容灾演练断网方式说明

可用区断网不会影响SLB或RDS等高可用实例的心跳检查,无法自动触发相关可用实例的主备切换功能。安全组断网 安全组断网是一种借助阿里云专有网络安全组技术实现的轻量级且精细化的断网方式,可以针对用户的ECS、Redis及RDS实例进行断网...

修复集群

操作步骤 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,单击 集群。在 集群 页面,选择待修复集群,单击 更多>修复。在弹出的 集群修复 页面,重新指定待修复集群的 镜像类型、镜像、调度器 和 域账号服务。...

查看作业结果

操作步骤 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,选择 作业与性能管理>作业。单击目标作业列表右侧 详情,可以查看作业详细信息。查看作业性能指标。在左侧导航栏,选择 作业 与性能 管理>E-HPC优化器...

自适应流控

背景信息 系统支持开启自适应流控或手动设置系统规则:自适应流控:当开启自适应流控,系统会根据CPU使用率动态调节应用的入口流量,在尽可能保证吞吐量的同时保证负载下系统稳定。系统规则:当关闭自适应流控,需要您手动设置系统规则。...

性能基准

本文列出了 AHAS 应用流控降级在特定 CPU、OS、Java 版本的测试环境下的基准表现。测试环境 基准的测试环境:CPU:Intel(R)Xeon(R)CPU ...8 线程循环执行:内存占用约 1 GB(若系统持续并发持续很,将导致底层的 LongAdder 内存占用很)。

创建作业

操作步骤 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在 集群 页面,找到gromacs-test集群,单击 远程连接。在 远程连接 页面,输入gmx.test的用户名、密码和节点端口,单击 ssh连接。下载并解压算例。说明 本算例为模拟...

配置流控规则

配置流控规则的原理是监控应用或服务流量的QPS指标,当指标达到设定的阈值时立即拦截流量,避免应用被瞬时的流量高峰冲垮,从而保障应用可用性。本文介绍如何设置Nginx应用的流控规则。前提条件 将Nginx接入流量防护 请求分组管理 操作...

监控作业

操作步骤 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,选择 作业与性能管理>作业。在 作业 页面,选择目标集群,单击 作业监控 页签。设置筛选条件。支持设置的筛选条件如下:时间段:过滤某一时间段内的...

服务包

服务包用于抵扣E-HPC服务费,如果您的...在 弹性性能计算控制台 的 服务包 页面,找到目标服务包,单击 升级。在 变配 页面,根据需要选择要升级的规格或者购买时长。阅读并选中服务协议,然后单击 去支付。按页面提示完成后续支付操作。

削峰填谷

当消费端请求骤增时,可以为其配置排队等待的流控规则,以稳定的速度逐步处理这些请求,起到削峰填谷的效果,从而避免流量骤增造成系统负载过。背景信息 在实际应用中,收到的请求是没有规律的。例如:某应用的处理请求的能力是每秒10个...

什么是容器报警演练

报警演练功能概述 Kubernetes集群的自动报警功能是保障Kubernetes集群可用的重要功能之一。当集群的API Server监测到特定事件,报警模块会通过邮件、短信等方式通知用户处理。AHAS容器演练中的监控报警验证功能通过模拟事件触发,验证...

虚拟机场景

一般用于验证业务系统在并发且系统性能下降的情况下,是否能够通过限流、快速扩容等手段保证业务连续性。参数说明如下:参数名称 是否必选 默认值 参数说明 进程ID 必选其一 无 Java进程的ID。进程关键字 无 用于识别唯一的关键字,可以...

可用版

云时序数据库InfluxDB®的产品系列包括基础版和可用版,本文介绍可用版的相关信息。可用版是适用性较广的云数据库系列。采用Raft三节点的可用架构,适合80%以上的用户场景,包括互联网基础资源监控,容器监控,业务运营监控分析,...

监控存储资源

登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,选择 资源管理>共享存储。在 共享存储 页面,选择目标集群,单击 资源 监控 页签。在 资源监控 页签下,设置并查看存储资源的相关监控数据。配置项 说明 文件...

【通知】流量防护功能模块退市公告

由于业务及技术架构调整,阿里云将于2025年01月05日正式下线应用可用服务AHAS下的流量防护功能模块。核心的多活容灾(Multi-Site High Availability,简称MSHA)功能模块将持续发展,并提供云上业务的多活建设和演练保鲜,以提升业务稳定...

管理作业模板

登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,选择 作业 与性能 管理>作业。在 作业 页面,选择待创建作业模板的集群。单击页面左侧的 提交作业 页签。在 提交作业 区域,完成作业参数配置,单击 图标将当前...

接入ECS

AHAS架构感知和故障演练支持在ECS上一键安装应用可用探针。安装成功后,您可以直观地查看应用对基础架构的依赖关系,组件间的依赖关系,以及对应用进行故障演练。本文介绍如何快速接入ECS。前提条件 确保待安装探针的ECS系统为Linux或...

配置集群流控规则

集群小流量流控:某些可用防护场景下需要将服务调用QPS限制到很小的量,此时平均到每台机器的QPS可能小于1,无法通过单机流控进行精确控制。例如希望限制总QPS为50,但节点数有100个。有业务含义的流量控制:例如限制某个API每个用户每...

通过控制台提交作业

作业指提交到E-HPC集群进行性能计算的基本工作单元,包括Shell脚本、可执行文件等,具体作业执行顺序根据您设置的队列以及调度器决定。E-HPC管理控制台提供了作业相关的提交作业、停止作业、查看作业状态等功能,本文介绍如何使用E-HPC...

查看集群报表

操作步骤 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,选择 作业与性能管理>报表。在顶部下拉列表中,选择目标集群。查看报表。查看集群节点数量。节点数量展示集群中节点数量的变化折线图,支持显示各队列...

什么是消息演练

这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现,急需通过故障演练来评测可用性。AHAS提供了强大且灵活度的故障演练功能,可以根据不同的场景注入对应的故障类型。为了使您的演练服务更便捷,...

授权信息

本文为您介绍 弹性性能计算(Ehpc)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。弹性性能计算(Ehpc)的RAM代码(RamCode)为 ehpc,支持的授权粒度为 OPERATION。权限策略通用结构 权限策略支持JSON...

多活架构介绍

MSHA提供三种容灾架构解决方案,包括同城多活、异地双活以及异地应用双活。本文介绍各解决方案的架构特点,并...建设成本略,但容灾能力最强。推荐企业选取核心业务来建设。建设成本中等,具备地域级容灾能力。推荐企业选取核心业务来建设。

将Nginx接入流量防护

Nginx是一款性能开源的HTTP服务器,可通过Nginx Sentinel模块快速接入到AHAS中。当有请求流量时,您可以在AHAS控制台中查看Nginx网关请求的实时QPS和RT等数据。本文介绍如何将Nginx接入流量防护。接入流量防护 登录 AHAS控制台,然后在...

事件中心

在事件中心页面,主要展示了各个防护事件的详细信息,包括级别、类型、起始时间等。操作步骤 登录 AHAS控制台,然后在页面左上角选择地域。在控制台左侧导航栏中选择 流量防护>应用防护。在 应用防护 页面的 应用卡片 页签单击目标应用卡片...

更新ehpcutil版本

操作步骤 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,单击 集群。在 集群 页面,找到目标集群,单击 详情。在 集群详情 页面底部的 ehpcutil版本信息 区域,根据需要进行升级或者回退操作。如果当前...

查看E-HPC操作日志

操作步骤 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,选择 运维与监控>操作日志。在 集群 列表中选择目标集群。根据需要设置查询条件,单击 图标。查询条件说明如下:查询条件 说明 时间范围 快速选择:可...

系统防护

在下游应用不可靠,应用响应时间很长,从而导致负载很的场景中,若下游应用恢复时,应用响应时间也会随之减短,此时通过率理应会大幅度增大。但由于此时负载仍然很,所以通过率的恢复慢。为解决上述问题,AHAS应用流控降级在系统自适应...

自动伸缩最佳实践

本文以使用LAMMPS软件进行性能计算介绍如何配置自动伸缩策略。背景信息 当您需要每天不定时提交作业,使用E-HPC集群几个小时进行大规模计算,然后释放节点,您可以针对不同的作业类型,配置不同的伸缩策略。配置伸缩策略后,系统可以根据...

MSHA基础常见问题

MSHA组件化程度较,且支持企业级和开源的组件。用户有以下策略可选择:管控面使用MSHA能力,数据面流量入口使用MSHA,数据面应用层相关组件自建。管控面使用MSHA能力,数据面流量入口和数据库使用MSHA,数据面应用层相关组件自建。管控面...

开源Sentinel与商业化AHAS流量防护对比

有限的支持(内存存储5分钟)Top N接口统计 支持 不支持 业务异常监控、详情查询 支持 不支持 历史监控查询 支持 不支持 机器水位热力图 支持 不支持 业务场景流量大盘 支持 不支持 规则实时推送 秒级生效,实时可靠。HTTP方式推送,不可靠...

登录集群

规则方向 授权策略 端口范围 优先级 授权对象 入方向 允许 SSH(22)1 0.0.0.0/0 通过控制台登录 登录 弹性性能计算控制台。在顶部菜单栏左上角处,选择地域。在左侧导航栏,单击 集群。在 集群 页面,找到要登录的集群,单击 远程连接。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 DDoS防护 云数据库 Redis 版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用