故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

功能更新记录

本文介绍故障演练Chaos历次发布涉及的功能变更,帮助您了解故障演练的发布动态。2021年10月 功能名称 功能概述 支持资源包类型 支持地域 发布时间 微服务强弱依赖支持Dubbo 在应用强弱依赖治理的基础上,微服务强弱依赖治理功能,通过接入...

WAF产品托管服务

提供故障处理、CC防护规则、精准访问控制规则、数据风控等WAF防护配置建议。监控和预警 系统自动化监控WAF集群可用性故障。系统自动化监控安全高危事件和攻击导致的异常事件。人工在线判断和过滤监控事件预警。安全报告 根据用户要求提供...

服务管控和治理

服务治理 服务治理包含服务限流、服务路由、服务鉴权、服务熔断、故障注入、故障隔离、透明劫持、服务拓扑和实时监控相关服务治理。服务限流 在高并发场景下,为保证在现有资源条件下服务正常运行,您可以使用服务限流让请求和并发在应用可...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

高级模板支持的AE功能及插件

将VE Super Pattern添加到您的图层上,便可以使用多达种预设图形来制作图案纹理,或者直接使用一个图层的内容作为图案样式。VE Super Pattern还提供了高级的图案排列、变换参数,供您对图案内容进行调整,制作出精彩的图案运动或者转场...

配置DDoS高防后访问网站提示502错误

网络出现拥塞或抖动 在已经排除以上两种原因后,偶发的局部网络抖动、运营商线路故障等因素,也可能导致502错误。相关文档 常见问题概览 配置DDoS高防后访问网站提示504错误 适用于 DDoS高防 如果您的问题仍未解决,您可以在阿里云社区 ...

目标追踪规则

弹性伸缩的目标追踪规则是弹性伸缩服务与云监控深度结合的产物,定义了更加稳定、精准、快速的弹性伸缩策略,可以解决当前伸缩组动态调整过程存在的一些难点和问题(例如用户流量突增或硬件出现故障等突发事件),能快速实现伸缩组的自动扩...

设备详情

事件管理 输入事件标识符,查看该设备上报的事件记录,包括信息、告警、故障三种类型。服务调用 输入服务标识符,查看云端下发给设备的远程指令,包括属性设置(set)和服务调用的记录。设备影子 查看或更新该设备的设备影子。设备影子是...

如何解决MSE Nacos实例域名无法解析的问题?

应用节点所配置的DNS服务器或NameServer故障,特别是Kubernetes集群所依赖的CoreDNS故障,导致无法解析MSE域名。解决方案 方案一:使用dig命令 执行如下命令安装dig工具。yum install-y bind-utils 如下代码所示,使用 dig 命令,尝试解析...

【通知】故障演练功能模块退市公告

由于业务及技术架构调整,阿里云将于2024年05月01日起停止应用高可用服务AHAS下的故障演练功能模块的技术支持,并于2024年11月01日正式下线该模块,但飞天企业版的应用高可用服务AHAS的故障演练CHAOS模块将持续发展。此外,应用高可用服务...

故障排查

本文介绍阿里云容器服务ACK集群在使用过程中常见问题的故障分析和排查流程。ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes...

基于MSE云原生网关实现同城多活

在同城多活的场景下,能够确保对跨可用区的多个业务集群的请求实现高效负载均衡分配,在单个可用区内的业务集群发生故障时,可在1秒内完成故障节点的自动摘除从而实现故障转移,有效的保障服务连续性和高可用性。容灾概述 目前云上容灾主要...

日期时间格式化指令

ANSI C标准规定了解析或者格式化日期时间字符串的指令。当前支持的指令完全兼容C标准(1989版本),具体示例及注释如下。指令 含义 示例 注释%a 工作日的缩写。Mon,.,Fri 当前以en-US为展示,暂不支持其他locale。A 工作日的全拼。Monday...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

通用参考

where `_line_`='20' 新旧值保留与覆盖 在SPL指令执行过程中,其输出的目标字段与输入数据中已有字段重名时,该字段的取值策略如下:重要 字段值保留与覆盖策略与extend指令无关,extend指令的重名字段取值策略为直接使用新值。新旧值类型...

2024-03-13版本

当单个可用区发生故障时,Flink作业能够在另外一个可用区正常运行,从而有效避免因单个可用区故障导致服务中断,确保作业的持续性和高可用性。同城高可用 开通实时计算Flink版 资源调整 管理项目空间 修改虚拟交换机 算子探查(公测)支持...

Hive巡检项及服务关键指标说明

如果使用率小于90%,则内存调整目前不是特别紧急,可继续观察或根据需要调整。HiveServer重启次数巡检项(inspection_hive_server_restart)在五分钟内出现多次重启,则报P0异常,必须马上检查HiveServer进程及日志情况,排除问题。在五...

产品优势

复杂场景的全可视化编排,支持登录态共享、参数传递、业务断言,同时可扩展的指令功能支持多形态的思考时间、流量蓄洪等。支持RPS并发多压测模式。流量支持动态秒级调整,百万QPS亦可瞬时脉冲。强大的报表功能,将压测客户端的实时数据做多...

测试数据通信

本文介绍如何测试DTU代替设备上报数据到物联网平台和接收物联网平台下发的数据。测试上报数据 打开串口调试工具。...接收到的数据中,55为数据头,数据值为64(即十进制的100)。云端和设备端均能接收到正确数据,说明配置成功。

图生文指令使用说明

交互式命令行目前支持输入2种类型的指令,通过这2个指令可以灵活干预文本生成的各个环节。本文为您介绍图生文模板交互式命令行的使用方式。情景描述指令 对于图片情景的描述,您可能有不同的诉求,比如对于一些复杂的图片您可能只需要描述...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,会向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

租户内存使用率告警

处理方法 查看租户的写入量监控,如果发现内存告警期间同时写入量突然增大,那么需要根据业务场景来调整租户的内存规格,如果集群内存资源已经分配满了,可以考虑对集群规格进行扩容。如果是集群转储功能出现问题引起的内存暴涨,请联系...

使用说明

本文介绍将业务程序与远程登录程序进行进程隔离,以保证设备在故障时可以进行远程运维。背景信息 设备基于物联网平台的消息通信能力开展业务,由于不同设备业务的复杂性,以及业务需要定期变更升级,导致设备的业务程序容易出现故障,导致...

管理容器组(Pod)

故障诊断 在容器组列表页面,您可以单击目标容器组右侧的 操作 列的 诊断,对该容器组进行故障诊断。更多信息,请参见 使用集群诊断。设置容器的CPU和内存资源上下限 应用创建完成后,您可以根据业务需求调整容器的CPU和内存资源上下限,...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

最佳实践

本文使用垂直堆叠柱状图、区域图、基本散点图、环图、通用标题5种图表组件,使用美化工具箱内的一键美化和智能主题功能,再结合工具栏内的滤镜配置功能,快速调整一个可视化应用的样式风格效果。操作步骤 登录 DataV控制台。在 我的可视化 ...

地域及可用区

可用区之间故障隔离,可以避免故障扩散,保证业务的连续性。说明 大型灾害或者大型电力故障除外。注意事项 创建阿里云实时计算Flink版时,选择的地域和可用区,在资源创建成功后,无法更改。不同地域资源的开放情况会根据实际业务使用情况...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

使用示例

步骤三:设备主动请求配置消息 如果物联网平台下发远程配置指令时,设备不在线,但设备上线后,可主动请求获取远程配置的指令消息。说明 如果物联网平台未创建设备任务,调用接口后,返回 revice task get detail reply,task_id:[$next],...

蓝牙BLE基础规范

其他指令-为满足业务需求定义的其他指令,分为以下两种:建立连接的指令集,参见 连接建立指令集 空中升级(OTA)定义了相关的指令集,参见 OTA指令集 说明 设备主动上报、Request-Response模型指令为通用指令,Payload格式不做限制,使用...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

通用性能

系统指标 指标详细 维度 能力 说明 系统部署 Agent自动注册 按规模可选择Agent集群式入网,高可用执行分钟级故障切换 系统性能 自动化峰值调用性能:100/分钟 自动化任务下发 并发调用性能:100台设备并行配置 系统稳定 系统动态扩容能力:...

流水单据型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下:下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...

混合云应用双活容灾最佳实践

说明 演练前,基于MSHA流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况RT≤200ms,错误率),以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。步骤二:应用故障注入 这里使用阿里云故障演练产品,对...

如何处理健康检查导致的大量日志

方案风险说明 延长健康检查的间隔时间后,后端ECS实例出现故障时,负载均衡发现故障ECS实例的时间也会变长。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到相应的CLB实例,单击实例ID。在 监听 页签下,找到目标监听,在 ...

一键美化

一键美化功能示例 一键美化前 一键美化选择(整体样式)后的默认状态 调整(将区域范围-X从100px调整为163px)参数后的状态 调整(将区域范围-Y从100px调整为159px)参数后的状态 调整(将吸附范围-X从100px调整为116px)参数后的状态 调整...

集群高可用架构推荐配置

节点池高可用配置 您可以基于节点的弹性伸缩、部署集、多AZ,结合K8s调度的拓扑分布约束,确保服务在不同的故障域(failure-domain)资源充足且有所隔离,从而当某一故障域出现问题时,服务仍然可以保持运行,减少单点故障的风险,提高系统...
共有148条 < 1 2 3 4 ... 148 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用