核心优势

高可用超性价比 HBase增强版对MTTR(平均故障恢复时间)做了深度的优化和改进,故障恢复速度可以达到HBase的10倍以上。并且其基于日志即存储思想和PACELC理论构建的分区多副本复制架构,可以提供多种数据一致性等级,方便应用在一致性、...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间故障原因分析:建议先一句话总结,再进行...

流利说

生产故障平均恢复时间大幅缩短。智能化压测,让容量评估有的放矢。客户感言 数据库自治服务DAS帮助流利说更专业、更高效地使用数据库服务。DAS的AI数据库优化引擎让DBA的工作压力大幅降低的同时也成倍提高了线上问题的处理效率,真正实现了...

视频截图

截图间隔时间(秒)多张截图时必选 在文本框中输入截图间隔时间,单位为秒。截图数量 平均截图时必选 在文本框中输入截图数量。说明 不设置截图数量时,表示按照间隔时间,一直截取到视频结尾。截图数量大于1时,表示按照间隔时间,截取到...

指标监控及报警的使用方法

平均每秒钟Item上传失败的个数(所有上传命令都计数)Behavior推送失败速率 Count/Second 1分钟 平均每秒钟Behavior上传失败的个数(所有上传命令都计数)行为数据平均延迟 秒 1分钟 行为数据的bhv_time和上传时间间隔平均值;...

系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

查询故障时间线列表

查询故障时间线列表 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/...

时延洞察

您可以通过该功能排查 Tair 数据库的故障和性能降低的原因。功能简介 原生Redis在2.8.13版引入时延监控(Latency Monitoring)特性,基于事件机制帮助您发现和排查可能的时延问题。该功能仅支持获取最近160秒的数据,且只存取每秒内时延...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

时延洞察

在排查Redis数据库实例的故障和性能降低的原因时,您可以通过时延洞察功能,对数据库所有命令以及自定义特殊事件进行时延统计,得到精确到微秒级别的延迟时间,从事件、时间、时延三个维度对实例进行分析,快速定位和修复故障。前提条件 ...

更新故障时间线

更新故障时间线。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/...

运维事件中心的审计事件

运维事件中心已与操作审计...CreateProblemTimeline 创建故障时间线节点。CreateProblemTimelines 批量创建时间节点。CreateRichText 创建富文本。CreateRouteRule 创建流转规则。CreateService 创建服务。CreateServiceGroup 创建服务组。...

创建故障时间线节点

创建故障时间线节点。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST...

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

云盘三副本技术

重要 如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要您采用备份或者快照等技术手段来解决。任何技术都不可能解决全部问题,因地制宜地选择合适的数据保护措施,才能为您的业务数据筑起一道坚实的防线。更多...

捷顺

本文介绍数据库自治服务DAS助力...客户感言“阿里云DAS服务帮助捷顺科技对数十个数据库实例进行异常监测、自动限流、自动优化、自动弹性扩缩容,大幅降低了数据库运维成本和故障时间,大幅提高了系统的可用性。——捷顺科技总工&运维负责人。

故障注入

超时时间 故障类型为 超时异常 时,设置异常的超时时间。异常比例 设置注入异常流量的比例。例如设置为 80,则只注入 80%的异常流量。流量精确匹配(可选)设置流量的匹配条件,满足匹配条件的流量才会使用故障注入规则。置空此项时表示...

专线连接类

排查物理专线故障原因,具体操作,请参见 故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备上测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

查看智能洞察事件列表

智能洞察详情 应用服务整体平均响应时间突增 应用服务整体平均响应时间突增 类型的事件详情页面显示了事件发生时间点、根因分析和故障传播链。在智能洞察详情页面,您可以执行以下操作:单击 根因分析 区域的疑似根因链接,在疑似根因面板...

常见问题-FAQ

全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、以及在不同的测试时间,全网生效测试结果会发生变化。重要 标准版最快可在4分钟左右准确发现故障并切换...

健康检查

如延长健康检查的间隔时间,后端服务器出现故障时,ALB 发现故障后端服务器的时间也会变长。方式二:通过服务器组详情页 登录 应用型负载均衡ALB控制台。在顶部菜单栏处,选择后端服务器组所属的地域。在左侧导航栏,选择 应用型负载均衡...

自治服务(CloudDBA)

您可以通过该功能排查Redis数据库的故障和性能降低的原因。开启自动扩容 当内存平均使用率达到阈值后会自动升级Redis实例的规格,帮助您快速弹性适配业务高峰,避免内存溢出的风险,有效保障线上业务稳定性。基于预测自动弹性伸缩 以实例...

归档存储服务等级协议

(2)不可用时间=故障解决时间-故障开始时间,不可用时间按分钟计算;(3)如果用户没有使用到24小时,按实际使用时长计算平均每分钟费用。3.其他 阿里云有权根据变化适时对本服务等级协议部分服务指标 作出调整,并及时在阿里云官网...

消费重试

重试间隔时间 无序消息(非顺序消息):重试间隔为阶梯时间,具体时间如下:第几次重试 重试间隔时间 第几次重试 重试间隔时间 1 10秒 9 7分钟 2 30秒 10 8分钟 3 1分钟 11 9分钟 4 2分钟 12 10分钟 5 3分钟 13 20分钟 6 4分钟 14 30分钟 7...

基于多集群实现跨地域容灾和流量负载均衡

服务网格 ASM为应用服务提供了跨地域流量分布和跨地域故障转移能力。跨地域流量分布功能可以将流量按照设定的权重路由至多个集群,实现多地域负载均衡。跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨...

基于多集群实现跨地域容灾和流量负载均衡

服务网格 ASM为应用服务提供了跨地域流量分布和跨地域故障转移能力。跨地域流量分布功能可以将流量按照设定的权重路由至多个集群,实现多地域负载均衡。跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨...

创建和管理服务器组

若延长健康检查的间隔时间,后端服务器出现故障时,NLB 发现故障后端服务器的时间也会变长。移除后端服务器 您可以根据业务需要移除服务器组中的后端服务器。警告 如果直接在服务器组中移除后端服务器,可能会造成业务中断,建议您先将后端...

设计方案

灰度发布需注意:灰度间隔时间:合理设定灰度间隔时间,不宜过长。过长的灰度间隔时间可能导致下游应用出现数据不一致等问题。灰度发布方式:合理选择灰度发布方式,可按用户、按区域、按渠道等方式进行灰度,避免出现灰度过程中用户体验不...

NotifyStrategy

策略 描述 参数 退避重试 重试3次,每次重试的间隔时间是10秒到20秒之间的随机值。BACKOFF_RETRY 指数衰减重试 重试176次,每次重试的间隔时间指数递增至512秒,总计重试时间为1天。每次重试的具体间隔为:1,2,4,8,16,32,64,128,...

如何处理健康检查导致的大量日志

方案风险说明 延长健康检查的间隔时间后,后端ECS实例出现故障时,负载均衡发现故障ECS实例的时间也会变长。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到相应的CLB实例,单击实例ID。在 监听 页签下,找到目标监听,在 ...

注意要点

设置自动恢复间隔时间,单位:毫秒。factory.setNetworkRecoveryInterval(5000);加密传输 本示例使用默认的非加密端口5672,如果使用加密传输,需要连接5671端口,并设置 com.rabbitmq.client.ConnectionFactory 的SslProtocol。private ...

系统检查点或作业快照

配置间隔时间为3,最小间隔时间为5,这种情况下,间隔时间会调整为5。以两个场景进行说明,两个场景Checkpoint间隔时间为3分钟,超时时间为10分钟,最小间隔时间为5分钟。场景一:作业正常运行(Checkpoint每次都成功)12:00第一次开始执行...

消息重试

配置对应Group ID的消息重试间隔时间为3000毫秒,重试间隔时间为字符串类型。properties.put(PropertyKeyConst.suspendTimeMillis,"3000");Consumer consumer=ONSFactory.createConsumer(properties);重要 配置采用覆盖的方式生效,即最后...

查看监控中心

指标名称 描述 查询计算资源(CU/s)当前时间间隔内,应用平均每秒查询数据消耗的CU。查询速率(次/s)应用内所有索引,平均每秒查询的总响应请求数。查询响应时间(ms)应用内所有索引的平均查询响应时间。写入计算资源(CU/s)当前时间间隔...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 文件存储 CPFS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用