性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

应用场景

电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析。设备通过工业接口协议将自身状态数据和生产业务数据接入工业设备网关,然后通过 MQTT 协议发送到物联网平台...

监控分析平台对比

运维成本:各系统的软硬件难免会出故障,硬件替换、缩扩容、软件版本升级,都需要投入不小的人力和精力。费用分摊:只有将资源消耗清晰准确地分摊到实际业务线中,才能更有效利用资源,制定合理的预算和规划。这也需要监控分析平台能提供...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

产品优势

服务运维 故障实时上报,无需等待用户反馈,快速响应,主动防范风险。依赖于用户的故障上报,服务商被动响应故障。用户订阅服务后,计算巢自动完成服务商与用户之间的授权,服务商运维操作时,无需交换登录凭证,自动授权鉴权,无需手动...

事件分析概述

微服务领域:微服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致微服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很多时候不得不跳过某些正常服务来调试单个请求。事件总线...

ECS容灾常见问题

ECS容灾中云盘异步复制和连续复制型容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

ECS容灾常见问题

ECS容灾中云盘异步复制和连续复制型容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含...

什么是应用监控

多维调用链分析 通过ARMS应用监控提供的调用链分析工具,您可以自由组合筛选条件与聚合维度对调用链进行实时分析,轻松应对查看耗时大于指定时间的慢调用时序分布,查看错误请求在不同机器上的分布,查看VIP客户的流量变化等典型的线上问题...

什么是应用实时监控服务ARMS?

应用实时监控服务(Application Real-Time Monitoring Service)作为一款云原生可观测产品平台,包含应用监控、前端监控、Prometheus监控、云拨测、Grafana服务、告警管理等一系列子产品。其覆盖浏览器、小程序、APP、分布式应用、容器等...

云盘异步复制容灾常见问题

ECS容灾中云盘异步复制容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含entry和autoPL)...

监控指标说明

常见问题的指标表现如下。场景 详情 作业中某些算子存在反压 判断反压最直接的方式是使用Flink UI提供的反压检查功能,而不是通过指标判断。反压的存在会导致Source端数据发送至下游算子的速率下降,您可能会观察到sourceIdleTime周期性...

功能特性

防护配置 入侵防御 漏洞防护 失陷感知 日志分析 提供7天日志审计功能,便于您进行事件回溯、故障排查等。支持审计的日志类型 事件日志:记录经过云防火墙的流量匹配到访问控制策略的事件情况。支持查看流量的时间、威胁类型、源IP、目的IP...

均衡分片(Rebalance)

使用限制 仅Hologres V2.0.21及以上版本支持Reblance函数,如果您的实例是 V2.0.21以下版本,请您 使用 自助升级 或加入实时数仓Hologres交流群申请升级实例,详情请参见 如何获取更多的在线支持?命令语法 不同类型实例触发均衡切片操作的...

支持计划

4.7大客户专属服务(顶级)故障应急:针对云上故障提供快速响应、组织应急及实时止血技术方案同步能力。关键时刻保障:针对重要业务上线、业务变更等关键场景提供应急保障服务。业务监控设计:在重要活动及日常保障过程中协助客户设计云上...

常见问题

本文介绍在使用图数据库GDB过程中的常见问题。产品介绍 问:什么是图数据库GDB?答:GDB是Graph Database的简写。GDB是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache ...

常见问题

本文列举了阿里云 表格存储 的常见问题,帮助您快速了解 表格存储。一般性常见问题 什么是 表格存储?表格存储 面向海量结构化数据提供Serverless表存储服务,同时针对物联网场景深度优化提供一站式的IoTstore解决方案。适用于海量账单、IM...

实时数仓Hologres

背景信息 实时数仓Hologres 是一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,支持标准SQL(兼容PostgreSQL协议),支持PB级数据多维分析(OLAP)与即席分析(Ad Hoc),支持高并发低延迟的在线数据服务(Serving),...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

自动或手动主备切换

临时关闭主备自动切换 自动切换默认为开启,主实例出现故障会自动切换到备实例,在遇到如下情形时您可以选择临时关闭主备自动切换:大促活动等,不希望主备切换影响系统可用性。重要应用系统升级等,不希望主备切换引进其他变数。重大事件...

管理主备切换

临时关闭主备自动切换 自动切换默认为开启,主实例出现故障会自动切换到备实例,在遇到如下情形时您可以选择临时关闭主备自动切换:大促活动等,不希望主备切换影响系统可用性。重要应用系统升级等,不希望主备切换引进其他变数。重大事件...

产品架构

TSCompute 是负责时序数据实时计算的组件,重点解决监控领域常见的降采样转换和时间线聚合需求,通过Lindorm Stream进行数据订阅,并完全基于内存计算,所以,整体非常的轻量、高效,适合系统已预置的计算功能。针对部分灵活复杂的分析需求...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障(内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

事件告警概览

故障排查:通过审计日志和告警来分析系统故障或性能问题的原因。功能特性 实时检测事件:当您设置告警规则后,操作审计将实时检测云上异常事件,快速发现风险。支持设置告警规则:操作审计内置关于账号安全、权限管理、资源管理等多条告警...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

创建操作系统迁移任务

导入迁移源信息后,SMC控制台会自动生成迁移源记录,您需要在控制台为迁移源创建操作系统...常见问题及修复方案的更多信息,请参见 操作系统迁移故障(Linux)和 操作系统迁移故障(Windows)。SMC提供多种技术支持渠道,请参见 联系我们。

PTS压测快速入门

演练阶段:在演练排查阶段,您需要对系统进行故障演练,进而发现并验证系统问题,锻炼系统及相关人员的应急能力,阿里云提供了 故障演练 平台帮助您演练预案。更多信息,请参见 什么是故障演练。容灾阶段:在容灾防护阶段,您需要构建系统...

实时同步能力说明

DataWorks为您提供的实时数据同步功能,方便您使用单表或整库同步方式,将源端数据库中部分或全部表的数据变化实时同步至目标数据库中,实现目标库实时保持和源库的数据对应。...常见问题 实时同步任务常见问题请参见 实时同步常见问题。

专家成长计划技术培训课程

1天 30人 全面介绍磁盘的基础知识,Linux和Windows操作系统的磁盘分区和文件系统结构,以及关键扇区的含义和作用,查看和编译磁盘结构的主要工具,例如Linux系统下的fdisk,并重点针对常见的磁盘故障进行了场景化的分析,介绍相应的恢复...

查看实例的系统日志和屏幕截图

但是ECS缓存了实例最近一次启动、重启或者关机时的系统日志,并且支持实时获取实例屏幕截图。您可以利用这些功能分析排查实例故障,例如诊断操作系统无响应、异常重启或者无法连接实例等。前提条件 实例必须处于 运行中(Running)状态才能...

线下系统调研问答汇总

本文总结了线下系统调研常见的问题和解决方案。IDC调研 连通性测试 请在工具服务器上运行如下命令,打印远端机器的日期来尝试连通性 sshpass-p '密码' ssh-p 端口 账号@ip地址 'date' 如果出现"host key changed"报错,则表示您需要远程...

故障管理

系统软件故障:包括操作系统死机、数据库的各类故障。硬件故障:包括硬盘、网卡损坏。相关设备故障:包括UPS失效引起的电力中断。自然灾害,包括洪水、火灾、地震。这里以阿里集团为例。为降低故障的影响,阿里集团故障管理体系从整体体系...

作业状态集管理

系统检查点(Checkpoint)和作业快照(Savepoint)统称为状态集。...相关文档 实时计算Flink版系统检查点或作业快照相关的常见问题,请参见 系统检查点或作业快照。SQL修改所造成的兼容性影响详情,请参见 SQL修改及兼容性。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储 CPFS 云安全中心 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用