可观测性的设计原则

监控系统的指标可以让组织了解系统的健康状况和性能情况,以便在系统出现异常时快速发现问题。监控指标可以通过监控工具来实现,并允许在发生异常时发送警报。有很多监控工具可以使用,例如Prometheus、Grafana、Zabbix等,以及阿里云提供...

挂载命令参数设置类问题

什么情况会引发网络切换或者后端服务的HA倒换?为什么需要重新挂载?还有没有其他的方案?其他问题 在控制台使用一键挂载功能时,挂载参数怎么填写?我的业务场景需要变更默认挂载参数,应该怎么操作?为什么要使用noresvport参数挂载NAS?...

计费常见问题

包括通用型NAS资源包如何使用或抵扣、NAS服务如何停止计费、购买资源包为什么还欠费等问题。开通NAS服务后,就开始计费吗?仅开通NAS服务,不会产生费用。当您在通用型NAS中写入文件数据产生实际存储容量,则开始计费;当您创建极速型NAS...

公共模板

有些情况可能导致系统盘损伤,比如实例被强制地停止或重启,抑或突然发生了宕机,以及数据盘被卸载后未更新/etc/fstab,甚至于/etc/fstab或initrd文件丢失或损坏。当无法访问实例时,该实例在ECS实例控制台显示的状态可能还是运行中,但...

前端监控场景

主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。业务痛点 定位性能瓶颈困难 当用户反馈页面...

路由表概述

创建 专有网络 VPC 后,系统会自动为您创建一张系统路由表并为其添加系统路由来管理 VPC 的流量。系统路由表不能创建和删除,但您可以在系统路由表中创建自定义路由条目,将指定目标网段的流量路由至指定的目的地。路由表 系统路由表 创建...

配置自动调优

自适应策略:应用该策略后,系统会根据实时作业资源和指标信息动态修改资源配置,更加关注当前作业的延时和资源使用情况,并根据相关指标的变化更快速地优化资源适配。这样做可以使系统更加敏锐地响应作业需求,提高资源配置的效率和适应性...

当实例无法启动时扩容云盘

当Linux实例无法启动时,实例健康诊断工具诊断实例云盘的inode使用率或者空间使用率过高。此时,您可以通过实例健康诊断工具进行问题修复。前提条件 ECS实例已通过实例健康诊断工具诊断出云盘的inode使用率或空间使用率过高的问题。ECS...

什么是调用链

调用链是指在分布式系统中,由多个服务相互调用形成的一系列调用关系。每当一个服务调用另一个服务时,就会形成一个调用链。调用链可以显示服务之间的调用顺序和层次关系,帮助开发人员理解和追踪代码的执行流程。调用链的作用 在分布式...

监控分析平台对比

稳定性保障 依赖系统:数据在多套系统中流转,系统之间又存在依赖关系,当某系统出现问题时,对其他系统造成影响。例如下游ES系统写入变慢后,用于缓存数据的Kafka集群存储水位变高,可能导致集群写满。Burst问题:在互联网环境下,流量...

支持计划-服务报告

3.1.3阿里云  按照月度提供服务报告,根据用户提供信息及云产品使用情况提供对应技术服务支持,给出问题分析及解决方案。 按照年度提供服务报告,根据过去一年的相关稳定性事件,根据阿里云可用保障体系,对客户IT系统高可用架构进行...

智能基线概述

保障任务在承诺时间前运行完成 您可以将任务添加至基线上,并设置基线承诺时间,当系统预测到基线上任务无法在承诺时间前完成,或上游任务有出错或变慢的情况,将发送报警信息,您可以根据报警信息及时处理问题,保障任务在承诺时间前运行...

查看服务器信息

当您创建服务器后,可以通过管理控制台查看服务器的资源配置、到期时间、资源使用情况等详细信息。本文介绍如何通过管理控制台查看服务器的相关信息,并提供示例操作供您参考。背景信息 在管理控制台的不同界面,查看到的服务器信息也有所...

漏洞修复失败原因排查

出现此种情况,可能是因为在检漏洞后,您手动更改了操作系统类型,导致服务器现有操作系统类型和当前漏洞检的操作系统类型不匹配。解决方案 您可以在云安全中心控制台手动忽略该漏洞,或等待漏洞自动失效。具体操作,请参见 查看和处理...

诊断VPN网关实例

如上图所示,系统诊断SSL服务端使用UDP协议建立SSL-VPN连接,可能会存在不可靠连接占用连接数的情况导致客户端连接失败,您可以根据诊断建议修改SSL服务端的协议为 TCP 以避免该问题。修改配置后,对VPN网关实例再次发起诊断,确保VPN...

测试分析及调优

通过这些分析及一些与系统相关的问题,可以对系统瓶颈有更深入的了解,进而分析真正的原因。确定调整目标和解决方案 高系统吞吐量,缩短响应时间,更好地支持并发。测试解决方案 对通过解决方案调优后的系统进行基准测试。(基准测试是指...

Windows挂载NFS协议的通用型NAS文件系统

由于Windows系统对NFS协议的兼容程度较低,建议仅在需要跨操作系统共享数据的情况下使用Windows系统挂载NFS协议文件系统。本文主要介绍如何将NFS协议文件系统挂载至云服务器ECS(Windows)上并执行读写操作。前提条件 已创建NFS协议的通用...

修复实例操作系统无法启动问题的操作指南

实例健康诊断功能支持对实例无法启动问题进行自助诊断排查,您可以通过健康诊断了解实例无法启动的具体原因,并在挂载修复盘的情况下启动并登录实例,修复实例原来操作系统中导致无法启动的相关配置。您可以通过本文了解修复盘的操作说明,...

分析业务过程

数据在什么情况下会更新,更新逻辑是什么。业务过程可以是单个业务事件(例如交易的支付、退款),也可以是某个事件的状态(例如当前的账户余额),还可以是一系列相关业务事件组成的业务过程。具体取决于您分析的是某些事件过去的发生情况...

Windows实例中数据恢复

在处理磁盘相关问题时,您可能会碰到操作系统中数据盘分区丢失的情况。本文介绍了Windows系统下常见的数据盘分区丢失的问题以及对应的处理方法,同时提供了使用云盘的常见误区以及最佳实践,避免可能的数据丢失风险。前提条件 已注册阿里云...

Tracer DRM 开关

动态配置项 默认情况下,Tracer 会生成各种网络中间件调用的详细日志和统计日志。由于 Tracer 的日志生成是异步的,所以 Tracer 对性能的影响很小。但是,对于特殊需要,Tracer 提供了动态配置开关用于关闭中间件的 digest 日志。Tracer 的...

可运维性咨询服务内容说明

乙方专家团队通过对甲方应用系统和云平台的调研,评估系统动态限流、异常隔离、依赖降级、热点防控、功能开关等高可用防护能力建设情况,选择并设计基于阿里云产品的高可用防护整体解决方案。故障演练。乙方专家团队通过对甲方应用系统和云...

动态条形图

动态条形图可以动态地展示随着时间播放的TOP条数。本文为您介绍如何为动态条形图添加数据并配置样式。前提条件 已创建仪表板,请参见 新建仪表板。图表概述 使用场景 多用于一段时间的数据变化,并用播放的形式展现对比;例如:一段时间...

系统防护

系统防护即从整体维度对应用入口流量进行控制,结合应用的Load、总体平均RT、入口QPS和线程数等几个维度的监控指标,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。背景信息 长期以来...

配置资源规整忽略特定容器

一般情况下,容器内指定的vCPU和内存为容器资源上限,实际运行实例时,系统动态调整资源分配。因此对于实例内一些不影响业务的特定容器,您可以通过设置环境变量_ECI_RESOURCE_IGNORE_:TRUE 的方式,实现实例资源规整时忽略这些容器,...

动态分区

本文介绍 云数据库 SelectDB 版 动态分区相关的概念和示例,帮助您进行分区的动态管理,降低您的使用成本。概述 在某些场景下,可能会将数据库表按照天进行分区划分。如果需要手动管理分区,可能由于没有创建分区导致数据导入失败,这给...

出现OOM Killer的原因及解决方案

如果内存回收机制不能处理系统内存不足的情况,则系统会触发OOM Killer(Out of Memory Killer)强制释放进程占用的内存,达到给系统解压的目的。本文介绍Alibaba Cloud Linux操作系统出现OOM Killer的可能原因及解决方案。问题现象 ...

弹性伸缩

弹性伸缩(Auto Scaling)是指系统根据实际需求动态调整资源(例如计算资源、存储资源、带宽等),以满足不同负载情况下的业务需求。通过弹性伸缩,系统能够在高峰期自动增加资源,在低峰期自动释放资源,提高系统的稳定性和性能。弹性伸缩...

出错提示“Command 'yum-y distro-sync' returned non...

本文主要介绍在Linux操作系统迁移时,迁移任务出错提示“Command 'yum-y distro-sync' returned non-zero”信息时的问题描述、问题原因及其解决方案。问题描述 在使用SMC操作系统迁移时,迁移任务出错提示“Command 'yum-y distro-sync' ...

基线监控概述

系统预测到基线上任务无法在保障产出时间前完成,或上游节点任务有出错或变慢的情况时,将发送告警信息,您可以根据告警信息及时处理问题,保障任务在 保障产出时间 前运行完成。关键路径与关键实例识别:基线上需要保障的任务,其依赖...

基线监控概述

系统预测到基线上任务无法在保障产出时间前完成,或上游节点任务有出错或变慢的情况时,将发送告警信息,您可以根据告警信息及时处理问题,保障任务在 保障产出时间 前运行完成。关键路径与关键实例识别:基线上需要保障的任务,其依赖...

出错提示“Multiple devel kernels installed”

问题描述 在操作系统迁移时,出错提示“Multiple devel kernels installed”。问题原因 kernel-devel是用做内核一般开发的,比如编写内核模块,原则上可以不需要内核的源代码。这个包提供了足以根据内核包构建模块的内核头文件和makefile,...

新功能发布记录

2023-10-18 创建云手机 管理镜像 初始化和更换操作系统 2023年09月 功能名称 功能描述 发布时间 相关文档 支持安装EdXposed 在云手机中可通过Magisk安装EdXposed,可以在不修改系统文件的情况下实现对云手机的Android系统进行深入定制,...

测试与验证

在 PTS 平台上,您可以用较低的人力和资源成本,构造接近真实业务场景的复杂交互式流量,快速衡量系统的业务性能状况,为性能问题定位、容量配比、全链路压测的流量构造提供帮助,进而提升用户体验,促进业务发展,实现企业的商业价值。...

监控数据与计量数据

最后云监控系统计算每15分钟所有采集点的平均值。控制台上展示的监控流量数据是最终计算的平均值。账单计量数据是按照同样粒度采集的,然后负载均衡系统将每小时的累加值上报给账单计量系统,用于账单结算。账单数据是计费周期内的累加值...

全景监控

例如,当指标出问题时,加工这个指标的全局链路上,涉及系统的接入、数据的加工、API的转换、系统中的算法加工,到最终指标的呈现,到底哪个链路出问题需要立即定位。系统需向各方应用提供统一接入标准,实现全局监控和问题快速锁定。通过...

功能简介

例如,当指标出问题时,加工这个指标的全局链路上,涉及系统的接入、数据的加工、API的转换、系统中的算法加工,到最终指标的呈现,到底哪个链路出问题需要立即定位。系统需向各方应用提供统一接入标准,实现全局监控和问题快速锁定。通过...

常见问题

磁盘/CPU/内存/带宽问题 Windows实例负载的查询及分析 Linux实例CPU负载的查询和案例分析 如何配置Windows实例的虚拟内存 入网带宽和网带宽 Linux实例网络流量负载情况的查询和案例分析 Linux实例中如何查看物理CPU和内存信息 Linux实例...

功能简介

例如,当指标出问题时,加工这个指标的全局链路上,涉及系统的接入、数据的加工、API的转换、系统中的算法加工,到最终指标的呈现,到底哪个链路出问题需要立即定位。系统需向各方应用提供统一接入标准,实现全局监控和问题快速锁定。通过...

创建和管理IPsec连接(单隧道模式)

IPsec连接绑定的实例不同,DPD功能、NAT穿越功能、BGP动态路由功能和健康检查功能的默认支持情况不同,具体如下:在创建IPsec连接过程中,如果IPsec连接绑定转发路由器实例,则IPsec连接默认支持DPD功能、NAT穿越功能、BGP动态路由功能和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 负载均衡 商标服务 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用