远程桌面无法连接到Windows实例的快速排查方法

在实例中使用ping命令测试与客户端的连通性,提示“一般故障”的错误,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤六:检查CPU负载、带宽及内存使用情况 确认是否存在CPU负载过高的情况,如果存在,则参考本步骤解决...

基于ack-lingjun-aiast组件实现集群自动化运维

组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能,当发生故障或异常时,灵骏AI助手的告警系统可以自动和PAI进行交互,并上报故障信息,并根据故障触发阶段和并行策略选择规避故障的方法,自动隔离故障节点,并通过checkpoint快速...

网络诊断

工作原理 拓扑构建:在提供诊断信息后,网络诊断会根据所提供的信息,以及集群中所收集到的资源信息(例如Pod、Node、Service、NetworkPolicy等),去构建本次诊断的访问拓扑图。信息采集:网络诊断采集运行时信息、网络协议栈信息以及网络...

数据血缘

元数据采集完成,您可以在数据总览页面查看当前地域下,配置了数据采集器的Hologres数据库统计信息和表信息,详情请参见 数据总览。如果需要查找表,可参见 通用数据查询与管理。查看血缘详情。查找到目标表,您可以单击目标表名称进入...

无法连接Windows实例

说明 本文档可能包含第三方产品信息,该信息仅供参考。阿里云对第三方产品的性能、可靠性以及操作可能带来的潜在影响,不做任何暗示或其他形式的承诺。问题描述 用户无法连接Windows实例。问题原因 无法连接Windows实例的原因较多,不同的...

网络设备监控指南

通过 编辑 对设备基础信息进行维护,等后期具备snmp采集后,也可以对单台设备通过 自动补全 来完善资源信息。添加单台网络设备 1.在控制台左侧菜单击 资源管理>设备资源管理>设备资源 2.点击“新增”进行单台设备的添加。3.如果网络设备...

用户窃电识别

例如通过采集电量异常、负荷异常、终端报警、主站报警及线损异常等信息监测窃漏电情况及计量装置故障,或根据报警事件发生前后客户计量点电流、电压及负荷数据情况,构建基于指标加权的用电异常分析模型,从而检查用户是否窃电或计量装置...

如何查看Logtail采集错误信息

您在使用Logtail采集日志时,可能遇到正则解析失败、文件路径不正确、流量超过Shard服务能力等错误。日志服务控制台提供诊断功能,支持诊断Logtail采集错误。操作步骤 登录 日志服务控制台。在Project列表区域,单击目标Project。在 日志...

云数据库 RDS MySQL 版收集表的统计信息

概述 本文介绍云数据库 RDS MySQL 版如何收集表的统计信息。详细信息 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改...

通信监测

视频帧率 显示发送端视频采集和接收端接收帧率和卡顿情况,采集帧率不稳定,接收端看到的画面就会卡顿。视频分辨率 显示用户发送和接收视频的分辨率。音频采集音量 显示本地采集和接收来自发送端的音频的音量大小。查看频道数据 频道数据由...

设计方案

建议通过以下途径实现故障的快速发现:统一告警:在发现故障后,需要将相关信息及时告知相关人员,包括系统管理员、运维人员等。可以通过短信、邮件、钉钉等方式进行告警,确保所有相关人员第一时间得知故障情况,以便快速组织应急响应。...

调用链采样配置最佳实践

例如电商系统中,商品详情和购买流程的业务逻辑是比查询或编辑用户信息的优先级高,对于这类业务逻辑对应的端接口,是需要被优先采集以便确保重要的、难以快速复现的链路故障能够被立刻分析和解决。所以这类接口对应的调用链采样率建议...

关停或启动网站站点

网站完成维护或者故障排查,需要您再次启动网站站点,确保网站恢复正常运行。本文为您介绍关停或启动网站站点的方法。背景信息 网站的运行状态包括 运行中 和的 已停止 两种状态。运行中:表示站点正常运行中,网站页面可以正常访问。已...

上下文查询

通过查看指定日志的上下文信息,您可以在业务故障排查中快速查找相关故障信息,方便定位问题。应用场景 例如,O2O外卖网站在服务器上的程序日志里会记录一次订单成交的轨迹:用户登录>浏览商品>选择物品>加入购物车>下单>订单支付>支付扣款...

执行演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 演练任务创建完成,您可以直接执行演练。在左侧导航栏中选择 故障演练>我的空间。在演练列表中单击目标演练任务右侧 操作 栏的 ...

FAQs

两者的对比如下表所示:对比项 网络层 端地址 加权轮询 跨Region难度 故障隔离时间 会话保持 全局流量管理 3层 域名、IP 支持 简单 分钟级 不支持 负载均衡SLB 4层、7层 IP 支持 困难 秒级 支持 全局流量管理(GTM)、云解析DNS、全局...

无法远程连接Windows实例的排查方法

在实例中使用ping命令测试与客户端的连通性,提示 一般故障 错误时,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤九:检查CPU负载、带宽及内存使用情况 无法正常远程连接Windows实例时,可能是因为CPU负载、带宽不足或...

常见问题-FAQ

重要 标准版最快可在4分钟左右准确发现故障并切换 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;全网生效时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL...

通过Service Monitor自定义采集监控指标

通过配置Service Monitor,您可以采集...禁用功能 在 Service Monitor 页面,单击 功能禁用,关闭Service Monitor能力,功能禁用,Prometheus 不再发现和采集Service暴露指标,但是已经探测到并且正在收集数据的目标(Target)将继续进行。

通过Service Monitor自定义采集监控指标

通过配置Service Monitor,您可以采集...禁用功能 在 Service Monitor 页面,单击 功能禁用,关闭Service Monitor能力,功能禁用,Prometheus 不再发现和采集Service暴露指标,但是已经探测到并且正在收集数据的目标(Target)将继续进行。

什么是云网管

银泰商业集团:云网管的统一网络管控平台打破了传统零售连锁型百货网络运维的物理界限,给远程无人自动化运维带来了可能,为新零售场景下的商场管理提供了低成本、高人效的信息化建设模型。菜鸟:CMN自动化运维管控能力和菜鸟行业特色威胁...

查看事件与监控信息

故障列表 故障列表显示当前应用分组正在报警的全部资源,如果正在报警的规则被禁用,则故障列表中不再显示被禁用规则的故障信息。可用性监控 查看服务实例可用性的监控信息。组进程监控 查看组进行监控的进程ID、动态规则匹配和状态等信息...

使用前须知

阿里云智能接入网关联合日志服务提供流日志功能,用于记录智能接入网关的传入和传出流量信息,帮助您监控网络流量和排查网络故障。本文介绍流日志功能相关的资产、费用以及使用限制等信息。简介 流日志捕获的流量信息以日志形式写入日志...

通用性能

背景信息 系统在运维监控领域实现全部指标分钟级采集、上报、分析和展示;在网络巡检和配置领域设计实现了用户逻辑和设备逻辑的区分,全部使用开放式模板由人工自定义,加快了网络业务配置落地的速度,平均新业务编写上线只需2周时间即可...

使用前须知

阿里云全球加速服务联合日志服务提供访问日志功能,用于记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。本文介绍全球加速访问日志功能相关的资产、费用以及使用限制等信息。简介 您可以为全球加速实例的一个...

通信监测

视频帧率 显示发送端视频采集和接收端接收帧率和卡顿情况,采集帧率不稳定,接收端看到的画面就会卡顿。视频分辨率 显示用户发送和接收视频的分辨率。音频采集音量 显示本地采集和接收来自发送端的音频的音量大小。信号强度 显示信号的衰减...

采集部署

本文介绍了采集部署的流程。1.预检查 确保collector部署在没有线上应用的独立服务器上。确保已配置JAVA_HOME,JDK版本1.6+。2.启动 Unix系统,在collector目录下执行:`./run.sh` Windows系统,在collector目录下执行:`start/b java-jar ...

通过Logtail跨阿里云账号采集日志

否则在机器组中会显示服务器心跳失败,导致Logtail无法采集日志到日志服务。例如某电商公司拥有两个电商应用,部署在阿里云杭州地域的ECS集群上,并使用杭州地域的日志服务进行日志管理。应用A部署在阿里云账号A(12*456)下的ECS集群...

替换主机

您可以在 计划内事件 中查看本次故障信息。影响 执行替换主机操作会有如下影响:系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例迁到可用的新主机上。操作步骤 登录 云数据库专属集群控制台。在页面左上角,...

分区热力图

采集的原始分区总数量超过1600时会对分区统计信息进行合并(不会对原分区造成影响,只合并热力统计信息),仅当被合并分区属于同一DN节点且属于同一逻辑表时才能进行合并,数据量越小的分区合并范围越大,当合并的总分区数仍然超过3200...

使用集群诊断

配置故障诊断 重要 使用故障诊断功能时,系统将在您的集群上执行数据采集程序并收集检查结果。采集信息包括系统版本、负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。配置Pod诊断和...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

分区热力图

采集的原始分区总数量超过1600时会对分区统计信息进行合并(不会对原分区造成影响,只合并热力统计信息),仅当被合并分区属于同一DN节点且属于同一逻辑表时才能进行合并,数据量越小的分区合并范围越大,当合并的总分区数仍然超过3200...

跨地域容灾

故障切换完成,单击 故障切换/故障恢复信息 下的链接,检查数据和应用。如果检查发现当前时间点应用运行正常,选择 更多>故障切换>确认故障切换。说明 在故障切换或者切换恢复点完成,并且已经确认被容灾保护的服务器恢复出的应用已经...

使用云监控功能监控网站环境(部署于ECS实例)

前提条件 在开始设置云监控前,您需要完成以下操作:检查ECS监控插件运行情况,确保监控信息能够正常采集。如果安装失败则需要手动安装插件,具体操作,请参见 云监控插件安装指南。提前添加报警联系人和联系组,建议设置至少2人以上的联系...

替换主机

您可以在 计划内事件 中查看本次故障信息。影响 系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例迁到可用的新主机上。在主机替换时,可能会有1~2次闪断,为避免对业务的影响,建议选择 在实例维护时间段切换。...

数据地图概述

在 数据发现 页面通过 元数据采集器 将其他数据源中的元数据采集至DataWorks数据地图,采集完成,您可以在数据地图搜索并查看各数据源的元数据信息。除MaxCompute以外,目前数据地图支持的其他数据源类型有:E-MapReduce、Hologres、CDH ...

使用可信实例

说明 如果在 可信信息 页签下显示 设备处于未度量状态,表示可信实例长时间未上报有效度量结果,这时云安全中心控制台也不会展示详细的可信信息。关于如何处理未度量情况,请参见 处理未度量状态。PCR即平台配置寄存器(Platform ...

重启设备

网络故障时,重启设备可消除部分软件故障。背景信息 重启设备一般有两种方法:通过关闭或打开设备电源进行重启。通过智能接入网关控制台,远程重启设备。关闭或打开设备电源 警告 您通过关闭或打开设备电源进行重启时,请注意保存设备的...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
日志服务 视频点播 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用