云端运行日志

通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...

Windows系统ECS实例激活失败

查看IP安全策略,详情请参见 服务器ping外网提示一般故障处理方法 中查看是否设置了 IP 安全策略章节。查看是否有其它安全软件对kms.cloud.aliyuncs.com的1688 TCP端口的访问做了拦截。执行 route print 命令查看服务器内部的路由是否正常...

修改域名DNS解析设置

通过CNAME接入方式将域名添加到 Web应用防火墙(Web Application Firewall,简称WAF),您需要将域名的DNS解析指向WAF提供的CNAME地址,才可以使域名的Web请求解析到WAF进行安全防护。本文介绍如何修改域名DNS解析设置。背景信息 WAF仅...

修改域名DNS解析设置

在 Web应用防火墙(Web Application Firewall,简称WAF)添加网站域名,您必须使用WAF的CNAME地址修改域名的DNS解析设置,将网站的Web请求解析到WAF进行安全防护。本文介绍了修改域名DNS的相关内容。背景信息 WAF仅支持使用 CNAME记录,...

什么是云拨测

故障定位与诊断:云拨测利用先进的Traceroute诊断技术,快速发现并定位网络故障,提供详细的故障报告和解决建议。实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,数据库、MQ等中间件异常事件),以及集成各业务自建的定位工具能力,并在故障及风险预警的应急过程中进行可疑原因定位,帮助促进故障及风险预警初因定位的时长缩短。...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

远程桌面无法连接到Windows实例的快速排查方法

在实例中使用ping命令测试与客户端的连通性,提示“一般故障”的错误,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤六:检查CPU负载、带宽及内存使用情况 确认是否存在CPU负载过高的情况,如果存在,则参考本步骤解决...

混沌工程缓存实战系列-Redis

由于要观测演练前和故障注入系统的业务情况,因此除了故障注入节点之外,还需要增加业务探活的节点。故障演练提供了类似K8s的探活功能,可以通过访问指定接口来判断业务是否可用。参数配置说明如下:参数 描述 示例值 failureThreshold ...

基本概念

故障管理 网络故障的发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

无法远程连接Windows实例的排查方法

在实例中使用ping命令测试与客户端的连通性,提示 一般故障 错误时,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤九:检查CPU负载、带宽及内存使用情况 无法正常远程连接Windows实例时,可能是因为CPU负载、带宽不足或...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

附录:SOFAStack 产品目录

业务日志关联查询 自定义配置应用系统的业务日志,自动关联业务报错和摘要信息,快速定位问题及跟踪业务信息。应用场景 问题的分析和快速定位 在分布式场景下,服务调用错综复杂,问题分析与定位非常困难。分布式链路跟踪系统能迅速定位到...

设备使用物模型通信

您可在物联网平台控制台的 云端运行日志 页签,复制目标Topic消息的 messageID 或 traceID,追踪对应消息在物联网平台流转的全路径,快速定位故障。详细信息,请参见 消息轨迹。物模型数据存储 设备上报的物模型数据默认会自动写入时序数据...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

概览

可以结合业务场景进行网络故障的定界定位、网络质量的优化以及与其他云产品联动。应用场景 全局用户网络质量概览 通过网络质量分析器,您可以了解分布在全球不同地域及运营商的终端用户访问您服务端的网络质量情况;了解不同地域及运营商到...

CLB健康检查FAQ

您在使用CLB的过程中如果遇到健康检查相关的问题,您可参考本文进行定位及处理。健康检查的原理是什么?推荐的健康检查配置是什么?是否可以关闭健康检查?TCP监听如何选择健康检查方式?ECS实例权重设置为零对健康检查有什么影响?HTTP...

数据服务

数据服务模块为您展示平台可提供的全量数据表和API等内容(指标和标签模块待上线)。您可根据需求申请所需数据表和API的权限,用于您应用的开发、展示或分析。数据服务界面如下图所示,界面上方为搜索栏,您可进行数据表和接口的快速搜索...

使用Topic通信

定义Topic,设备可以通过Topic与物联网平台通信,从而实现设备、物联网平台业务服务器、其他云产品之间的通信。前提条件 使用物模型Topic通信,需要先 添加物模型。使用自定义Topic通信,需要先定义产品Topic类,具体步骤请参见 使用...

概述

通过技术手段干预变更的整个生命周期,在变更前进行准入检测,变更中约束渐进式的执行过程,并通过宏观的观测手段验证变更的阶段结果,及时发现问题进行回滚止血,同时在变更,通过影响面的拓扑提供变更数据的应用,辅助故障定位和问题...

畅捷通

畅捷通通过日志服务的异常预测函数,从海量指标中快速定位异常,将有问题的地方显示出来,快速发现系统故障。畅捷通通过日志服务将各块汇集过来的数据进行标记,与应用的配置信息进行关联和整合,通过时序发现故障的根因,从而可以实现...

ADP底座技术白皮书

本文从技术角度,阐述ADP底座的整体架构、非功能特性、运维信息,更好更全面地帮助客户理解ADP底座的核心能力,以便更好地被业务集成。技术架构 应用架构 应用部署架构将云原生运行时环境分为业务产品和ADP底座两层,图中阐述了每一层的...

应用容灾

微服务:业务流量在机房内部和跨机房的同步调用方式,一般有 Consumer、Provider、注册中心等角色,具备流量路由、流量保护、故障隔离三个核心能力。消息:业务流量在机房内部和跨机房的异步调用方式,基于消息削峰填谷,一般有 Producer、...

主机健康诊断

说明 如果您的主机底座k8s-launcher版本不存在,则界面显示立即升级,请按照界面指引进行升级再进行健康诊断。诊断完成,单击 查看报告 查看诊断结果,并根据提示诊断结果和建议进行问题修复。系统配置诊断 诊断项 说明 内核参数检测 ...

监控分析平台对比

本文从运维和SRE团队角度介绍监控分析平台的建设与选择。背景信息 运维和SRE团队承载着重要的职责,其工作内容复杂而广泛,从应用部署、性能和可用性监控、告警、值班,到容量规划、业务支撑等都有涉及。随着云原生、容器化和微服务的快速...

MQ订阅消息

消息定义 消息体 字段 类型 说明 EventCatgory String 事件分类,取值范围:"DEVICE":设备事件"BIZ":业务事件 Event String 事件说明:"DEVICE_OFFLINE":设备下线"DEVICE_PROPERTY":设备属性变更"BIZ_REFRESH_DELAY":显示延迟"BIZ_...

CDN回源时网站出现5xx报错的排查方法

问题描述 当您使用阿里云CDN加速站点访问资源,客户端的请求将首先发送到CDN的L1节点(一级节点),再回源到L2节点(二级节点),然后再回源到源站。因此如果访问过程中出现问题,可能涉及到多级网络链路的问题。当CDN回源源站异常失败时...

业务接入高防存在卡顿、延迟、访问不通等问题

问题描述 业务接入DDoS高防,用户访问业务时存在异常卡顿、延迟、访问不通等问题。问题原因 遇到这类问题时,需要您收集受影响的访问地址,并通过Traceroute或MTR等工具进行链路测试,如下所示,定位是哪个节点的问题。说明 本小节以MTR...

测试指标

对于互联网业务中,如果某些业务有且仅有一个请求连接,那么TPS=QPS=HPS,一般情况下用TPS来衡量整个业务流程,用QPS来衡量接口查询次数,用HPS来表示对服务器单击请求。标准 无论TPS、QPS、HPS,此指标是衡量系统处理能力非常重要的指标,...

测试与验证

在 PTS 平台上,您可以用较低的人力和资源成本,构造出接近真实业务场景的复杂交互式流量,快速衡量系统的业务性能状况,为性能问题定位、容量配比、全链路压测的流量构造提供帮助,进而提升用户体验,促进业务发展,实现企业的商业价值。...

域名检测工具

答:如果您的域名已过期,过期进行续费,一般续费成功需要24-48小时可恢复使用,期间无加速生效的方法,建议您在域名过期前完成续费。(b)域名已经续费,为什么域名检测工具仍然显示域名已过期?答:域名检测模块是调用whois进行查询...

调用链采样配置最佳实践

对于绝大多数分布式系统,不是每一条调用链都值得被可观测平台记录,因为其中包含大量重复、低关注度信息。调整采样是目前解决这类问题最高效且主流的方式,但具体配置什么样的采样策略,能够在可控的资源开销和费用成本内,最大程度保证错...

使用须知

节点网络 单一边缘节点到同一运营商的同省或邻省监测节点的平均ping丢包率⩽1%,新疆和西藏地区另行约定。节点资源 边缘节点存储支持本地盘和高效云盘,不同节点存在差异。本地盘来自单台宿主机,数据可靠性取决于宿主机的可靠性,存在单点...

工作原理

背景信息 服务运行过程中会产生各种各样的时序数据,通过监控这些时序数据是否存在异常(例如监控KPI指标异常突变),及时获知服务运行是否异常,异常时可以及时进行故障定位与恢复。时序数据往往是由多个维度的时序数据聚合而成的。下探...

系统类故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

基本概念

[回到顶部]H HAS 高可用管理平台(High Availability Service,HAS)是以容灾为主的高可用管控平台产品,可实现容灾方案的端到端整体能力,从客户业务到中间件、PaaS以及IaaS整体的容灾切换及恢复,容灾规划,容灾模拟演练等能力,并包含...

功能说明

2.地址归属区域 指应用服务器地址的地理位置信息,地址池中用户输入地址,GTM会自动定位应用服务地址的地理位置信息,用户也可以通过 订正 按钮,对应用服务地址的地理位置进行变更。说明 若地址池类型为域名,则须要用户手动进行地址...

DNS解析异常问题排查

索引 类别 内容 诊断流程 基本概念 异常诊断流程 常见客户端报错 排查思路 排查思路 常见排查方法 检查业务Pod的DNS配置 检查CoreDNS Pod运行状态 检查CoreDNS运行日志 检查CoreDNS DNS查询请求日志 检查CoreDNS Pod的网络连通性 检查业务...

DNS解析异常问题排查

索引 类别 内容 诊断流程 基本概念 异常诊断流程 常见客户端报错 排查思路 排查思路 常见排查方法 检查业务Pod的DNS配置 检查CoreDNS Pod运行状态 检查CoreDNS运行日志 检查CoreDNS DNS查询请求日志 检查CoreDNS Pod的网络连通性 检查业务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 物联网无线连接服务 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用