诊断规则

通过故障诊断平台,运维人员可以将诊断过程、排查顺序进行图形化编排与设计,即故障诊断决策树。而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现...

监控、诊断故障排除

所以产生高E2E延时、低服务器延时可能的原因有两个:客户端应用程序响应慢 可用连接数或可用线程数有限 对于可用连接数问题,可以使用相关命令确定系统是否存在大量TIME_WAIT状态的连接。如果是,可以通过调整内核参数解决。对于可用线程数...

产品动态

2020-05 全部 什么是阿里云CDN CDN支持外链改写功能,解决IPv6“天窗”问题 当网页包含其它网站内容的链接(外链),即使采取双栈技术路线,全面升级网络和修改程序,但被引用的其它网站升级,IPv6用户访问该网站时会出现响应缓慢,部分...

什么是高可用管理平台

事前:通过应用巡检、故障诊断以及和监控平台的联动,实现应用运行风险的主动发现。事中:通过故障诊断、应急预案、容灾切换实现风险事件快速定位和恢复。事后:通过风险定级、回溯,实现风险事件的闭环管理。有效提升 IT 技术风险防御水平...

产品架构

日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发故障诊断、应急预案等。运行总览集中展示整个平台的运行状态、风险情况。部署架构 HAS 部署时,需要依赖以下底层服务:数据库 ...

应用诊断

应用诊断是对应用的单独故障诊断,可以由链路诊断触发或人工触发。高可用管理平台通过应用诊断初步定位问题,锁定可疑应用,再通过 Arthas 和线程分析进一步确认问题。目前,应用诊断支持用户应用和蚂蚁应用。应用诊断是故障诊断的原子能力...

产品优势

自动化故障诊断和标准化应急预案快速定位并恢复故障,减少因故障引起的业务中断时间。故障演练主动检验应用高可用能力。支持蚂蚁产品双中心容灾切换,满足监管合规需求。技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

诊断指标与诊断结果条目说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断指标,并提供了详细的诊断范围及建议操作供您参考。基本...

数据安全最佳实践

禁止创建磁盘加密的RDS实例 通过为RAM用户配置RAM权限策略,防止该用户创建磁盘没有加密的RDS实例。操作详情请参见 通过RAM权限策略限制RAM用户权限。数据库账号授权 RDS可以根据生产环境的业务需求,授权数据库账号管理数据库。您可以...

统计分析

支持查看近7天、近30天、最近180天内自定义时间下全部服务组的事件总数、MTTA(总)、MTTR(总)、MTTA(当日)、MTTR(当日)、升级事件数、未响应升级事件数、未完结升级事件数的天维度的整体趋势;查看当前租户下整体的事件情况及完成...

如何配置升级策略

根据服务的需求,对未响应和未完结单独配置升级策略:若只想对未响应的事件加强升级通知,仅设置事件未响应的升级策略即可;同理未完结场景。重要 单个升级条件下的升级策略最多可以设置10条。编辑/启用/禁用/删除升级策略 编辑:升级策略...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

设置HTTP头

参数 说明 Content-Type 指定客户程序响应对象的内容类型。Cache-Control 指定客户程序请求和响应遵循的缓存机制。Content-Disposition 指定客户程序响应对象时激活文件下载设置默认的文件名。Content-Language 指定客户程序响应对象的语言...

风险识别规则

针对全局级别的扩展程序,即扩展程序开启后会对所有工作空间生效的这类扩展程序,如果指定空间配置该扩展程序响应策略,将默认通过,不阻塞流程。以操作名称为 数据下载前置事件 的扩展程序为例,如果处理该事件的扩展程序为开启状态,...

诊断节点

在左侧导航栏上,单击 故障诊断>诊断节点。单击 新建,在 新建节点 页面,配置新节点的信息,包括节点名称、描述,选择节点类型、超时时间及标签。为该诊断节点绑定巡检规则,否则节点将无法执行。单击节点右侧 操作 列下的 详情 按钮。在...

扩展程序审批策略

针对全局级别的扩展程序,即扩展程序开启后会对所有工作空间生效的这类扩展程序,如果指定空间 配置该扩展程序响应策略,将默认通过,不阻塞流程。以操作名称为数据下载前置事件的扩展程序为例,如果处理该事件的扩展程序为开启状态,...

自治服务概述

云数据库 OceanBase 的自治服务是一款面向开发、运维、DBA 的一站式智能诊断自治服务,为用户提供可视化监控、性能优化、故障诊断、安全管理、容量管理等能力,帮助用户更简单、更低成本、更高性能的使用 OceanBase 数据库。背景信息 传统...

应用场景

同时不断更新优化日常巡检、故障诊断、应急预案等内容的建设,不断丰富和完善应用技术风险防控体系,简化日常应用运维操作。故障演练 为不断提升产品高可用能力,通过高可用管理平台的故障演练模块,设计并规划演练计划和恢复方案,继而在...

配置HTTP消息头

参数 描述 示例 Content-Type 指定客户端程序响应对象的内容类型。image Cache-Control 指定客户端程序请求和响应遵循的缓存机制。no-cache Content-Disposition 指定客户端程序把请求所得的内容存为一个文件时提供的默认的文件名。123.txt...

Pod诊断

重要 使用故障诊断功能时,系统将在您的集群执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 Pod诊断...

Pod诊断

重要 使用故障诊断功能时,系统将在您的集群执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 ...

支持计划-服务报告

服务范围不包含:代码开发 不在附录列表的第三方软件配置指导以及故障排查 所有第三方软件的安装、补丁更新、测试、故障诊断、优化等日常运维服务 注:对于不在阿里云服务范围内的第三方软件问题,客户可登录阿里云社区获取免费咨询,或...

请求通过CDN回源后正常启用Gzip压缩

启用CDN后 请求头含有 Accept-Encoding:gzip,deflate,但响应头返回的是 Content-Length,并未响应 Content-Encoding:gzip。问题原因 源站Nginx服务器中Gzip相关配置错误,CDN的回源请求未启用Gzip压缩功能,详情如下:客户端请求经过CDN...

事件告警被收敛的问题

本文介绍告警被收敛导致用户不能及时收到通知的问题及解决方案。用户场景 基于流转规则产生事件后,...可通过配置升级策略,将长时间未响应或未完结的事件进行故障升级,并及时处理。如果需要接收所有报警通知,可通过流转规选择"报警"模式。

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

故障诊断

用户可定义诊断规则来快速帮助定位问题并给出诊断建议。当集群内资源符合某些特征时,给出预置的解决方案,从而快速帮助运维人员解决问题。诊断建议将会被展示在ADP-Local上,也可以通过获取CR的...请重新运行此诊断程序获取新的命令进行执行

客户端版本发布记录

2.0.4 2022-05-30 支持在登录情况下进行故障诊断。支持DNS切换功能。修复部分问题。1.0.0 2020-10-22 首个版本发布。macOS 发布版本 发布时间 功能描述 3.3.1 2023-07-12 应用诊断展示源站IP。用户体验优化。安全性提升。客户端错误弹窗...

功能特性

查看同域流量分析 网络监测与诊断 帮助用户在云上运维阶段更高效地监测网络业务变化和故障诊断排查。功能集 功能 功能描述 参考文档 事件中心 问题事件 展示已经造成业务受损,并且7天内状态一直处于进行中的异常事件列表。查看问题事件 ...

自助诊断GPU节点问题

启用节点诊断 您可以在故障诊断中选择待诊断的GPU节点发起节点诊断,并根据诊断报告修复问题。登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 巡检和诊断>故障诊断。在 ...

请求处理程序(Handler)

您可以使用Node.js请求处理程序响应接收到的事件并执行相应的业务逻辑。本文介绍Node.js请求处理程序的相关概念、结构特点和示例。什么是请求处理程序 FC 函数的请求处理程序,是函数代码中处理请求的方法。当您的 FC 函数被调用时,函数...

实时请求trace

当业务请求耗时较长时,您可以通过该功能定位问题所在,方便进一步进行故障诊断和问题分析并及时发现安全漏洞。前提条件 已登录目标实例的集群管理系统,具体操作请参见 登录集群管理系统。操作步骤 在集群管理系统的左侧导航栏,选择 诊断...

常见问题

故障诊断时,执行诊断功能 3 分钟,随后自动切回到正常运行状态。Node.js 性能平台运行时提供了哪些额外的功能 Node.js 虚拟机 V8 的运行时内存状态监控;libuv 运行时状态监控;在线故障诊断功能:堆快照、CPU Profile、GC Trace 等。...

自定义HTTP响应

examplefile.txt Content-Type 指定客户端程序响应对象的内容类型。支持文本、图片、音频、视频、文件等。image Pragma Pragma HTTP 1.0是用于实现特定指令的响应头,具有通过请求和响应链实现各种效果的功能,可用于兼容HTTP 1.1。no-...

网络诊断

重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。前提条件 已创建ACK...

DescribeDiagnosticReports-查询资源诊断报告列表

取值范围:Unknown:初始状态,表示开始诊断或者诊断过程程序异常退出,无诊断结论。Normal:诊断正常,没有发现问题。Info:有关联信息,可能与异常相关。Warn:有关联信息,可能导致异常。Critical:有关键异常。Normal NextToken ...

DescribeDiagnosticReportAttributes-查询资源诊断详情

所有指标中最严重的等级,严重等级由轻到重如下:Unknown:初始状态,表示开始诊断或者诊断过程程序异常退出,无诊断结论。Normal:诊断正常,没有发现问题。Info:有关联信息,可能与异常相关。Warn:有关联信息,可能导致异常。...

开启和管理健康检查

如果在响应超时时间(3秒)之内,全球加速实例收到终端节点返回的RST数据包,则认为终端节点未响应健康检查端口,判定健康检查失败。如果已超出响应超时时间(3秒),全球加速实例还未收到终端节点返回的SYN+ACK数据包,则认为网络无法到达...

配置节点HTTP响应

examplefile.txt Content-Type 指定客户端程序响应对象的内容类型。text/plain Pragma Pragma 是一个在 HTTP/1.0 中规定的通用首部,这个首部通常用于在服务器的响应中定义客户端对文件的缓存行为。no-cache Access-Control-Allow-Origin ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云安全中心 数据库审计 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用