实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

可观测性的设计原则

通过将事件和错误信息记录到日志文件或数据库中,可以方便地进行故障排除和问题诊断。但是,仅仅记录日志并不足够,还需要对日志进行有效的管理和分析。如果日志太多,将会成为一个负担,因为它们需要占用存储空间,并且需要花费很长时间来...

事件分析概述

链路追踪:提供事件轨迹能力,还原事件整体链路状态,帮助您快速排除故障,定位链路问题。低成本 事件总线EventBridge 支持事件以云服务事件总线和自定义事件总线形式接入,云服务事件总线支持接入所有阿里云产品事件,无缝支持云服务事件...

Pod诊断

容器智能运维平台 提供Pod诊断功能,帮助您诊断异常的Pod信息。本文介绍Pod诊断的检查项以及对应的修复方案。容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI...

在Windows实例无法访问外部网络如何处理

您可以通过单击目标实例ID进入实例详情页面,查看ECS实例的漏洞信息、应用漏洞信息、防御信息、安全设置、安全告警处理等内容,然后针对相关告警或通知处理问题使Windows实例状态恢复正常。检查Windows实例是否与该网站所在的特定网段网络...

Pod诊断

容器智能运维平台 提供Pod诊断功能,帮助您诊断异常的Pod信息。本文介绍Pod诊断的检查项以及对应的修复方案。容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI...

Pod诊断

容器服务平台提供Pod诊断功能,帮助您诊断异常的Pod信息。本文介绍Pod诊断的检查项以及对应的修复方案。容器服务平台构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两...

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

入门指南

该入门指南帮助您配置使用运维事件中心全流程,从配置人员的个人信息到接收到系统自动触发的报警、事件、故障并自动分派流转。运维事件中心操作步骤添加 前提条件:开通阿里云企业账号,若未开通,可前往 阿里云官网 注册并开通企业账号;...

查看指定报警规则的报警历史

您可以查看指定报警规则中的所有故障资源的报警详情和报警图表,及时定位并处理资源故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择 报警服务>报警规则。在 报警规则列表 页面,单击目标报警规则对应 操作 列的 报警历史。您可以...

查看和运行SMC客户端

具体操作,请参见 故障排除。说明 如果您需要停止客户端迁移或修改客户端配置,可参考以下操作步骤退出SMC客户端。Linux Linux版本客户端默认在后台运行,可执行以下命令退出后台进程:./go2aliyun_client-abort Windows Windows版本客户端...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

什么是故障

故障追踪:支持对故障的最新进展、故障影响面(影响服务)、舆情反馈、Timeline时间线进行在线化管理、协同,基于统一视角协同处理故障,提升故障处理效率;故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上...

API概览

GetProblem 查询故障详情 ListProblems 查询故障列表 ListProblemTimeLines 查询故障时间线列表 GenerateProblemPictureLink 获取故障图片链接 GenerateProblemPictureUploadSign 故障图片上传获取签名信息 ListProblemOperations 故障动态...

使用云监控功能监控网站环境(部署于ECS实例)

设置站点监控 在云服务器外层的监控服务,站点监控主要用于模拟真实用户访问情况,实时测试业务可用性,有助于排查处理故障。如果以上监控选项不能满足您的实际业务监控需求,您可以使用自定义监控。更多信息,请参见 概览。

关停或启动网站站点

网站维护期间,或者网站受到安全威胁、恶意攻击情况下,通过关停站点可以减少潜在风险,提高网站安全性。网站完成维护或者故障排查后,需要您再次启动网站站点,确保网站恢复正常...更多信息,请参见 网站耗资源(客户程序故障)的处理方法。

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

发现并处理Redis的大Key和热Key

在使用Redis的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能引发的问题及如何快速...

通过DaemonSet方式采集Kubernetes容器文本日志

启用容器元信息预览 打开 启用容器元信息预览 后,您可以在创建Logtail配置后,查看容器元信息,包括匹配容器信息和全量容器信息。容器过滤 Logtail版本 Logtail 1.0.34以下版本,只支持通过 环境变量、容器Label 进行容器过滤。Logtail 1....

API概览

故障演练 API 标题 API概述 CreateFailoverTestJob 创建高速通道故障演练任务 调用CreateFailoverTestJob接口创建高速通道故障演练任务。StartFailoverTestJob 开始高速通道故障演练任务 调用StartFailoverTestJob接口开始高速通道故障演练...

故障处理流程

SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,查看运营商网络状态。硬件排查。查看安全组规则...

工单状态

待我处理、所有工单 列表中显示 工单ID、问题标题、工单状态、创建人、创建时间、处理人、倒计时。状态 指工单状态,包括以下状态:待响应:指用户在工单系统中提交工单后,工单系统将该工单分派到给上班的客服账号。处理中:客服正在对该...

预处理规则管理

在预处理规则管理中,您可以统一管理和查看保存的所有预处理规则信息。前提条件 在任务执行完成后,保存了由脚本产生的预处理规则。查看模型列表 登录联邦建模控制台,并在右上角的下拉框中选择需要进入的项目。单击左侧导航栏的 模型管理...

创建倍速转码任务

背景信息 媒体处理提供离线转码服务,必须获取到完整的视频文件后才可以开始转码任务,对视频文件的转码处理需要一定耗时,是一种非实时的处理服务。常见的视频转码流程如下图所示:转码耗时的影响因素 受视频时长、文件大小、转码参数复杂...

故障管理

故障追踪:支持对故障的最新进展、故障影响面(影响服务)、舆情反馈、Timeline时间线进行在线化管理、协同,基于统一视角协同处理故障,提升故障处理效率;故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上...

处理运维项

在 解决方案 页签,根据解决方案页签中的信息处理运维项。若方案类型为 手动处理,则单击 操作 列的查看按钮,查看详细的方案说明并根据说明进行处理。若方案类型为 运维编排模板,在单击 操作 列的执行按钮,并根据 方案描述 中的描述,...

新建数据处理任务

相关任务 任务 说明 查看任务详情 在 倾斜数据处理 页面,单击目标任务 操作 列的 详情,即可查看任务的基本信息处理的数据、数据坐标位置、结果数据、参数设置和任务执行状态。删除任务 在 倾斜数据处理 页面,单击目标任务 操作 列的 ...

查看应用分组

通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在 组概览 页面,您可以查看目标应用...

查看和处理告警事件

处理告警事件 登录云安全中心控制台。在控制台左上角,选择需防护资产所在的区域:中国 或 全球(不含中国)。在左侧导航栏,选择 风险治理>云蜜罐>告警事件。在 云蜜罐 页面处理告警事件。您可以根据查看的告警事件详情,选择合适的方式...

初始化

背景信息 媒体处理服务端SDK支持AccessKey方式初始化,根据授权策略获取对应权限,启用后一直有效,建议在服务端使用。前提条件 您已经安装了媒体处理服务端PHP SDK。安装方法,请参见 安装(Composer)。您已经准备好访问媒体处理服务使用...

图片处理概述

处理后的图片限制 图片的宽×高不能超过16,777,216 px。转WebP格式时,图片的宽×高不能超过16,777,216 px,且宽和高单边均不能超过16,384 px。如果原图为动图,转WebP格式时会被转为静态图片。图片处理开通与操作方法 图片处理开通与操作...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多选);进展摘要:处理人将事件升级为...

图像优化

处理后的图片限制 图片的宽×高不能超过16,777,216 px。转WebP格式时,图片的宽×高不能超过16,777,216 px,且宽和高单边均不能超过16,384 px。如果原图为动图,转WebP格式时会被转为静态图片。开启图像优化 登录 DCDN控制台。在左侧导航栏...

查看消费者状态

应用场景 消费者状态信息包括在线状态、订阅关系、消费TPS、消息堆积量和线程堆栈信息等,经常被应用于以下故障排查场景:故障场景 现象 处理建议 订阅关系不一致 在 Group 详情 页面,看到Group ID的 订阅关系 显示 订阅关系不一致,请...

数据处理与路由规则

数据处理规则列表 展示由您所创建的所有数据处理规则信息。添加数据处理规则 通过添加数据处理规则,您可以在设备数据上链之前进行预处理操作,在后续步骤的路由规则配置中可以使用这些处理规则,对数据进行进一步的脱敏和保护处理,保证您...

域名或网站无法访问如何排查?

处理方法:您需要根据系统提示,完全删除所有违法链接内的不合规信息,具体操作请参见 域名存在违法违规信息如何处理。访问域名报错,系统提示:该域名已过期,不能正常访问,续费后可恢复使用 可能原因一:域名已过期且未续费。处理方法:...

域名或网站无法访问如何排查?

处理方法:您需要根据系统提示,完全删除所有违法链接内的不合规信息,具体操作请参见 域名存在违法违规信息如何处理。访问域名报错,系统提示:该域名已过期,不能正常访问,续费后可恢复使用 可能原因一:域名已过期且未续费。处理方法:...

图像处理方法及优势

处理后的图片限制 图片的宽×高不能超过16,777,216 px。转WebP格式时,图片的宽×高不能超过16,777,216 px,且宽和高单边均不能超过16,384 px。如果原图为动图,转WebP格式时会被转为静态图片。图像处理操作方法 开通图像处理 图像处理功能...

批处理

使用批处理对存储空间(Bucket)中存量文件进行批量处理。例如将Bucket某个目录中后缀为.docx的文件转换成PDF格式、将所有MOV格式的文件转码为MP4等。说明 新版数据处理功能API、SDK支持在 IMM服务接入点 中的地域进行使用。注意事项 批...

UpdateBatch-更新批处理任务

更新批处理任务信息,如输入的数据源配置、数据处理的配置、批处理任务标签等信息。接口说明 更新批处理任务时,当批处理任务状态处于 Ready(就绪)或 Failed(失败)时可以更新,更新时不会改变当前的任务状态。更新完成后,之前未完成的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
媒体处理 商标服务 对象存储 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用