应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

产品正式商业发布

体系化故障闭环管理:基于阿里多年base ITIL实践经验沉淀的故障管理体系,满足企业重大故障的流程、在线管理需求,持续提升业务连续性。云钉运维协同:基于钉钉,进行运维问题的协同处理,提升信息流转效率,加速问题解决。更多能力...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

常见问题

本文汇总了使用验证码时的常见问题。产品QA Q1:验证码的生命周期是怎样的?生命周期流程图如下:整个流程中只需初始化一次验证...} 嵌入式下,如果需要滑动完成/图片点选完成后立即发送请求,需要在初始化方法中添加 immediate:true 参数。

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

事件分析概述

事件总线EventBridge 支持对发布到事件总线的各种事件进行追踪查询、分析处理和可视图表展示。本文介绍事件分析的类型、适用场景与优势。背景信息 事件总线EventBridge 的实时事件分析平台依托事件的实时处理引擎,提供数值检索、可视...

查看事件与监控信息

故障列表 故障列表显示当前应用分组正在报警的全部资源,如果正在报警的规则被禁用,则故障列表中不再显示被禁用规则的故障信息。可用性监控 查看服务实例可用性的监控信息。组进程监控 查看组进行监控的进程ID、动态规则匹配和状态等信息...

常见问题-FAQ

旗舰版最快可在1分钟左右准确发现故障并切换 故障发现时间:在健康检查间隔设置为15秒,TTL1秒,连续失败次数3次的情况下,可以在故障的1分钟左右准确发现故障。全网生效时间:GTM无法保证全网的最终生效时间,因受限于全国各地运营商的...

过滤日志

192.168.*.*""method":"POST""browser":"ali-sls-ilogtail"Logtail插件处理配置 处理结果 日志 是否采集 原因 日志1 不采集 browser 字段的值匹配 丢弃日志 中的正则表达式。日志2 采集 符合条件。日志3 不采集 ip 字段的值不匹配 采集...

AI助手使用说明

当发生故障或异常时,通过AI助手底层的告警系统可以自动和PAI进行交互,上报故障信息,并根据故障触发阶段和并行策略选择规避故障方法,对故障机自动进行隔离,并从Checkpoint快速恢复任务。AI助手提供的具体功能如下:异常采集和上报:...

地址标准服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)规定了阿里云向客户提供的地址标准的服务可用性等级指标及赔偿方案。1.定义 1.1服务周期:一个服务周期为一个自然月。1.2服务周期总分钟数:服务周期内的总天数╳24(小时)...

自定义资源组

如果返回两个进程,说明是该原因导致,解决方法如下:登录ECS,对上述 ps 出的两个进程执行 kill-9。执行命令 chown admin:admin/home/admin/-R。切换至admin账号。执行命令/home/admin/alisatasknode/target/alisatasknode/bin/...

F(x)

create create(url,wait=True,timeout=100,se360_path=None)方法描述 创建se360对象 参数说明 url要打开的url wait是否等待加载完成 timeout等待超时时间,默认100s se360_path<str>se360.exe路径,默认查找%ProgramFiles%,%ProgramFiles(x86...

故障诊断

type:Log logOptions:labelSelector:matchLabels:app:loki level:Pod#取最后100行 tail:100#取特定namespace下资源 namespaceSelector:matchNames:acs-system rules:analyzePipeline:#正则匹配-expression:file size too small\ error ...

多云场景全局容灾

预实现效果 中国内地的用户流量调度到线下IDC 中国香港用户的访问流量调度到阿里云中国香港 境外访问流量调度到华为云新加坡 IDC故障场景下,流量调度至阿里云 华为云故障场景下,流量调度至阿里云 阿里云故障场景下,流量调度至华为云 ...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

通过一致性复制组实现容灾恢复

当您创建并启动一致性复制组后,如果生产站点中的云盘发生严重故障,您可以通过一致性复制组批量对生产站点的云盘数据进行容灾恢复。本文主要介绍如何通过一致性复制组进行容灾恢复。背景信息 一致性复制组支持故障切换和反向复制功能,当...

数据源读取时间超时的优化思路

本文介绍导致DataV读取数据源超时的常见原因和解决方法。使用SQL查询的业务数据表数量太大,查询超时 针对查询条件所使用的字段添加索引,减少扫描行数。在数据库中增加定时任务,定时计算所需要的业务指标并更新结果表。DataV组件直接查询...

特征离散

特征离散算法组件是将连续特征按照一定的规则进行离散。功能介绍 离散模块的功能如下:支持稠密数值类特征离散。支持等频离散和等距离离散等无监督离散。说明 无监督离散的特征离散默认为等距离离散。支持基于Gini增益离散和基于熵增益...

数据源读取时间超时的优化思路

本文介绍导致DataV读取数据源超时的常见原因和解决方法。使用SQL查询的业务数据表数量太大,查询超时 针对查询条件所使用的字段添加索引,减少扫描行数。在数据库中增加定时任务,定时计算所需要的业务指标并更新结果表。DataV组件直接查询...

DataWorks权限相关

问题原因 引擎绑定完成后,您需要对当前引擎所使用的网络环境(即所使用的独享调度资源组)进行初始操作。确保Hologres实例与DataWorks独享调度资源组的网络环境处于连通状态,否则将无法运行任务。说明 部分Hologres实例类型无需执行...

特征异常平滑

背景信息 平滑方法如下:ZScore平滑 如果特征分布遵循态分布,噪音一般集中在-3×alpha 和 3×alpha 之外,ZScore是将该范围的数据平滑到[-3×alpha,3×alpha]之间。例如,某个特征遵循态分布,均值为 0,标准差为 3。因此,-10 的...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

AIOps 解决方案专家服务内容说明

支持 AIOps方案实施支持 智能故障发现解决方案实施支持 支持 支持 定制业务风险巡检方案实施支持 支持 支持 AIOps方案现场部署 智能故障发现解决方案线下输出 支持 定制业务风险巡检方案线下输出 支持 备注:服务基础版和标准版的服务...

以太网接口无法接通

本文介绍以太网接口没有接通的可能原因和处理方法。问题现象 以太网接口没有接通(物理上)。可能原因 设备没有连接电源或者以太网接口连接的线缆没有插好。光纤、双绞线过长或者链路损耗太大。接口、接口模块或者设备故障。解决方案 检查...

以太网接口频繁Up/Down

本文介绍以太网接口频繁Up/Down的原因和处理方法。问题现象 以太网接口频繁Up/Down。可能原因 线缆没有连接好。双绞线过长、光纤超长或链路损耗太大。接口、接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备...

自治服务概述

云数据库 OceanBase 的自治服务是一款面向开发、运维、DBA 的一站式智能诊断自治服务,为用户提供可视监控、性能优化、故障诊断、安全管理、容量管理等能力,帮助用户更简单、更低成本、更高性能的使用 OceanBase 数据库。背景信息 传统...

常见问题旧版索引

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?产品FAQ 授权管理FAQ 集群管理FAQ 节点与节点池FAQ 容器网络FAQ Service FAQ Ingress FAQ DNS FAQ 应用FAQ 存储FAQ-CSI 存储FAQ-Flexvolume 容器安全FAQ 为什么可观测监控 ...

计算机型号及浏览器版本常见问题

本文介绍由于计算机型号及浏览器版本的原因导致DataV产品使用卡顿的问题现象及解决方法。MacBook用户编辑器卡顿问题 问题现象 当您使用MacBook时,打开DataV编辑页面之后使用卡顿,CPU占用率飙升。该问题一般发生于如下场景:使用MacBook当...

计算机型号及浏览器版本常见问题

本文介绍由于计算机型号及浏览器版本的原因导致DataV产品使用卡顿的问题现象及解决方法。MacBook用户编辑器卡顿问题 问题现象 当您使用MacBook时,打开DataV编辑页面之后使用卡顿,CPU占用率飙升。该问题一般发生于如下场景:使用MacBook当...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

变更管理

运维事件中心是阿里云提供的云上变更管理服务,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字管理、更快的故障响应、更短的故障时长、更...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

Web可视开发

本文介绍Web可视开发中相关常见问题及解决方法。Web可视应用支持的浏览器有哪些?浏览器兼容版本如下表所示。浏览器类型 版本 Chrome浏览器 60及以上版本。Safari浏览器 10及以上版本。Firefox浏览器 60及以上版本。Edge浏览器 所有...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

开始监控微信小程序

基础使用方法 基础方法包含获取微信小程序监控SDK并初始、上报和设置安全域名这三个步骤:获取微信小程序监控SDK并初始:在微信小程序/utils 目录下新建 wxLogger.js 文件,并将 JS文件 的内容复制并粘贴至新建的 wxLogger.js 文件中。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
DataV数据可视化 数据库自治服务 负载均衡 云防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用