内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

提交节点报错:当前节点依赖的父节点输出名不存在

如果表存在,且由某个节点产出,但是没有将这个表添加为节点的输出,也会出现此类报错。可能原因1:没有节点产出这个表 可能原因 出现此种情况的原因之一是:确实没有节点产出这个表。对于大部分场景,DataWorks可通过自动解析,自动将产出...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

I-V曲线诊断

被遮挡的组件会出现热点效应(HotSpot),成为整个阵列的负载,从而在局部产生高温,导致组件烧毁损坏,进而产生严重安全隐患。会导致阵列的不均匀老化。组件老化过快,会影响整个阵列的性能和寿命。光伏阵列电阻老化 太阳能电池片存在着...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全复制才能对被保护服务器继续进行容灾保护。按如下步骤进行故障切换:在 受保护服务器 页签,在要启动故障...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:在左侧导航栏,选择 连续复制型容灾>云上容...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

依赖关系

调度依赖配置常见问题 提交节点报错:当前节点依赖的父节点输出名不存在 提交节点时提示:输入输出和代码血缘分析不匹配 为什么自动解析的父节点名报依赖的父节点输出(表)不存在?为什么有些节点的本节点的输出中,下游节点名称、下游...

远程连接非中国内地的轻应用服务器提示连接超时

问题原因 如果您在中国内地访问其他国家和地区地域下的轻应用服务器,可能会出现较大延迟及丢包,造成无法访问轻应用服务器的情况。该问题受国际运营商的影响,无法在轻应用服务器中修复。关于轻应用服务器的地域说明,请参见 地域...

使用数据实验室

异常点 在 分布模型 中所确定的数据的基础上,随机选择某些周期,在这些周期内的数据量会出现异常变化,您可以指定出现异常点的概率和异常点数据变化的倍率。您可以配置多个异常选项,每个数据周期最多出现一个异常点,优先模拟排在...

同步Redis后出现数据不一致

如下图:可能原因 单靠 info keyspace 的 expires 来判断数据是否一致会出现偏差。其统计信息的统计值不是精确值,有一定的误差。info keyspace 的输出结果中:keys 表示所有keys的数据。expires 表示带有过期keys的数据,包含未过期和...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

运行失败

0010000:System internal error-fuxi job failed,caused by:ShuffleServiceMode:Dump checkpoint failed 解决方法 该问题一般是单个实例output size超限导致的,即MR处理过程中,单个Mapper或Reducer实例的输出超过限制(400 GB)。...

常见问题

本文汇总了使用轻应用服务器时的常见问题。远程连接和计费问题 远程连接FAQ 计费常见问题 服务器管理问题应用服务器在哪些地域部署?轻应用服务器存在哪些状态?轻应用服务器是否可以升级配置?轻应用服务器是否支持过户?轻...

数据库优化

活跃线程堆积问题及优化:如果出现大量的活跃连接数,说明出现了SQL堆积和响应变慢,严重时导致实例停止响应。同时活跃连接消耗连接池,当达到上限时导致新的连接无法建立,数据库无法处理新的应用请求。常见问题如下:慢SQL堆积问题,...

Stage级别诊断结果

较大的数据被广播 Stage输入数据倾斜 Stage输出数据倾斜 较大的数据被广播 问题 广播(Broadcast)是在两个相邻的Stage间,上游向下游Stage传输数据时所用的一种方法(更多详情,请参见 数据输出类型)。如果某个Stage广播了较多数据,...

使用执行计划分析查询

Stage层执行计划树中主要包含如下信息:基本信息 图中的每个矩形框代表一个Stage,框里包含Stage ID、数据输出类型、耗时或内存(选择 按内存 排序时展示)等信息。说明 当Stage层执行计划树上出现红色警示号,表示该Stage被诊断出存在可...

容灾演练断网方式说明

在实例进行主备切换时,业务可能会出现长连接闪断的情况,以此验证业务是否具备失效重连机制。使用场景 部分业务或大规模业务实例不可用。Redis、RDS云服务高可用实例部分不可用。使用限制 安全组断网只针对新建立的网络连接进行阻断,并不...

PolarDB MySQL版CPU使用率高

此类问题一般可以通过开启集群的thread_pool特性进行流控缓解,具体请参见 Thread Pool。如果活跃线程有所缓解,同时还要注意应用侧是否已经产生了业务堆积,如果CPU负载较高同时活跃线程依然高居不下,此时则同样要考虑是不是对集群进行扩...

查询日志

通过阿里云Logstash的日志功能,您可以输入关键字和设置时间范围,锁定需要查询的日志内容,快速定位集群问题,辅助集群运维。本文为您介绍如何查询日志以及常见日志的使用说明。操作步骤 登录 阿里云Elasticsearch控制台。进入目标实例。...

控制台的常见问题

新创建的自定义属性,控制台界面却没有对应的组件 浮点读写属性对应的功能滚动组件,在功能定义设置了步长时,为什么面板上会出现不同的步长?产品发布 发布产品需要上架测试吗,并寄样品到阿里吗?产品产之后撤销发布,已经销售的产品会...

算子级别诊断结果

聚合算子聚合度低 过滤条件没有下推 Join存在数据膨胀 Join的右表过大 存在Cross Join 扫描算子读取字段个数较多 表扫描数据倾斜 索引不高效 聚合算子聚合度低 问题 聚合算子的聚合度一般指GROUP BY分组聚合操作中的输入数据输出数据...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

一键MaxCompute Merge任务节点问题排查方案

原因:前一日的全分区没有产生,一般较少出现,可能场景:手动补数据运行Merge实例,但前一日实例没有运行,确保前一日Merge实例正常运行完成。首次运行时离线全或者加表后全同步未执行完成,如果存在同步失败的表,解决方案中通过先...

提交节点时提示:输入输出和代码血缘分析不匹配

可能原因 当代码中SELECT的表与节点的依赖的父节点配置不一致,或代码中INSERT、CREATE的表与节点的本节点的输出不一致时,会出现该提示。以上图为例,说明:您提交的节点代码中有SELECT名称为table2的数据,但是table2并没有配置为节点的...

如何设置分辨率

媒体处理进行转码时通过转码模板设置视频分辨率,视频处理完成后如果出现视频拉伸,一般是因为输入视频与您指定的分辨率比例不一致。本文为您介绍分辨率相关参数的配置方法。设置横竖屏自适应 如果您的输入视频既有横屏视频也有竖屏视频...

方案背景

气象数据中大量的数据是时空数据,记录了时间和空间范围内各个点的各个物理量的观测量或者模拟量,每天产生的数据量常在几十TB到上百TB的规模,且在爆发性增长。如何存储和高效的查询这些气象数据越来越成为一个难题。传统的方案采用关系型...

Presto FAQ

Schema的Catalog类型必须是Hive,否则会出现如下报错:big_query only support hive catalog.如何调整查询RDS类数据源的并发度?以RDS为例,使用DLA扫描线上数据时,如果RDS实例规格比较小,可能无法支撑默认的JDBC Connector并发度。您...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

管理 MOSN 日志级别

INFO","/home/admin/logs/mosn/routerule.log":"INFO","/home/admin/logs/mosn/zoneclient.access.log":"INFO","/home/admin/logs/mosn/zoneclient.error.log":"INFO"} 修改日志级别 可用的日志级别如下:FATAL:输出会导致应用程序退出的...

测试指标

如果系统不能稳定的运行,上线后,随着业务的增长和长时间运行,将会出现性能下降甚至崩溃的风险。标准 TPS曲线稳定,没有大幅度的波动。各项资源指标没有泄露或异常情况。批量处理指标 定义及解释 指批量处理程序单位时间内处理的数据...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作或数据...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

标准版-双副本

当主节点出现故障,自研的HA系统自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

远程连接FAQ

检查是否为海外服务器 中国内地访问其他国家和地区地域下的轻应用服务器,可能会出现较大延迟和丢包,造成无法访问服务器的问题。该问题受国际运营商的影响,无法在服务器中修复。更多信息,请参见 远程连接非中国内地服务器时,提示连接...

4、如何做好迭代排期?

我们会看到,在排期输入、排期过程、排期输出环节的要求比较多,如果没有要求的话,排期会将会比较低效,后续的迭代推进也会出现各种问题。如下,是我们在辅导敏捷开发团队过程中总结的几个注意点:明确的迭代目标 迭代需要有比较明确的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 负载均衡 商标服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用