诊断服务端报错问题

网页抛错是互联网应用最常见的问题之一,但其错...相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用ARMS的告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 应用监控告警规则。

2023年

无 缺陷修复 修复带SORT KEY的内存攒批任务执行后可能会出现的查询报错问题。修复Serverless实例读取字符串类型数据可能出错的问题。修复WHERE子句中过滤条件过多可能出错的问题。修复SQL包含like语句时可能出现报错的问题。修复扩缩容等锁...

概览

实时仓Hologres连接器 1.15 6.0.5 1.3.x 通用:作业启动时,在TasknManager日志中打印所有参数信息,方便排查问题。CTAS/CDAS:支持字段类型宽容模式,使用此模式上游发生数据类型修改事件时,只要所修改类型与原类型的归一化类型相同...

Linux系统常用内核网络参数介绍与常见问题处理

问题原因 net.ipv4.tcp_max_tw_buckets 参数用于调整内核中管理TIME_WAIT状态的数量,当ECS实例中处于TIME_WAIT状态的连接,加上需要转换为TIME_WAIT状态的连接之和超过 net.ipv4.tcp_max_tw_buckets 参数值时,/var/log/messages 日志...

如何排查Nacos线程过多的问题

本文介绍如何排查Nacos线程过多的问题问题现象 通过监控系统或其他手段,观察到应用的线程过多,且大部分线程名中带有nacos等字样。可能原因 系统环境问题。程序读取到的CPU数量错误,导致线程池核心大小和最大大小过大。应用中创建...

Quick BI自助取少量数据,但是耗时很长

问题原因 ODPS 自助取创建临时表,在后台看原因是ODPS上创建临时表就花了接近 3 分钟,自助取数据量虽然不大,但是关联模型比较复杂。解决方案 数据量不超过一万的话,不建议用自助取,可以直接在仪表板里导出数据,自助取的...

配置隔离规则

当这个SQL恢复正常后,并发数会迅速减少。当并发数减少至低于预设的阈值时,系统就不会拒绝请求,应用的处理能力也快速的恢复。通过这样的方式,起到了根据响应时间自动调节的效果,隔离了不稳定的应用。隔离规则配置通常用于强依赖隔离...

基础版一键升级专业版

Dubbo 2.7.8版本存在比较严重的问题导致创建非常多Nacos Client实例,从而导致连接、线程暴涨,请在升级Nacos Client前,务必先升级Dubbo的版本。相关内容,请参见 问题详情。问:MSE升级到专业版,应用升级客户端后,出现启动报错...

变更实例配置

为保障变配后的新实例能快速追平原实例的增量数据,同时规避因DNS缓存引起的数据双写,在变配过程中,通常情况下实例会出现 1分钟内的只读状态,而在写入量较大的场景下只读状态的时间可能增加,因此建议在业务低峰期进行变配。为保障更...

离线同步数据质量排查

这种情况一般多次运行同步任务每次同步的记录条数会有差异。错误的查询检查条件 以MySQL为例,可以配置数据抽取过滤where条件,在where条件中有调度参数变量,具体如 gmt_modify>=${bizdate},常见的错误是调度参数没有合理的替换,比如...

变更实例配置

数据同步完成后,Redis 会在指定切换时间切换至新实例,此时会出现1~2次30秒内的连接闪断,切换完成后,实例状态为“运行中”,变配完成。云原生 实例 变配分片规格提交后,实例立即进入“变配中”。Redis 会先进行资源评估。如果资源充足...

单实例Shard级多副本

当使用Follower Shard查询时,数据可能会出现10~20ms级别延迟。replica count默认值是1,表示不启用Replication。大于1表示开启Replication,建议设置为2,replica count数字越大,对资源的消耗也越大,最多可以有3个Replication,即...

监控、诊断和故障排除

所以产生高E2E延时、低服务器延时可能的原因有两个:客户端应用程序响应慢 可用连接或可用线程有限 对于可用连接数问题,可以使用相关命令确定系统是否存在大量TIME_WAIT状态的连接。如果是,可以通过调整内核参数解决。对于可用线程...

AnalyticDB MySQL 2.0数据导入

说明 写入方式为insert时,会出现FLOAT类型数据错误的问题。column_name AnalyticDB for MySQL 2.0集群中表的列名。同步整个库的元数据(Meta)。meta-sync database database_name to catalog_name;参数 说明 database_name AnalyticDB ...

大数据安全治理的难点

大数据系统以数据类型多(结构化、非结构化、半结构化)、数据量大(动辄PB级别)著称,某些巨头组织一天就能新增十万甚至百万张表,如此体量给数据分级分类带来了极大挑战,通过人工进行数据分级分类显然是不现实的,难免会出现遗漏的...

容器定时伸缩(CronHPA)

因为CronHPA和HPA相互独立无法感知,所以就会出现两个Controller各自工作,后执行的操作会覆盖先执行的操作。CronHPA和HPA的兼容解决方案 从上文可知,CronHPA和HPA同时使用会导致后执行的操作覆盖先执行操作的本质原因是两个controller...

CLB实例诊断

部分场景可能会出现流量达不到带宽峰值但是出现丢包的现象,详细原因及解决方法请参考 在部分特殊场景中,为什么会出现连接达不到带宽峰值的现象?最大支持连接:检查是否存在丢弃连接或并发连接超85%限额(15分钟内)。最大新建连接...

基本概念

从上图中能很容易看出一个问题:假如Table Group的Shard与Worker个数不成比例关系(如上图 Table Group 1 有3个Shard,但是只有2个Worker),那么就一定存在某个Worker比其他Worker多分配一个SE给Table Group的情况,这样在计算时,就...

Kubernetes分批发布

A:为了避免分批发布对用户部署的影响,当分批发布大于当前用户应用的副本时,会以当前已有的副本,作为分批发布的实际批次数 Q:为什么分批发布时,应用访问请求可能会出现异常 A:默认Service在进行流量转发时只要Pod状态为Running...

配置隔离规则

当这个SQL恢复正常后,并发数会迅速减少。当并发数减少至低于预设的阈值时,系统就不会拒绝请求,应用的处理能力也快速的恢复。通过这样的方式,起到了根据响应时间自动调节的效果,隔离了不稳定的应用。隔离规则配置通常用于强依赖隔离...

回退历史版本

SAE 应用创建完成后,还需不断迭代升级,如果升级的版本出现问题,需要回退至所需的历史版本。前提条件 部署应用 操作步骤 登录 SAE控制台。在左侧导航栏,选择 应用管理>应用列表,在顶部菜单栏选择地域,然后单击具体应用名称。在 基本...

OOM常见问题排查指南

识别OOM报错 当计算内存超出上限时(大于等于20GB),就会出现OOM的情况。常见的报错如下。Total memory used by all existing queries exceeded memory limitation.memory usage for existing queries=(2031xxxx,184yy)(2021yyyy,85yy)...

SSL-VPN连接常见问题

原因分类 原因 解决方案 公网链路质量不佳 如果您使用SSL-VPN连接进行长距离通信(例如美国(硅谷)到新加坡),在客户端访问VPC的过程中,则可能会出现客户端间歇性中断下线的情况。请在阿里云侧将SSL服务端的 协议 修改为 TCP(可靠性更...

常见问题

该情况通常伴随 invalid table name:xxx.yyy 报错,主要原因是输出表命名出现问题。对于Proxima CE的输入输出表,其命名需要符合MaxCompute的命名规定,注意名称中不能带点号.,该符号为MaxCompute的特殊字符,导致后续流程错误。通常...

集群负载不均问题的分析方法及解决方案

从结果可以看到查询请求都是普通的term查询,且主日志正常,可以排除ES集群本身出现问题以及存在消耗CPU的查询语句的情况。总结 通过以上分析,可以判断CPU负载不均主要是由于shard分布不均导致的。重新分配分片,确保主shard与副shard...

常见问题

parse lib sigsegv handler installed日志打印 问题原因 该日志是ARMS探针打印的无用日志,仅在开启持续剖析功能后才打印,对应用运行过程无影响,另外ARMS在将来的新版本中关闭相关日志打印。perf_event_open被限制导致的No access to...

CDN的性能指标

回源请求比=CDN节点回源请求÷用户访问CDN节点的总请求,通常越低则性能越好(如果CDN回源做了分片,但是用户访问CDN没有分片,那么会出现CDN节点回源请求远大于用户访问CDN的请求的情况)。回源流量比:回源流量指的是CDN节点回...

调用链分析

将应用数据上报至 可观测链路 OpenTelemetry...接口指标详情 相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 创建告警规则。

Nginx Ingress异常问题排查

排查思路 问题现象 解决方案 访问不通 集群内部Pod到Ingress访问不通 集群内访问集群LoadBalancer暴露的SLB地址不通 Ingress访问自己不通 无法访问Ingress Controller自己 无法访问TCP、UDP服务 添加TCP、UDP服务 HTTPS访问出现问题 ...

调用链分析

将应用数据上报至 可观测链路 ...接口指标详情 相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 应用监控告警规则。

使用ACK Net Exporter定位网络问题

单击 Metric browser,然后输入 inspector,Grafana会自动补全ACK Net Exporter所有就绪的Metric,单击右上角 Save,在弹出框中单击 Save,然后会出现可视化的数据,效果如下:对于使用Grafana进行可视化图形显示的配置,可以参照上述的...

常见问题

无法访问/访问异常 CDN回源时网站出现5xx报错的排查方法 使用CDN加速后网站无法访问 地域节点获取CDN节点文件异常或访问域名失败 使用CDN加速后访问URL时出现空白页面 定位访问异常是CDN节点问题还是源站问题 开通海外节点后没有提高海外...

如何解决MSE Nacos实例连接失败问题

问题现象 当程序连接MSE Nacos出现连接失败问题时,可能会出现如下几种报错。Client not connected,currentstatus:STARTING Client not connected,currentstatus:UNHEALTHY no available server,currentServerAddr:xxxxx Connection ...

常见问题

由于 TSDB 实例默认是专有网络 VPC 的模式,这种模式下如果访问机器和 TSDB 实例不在同一个 VPC 环境内,会出现网络不通,连接超时的错误。解决办法如下:如果写入机器和实例在同一个区域 Region 内,可将写入测试机器加入到 TSDB 所在实例...

容器定时伸缩(CronHPA)

因为CronHPA和HPA相互独立无法感知,所以就会出现两个Controller各自工作,后执行的操作会覆盖先执行的操作。CronHPA和HPA的兼容解决方案 从上文可知,CronHPA和HPA同时使用会导致后执行的操作覆盖先执行操作的本质原因是两个controller...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口...相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用ARMS的告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 应用监控告警规则。

RPS模式的并发量是如何计算的?

当被压测服务异常时,您在PTS控制台看到出现大量的RT变高,甚至出现请求失败超时。由于PTS无法感知被压测端的整体情况,同时为了达到您设置的RPS值,PTS触发的并发越来越高,而且在API的超时时间内累积。此时,继续压测并无意义,您...

变更分片集群实例配置概览

注意事项 变配过程中,可能会出现1~2次闪断现象,每次约30秒。您可以按需设置变更生效时间,避免影响业务运行。重要 仅变更存储空间时,系统根据本地宿主机的存储资源是否足够执行不同的操作。足够:在本地扩容,不需要跨机迁移和切换。...

RPS模式的并发量是如何计算的?

当被压测服务异常时,您在PTS控制台看到出现大量的RT变高,甚至出现请求失败超时。由于PTS无法感知被压测端的整体情况,同时为了达到您设置的RPS值,PTS触发的并发越来越高,而且在API的超时时间内累积。此时,继续压测并无意义,您...

连接管理

Holoweb等Hologres周边组件通过JDBC的方式占用一定的连接,如果您的连接满足需求,无需关心此类连接的占用。当SQL连接长期接近或达到 max_connections 时,意味着您需要检查您的应用是否存在连接泄漏情况,需要在应用端合理...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
钉钉会议 数据传输服务 云原生数据仓库 AnalyticDB PostgreSQL版 云解析DNS 客服工作台 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用