补数据

问题现象 补数据选择业务时间昨天和今天,会出现等待时间的情况。产生原因 从平台维度来看,业务时间昨天的数据,今天调度运行。补数据补对应业务时间的数据相当于重新执行了一次对应业务时间的周期实例。如果您需要过滤今天的周期实例,您...

同城双活

在日常业务链路中,会出现多次跨机房调用,增加性能损耗。同城双活模式:会优先调用同可用区,同可用区找不到调用目标,再调用其他可用区。最佳实践 最佳实践方案建议包含下述逻辑:每个应用的所有节点对等部署在同城的两个可用区。每个...

外呼机器人常见问题解决方式

3)检查当前业务是否有绑定外呼号码(一般控制台内发起外呼时会进行校验业务下号码,但代码上传过程中会出现此状况);到号码管理中查看号码绑定情况。4)检查当前业务并发是否为0,业务并发为0时任务也无法正常发起;4、业务管理中,新建...

常见问题

本文汇总了使用多活容灾时的常见问题。MSHA基础常见问题 什么是...同城多活单元格流量切零后,企业版RocketMQ的ons.log中为什么会出现日志brokerName=msha_mock_queueBrokerName?异地多活如何查看MSHA-agent是否从HTTP流量中提取出了路由标?

通过调用链路和日志分析定位业务异常问题

当应用出现业务异常问题时,应用指标统计图会出现明显波动,您可据此粗略地分析异常问题;通过完整的调用链路和业务日志分析,可以精准定位业务异常问题。关联业务日志与TraceId 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 ...

CLB健康检查FAQ

如上所述,由于健康检查成功后,负载均衡服务器直接发送TCP RST包中断了连接,并没有做进一步的业务数据交互,导致上层业务(例如Java连接池等)认为相应的连接是异常的,所以会出现 Connection reset by peer 等错误信息。解决方案 更换...

动态扩缩容与参数动态更新

背景信息 传统的Flink参数更新方式需要重新启动作业,可能会出现业务中断、数据回追延迟和资源占用高峰等问题,导致作业停止时间变长,影响业务连续性。动态更新参数功能通过REST请求发送至运行中的作业,它允许作业复用现有的JobManager和...

升级Nginx Ingress Controller组件

若验证业务出现问题,可以通过单击 回滚 进行回滚操作。回滚完成后,该升级流程将结束,可以从组件管理中单击 升级 重新开始。验证阶段确认一切正常后,单击 继续 进入发布阶段。发布阶段滚动更新完成后,升级流程进入暂停状态。此时,...

PolarDB MySQL版CPU使用率高

比较常见的问题会出现内存使用争抢。在MySQL体系中,内存主要作为数据缓存使用,也就意味着数据需要不断的迭代,最常用是 buffer pool 和 innodb_adaptive_hash_index 内存区域。整个数据库系统的缓存区域,是数据交换最为频繁的位置,如果...

控制台首页

用户痛点问题 无法找到汇总各类云产品的统一入口,或保有多类产品和跨地域资源,海量入口运维实属低效 为了管理一个实例,历经多次页面的跳转、region切换才最终到达 业务出现问题,查了一大圈儿,都没定位到问题到底出在哪里 直到网站被...

消息堆积和延迟问题

本文主要介绍 云消息队列 RocketMQ 版 TCP协议的Java客户端使用过程中,经常会出现的消息堆积和消息延迟的问题。通过了解 云消息队列 RocketMQ 版 客户端的消费原理和消息堆积的主要原因,帮助您可以在业务部署前更好的规划资源和配置,或...

私域运营

每个云电脑内登录一个微信,无需重复购买硬件 纯净系统更流畅:精简云电脑系统,内部仅允许安装微信及可需工具,随时保持云电脑使用流畅 云电脑协同提效:云电脑出现问题时,管理员远程协助快速解决;需要同事协助时,发送请求同事协同操作...

通过对接外部LDAP登录云原生AI控制台

问题现象 当LDAP用户通过RAM对接OpenLDAP登录AI运维控制台时,出现以下报错:该用户不存在 {"UserPrincipalName"quot;newldapuser@198370611786*.onaliyun.com"} 解决方法 确认以下几:用户是否在RAM中存在。Keycloak中 ...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

应用防护规则适用场景

配置自动重试规则 流量控制规则 场景说明 流量是随机、不可预测的,可能就在某一时间会出现流量洪峰,例如双十一零的场景。然而系统的容量总是有限的,如果突如其来的流量超过了系统的承受能力,就可能会导致请求处理堆积、堆积的请求...

基础管理FAQ

您可以通过以下两种方式删除由云备份服务创建的挂载点:说明 删除NAS备份挂载点会导致备份失败,请确保所有备份计划都已删除,且没有正在运行的备份或恢复任务。通过NAS文件系统入口移除挂载点 登录 NAS控制台。在左侧导航栏,选择 文件...

Operator

新风险及解决方案 在上述应对策略下,会出现新的风险,蚂蚁也提出了对应的解决方案,说明如下:风险:Sidecar 与应用“共享”分配到的内存资源,导致在异常情况(比如内存泄露)下,Sidecar 跟应用抢内存资源。解决方案:通过扩展 Pod Spec...

API&SDK常见问题

调用QueryCallDetailByCallId接口中Data中state等于200说明接口已调用成功,由于刚呼叫完成的错误码合成有时候会产生延迟,所以会出现您查询state=200,而不是对应运营商回执错误码的情况,建议您在呼叫结束3~5分钟后再查询。语音服务如何...

集群巡检项及解决方案

Ingress就绪Pod百分比 异常影响:检查Ingress Deployment已就绪的Pod百分比,小于100表明Ingress Pod可能出现问题,无法正常启动或健康检查失败。解决方案:通过Pod诊断或Ingress异常排查文档查找问题Pod。关于异常问题排查,请参见 Nginx ...

消费者分类

云消息队列 RocketMQ 版 支持PushConsumer和SimpleConsumer这两种类型的消费者,本文分别从使用方式、实现原理、可靠性重试和适用场景...如果业务经常会出现一些预期外的长时间耗时的消息,建议使用SimpleConsumer,并设置好消费不可见时间。

勒索事件综合防护方案

勒索病毒入侵服务器或数据库后,对您的业务数据进行加密勒索,从而导致您的业务中断、数据泄露、数据丢失等严重问题。本文介绍导致勒索病毒入侵的不安全因素,并提供相应防护方案。背景信息 您的业务系统存在以下问题时,被攻击者利用...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

流量防护规则适用场景

配置热点参数防护规则(RPC)配置热点参数防护规则(HTTP请求)流量控制规则 场景说明 流量是随机、不可预测的,可能就在某一时间会出现流量洪峰,例如双十一零的场景。然而系统的容量总是有限的,如果突如其来的流量超过了系统的承受...

ASM网关灰度升级

它和网关原本的Deployment同时属于一个Service,不同是这个Deployment后面加上-canary 的后缀。重要 如果网关命名空间中原本存在带了-canary 后缀的同名Deployment,此时不会覆盖该Deployment。使用该功能前,请确保不存在带-canary ...

ASM网关灰度升级

它和网关原本的Deployment同时属于一个Service,不同是这个Deployment后面加上-canary 的后缀。重要 如果网关命名空间中原本存在带了-canary 后缀的同名Deployment,此时不会覆盖该Deployment。使用该功能前,请确保不存在带-canary ...

性能测试技术指南

风险 未进行调优的系统,系统上线后,可能会出现客户体验差的效果,甚至导致系统“崩溃”的风险。规范 系统调优遵循的规则如下:中间件调优:线程池、数据库连接池、JVM。数据库调优:效率低下SQL、死锁和锁等待、缓存命中率,进程和会话...

设计方案

可观测 在变更过程中,影响到现有环境以及上下游业务,通过对业务、链路、资源等做到可观测,就能够第一时间发现问题。在观测过程中,关注业务指标(如下单成功率)和应用指标(如CPU、Load、异常数量等)。当指标较多时,优先关注高优先...

ADP底座技术白皮书

技术架构 应用架构 应用部署架构将云原生运行时环境分为业务产品和ADP底座两层,图中阐述了每一层的核心组件及依赖关系,可以让客户更加透明地了解到ADP底座的组成架构,如果出现问题,能够快速地确定是不是ADP底座的问题业务产品:包括...

服务运维

元数据不一致:元数据平台维护了 Pod 粒度的 Sidecar 版本信息,但是由于 Operator 是面向终态的,会出现元数据与底层实际不一致的情况,当前仍依赖巡检发现。缺少完善的 Sidecar ops 支撑平台:缺少多维度的全局视图。缺少固化的灰度发布...

调用链采样配置最佳实践

基于重保角度考虑,特定时间段全采样 运维过程中也经常面临重大事件保障的场景,比如大促、新版本压测等,需要针对某一类标签的数据甚至全部应用开启全量数据采集和存储,以便出现问题或者故障时,可以快速定位,甚至影响审计和定责。...

迁移上云概述

该方案具备如下优势:服务不中断、消息收发影响小 迁移方案支持无感切换,在切流期间消息收发不中断,业务应用无感知,出现消息延迟和消息重复问题几率非常小。无需额外资源 业务方应用无需为迁移上云进行扩容或部署多套集群,迁移过程仅...

监控分析平台对比

稳定性保障 依赖系统:数据在多套系统中流转,系统之间又存在依赖关系,当某系统出现问题时,对其他系统造成影响。例如下游ES系统写入变慢后,用于缓存数据的Kafka集群存储水位变高,可能导致集群写满。Burst问题:在互联网环境下,流量...

什么是云拨测

实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,主动发送告警通知,快速响应并处理问题。数据可视化:通过直观的数据展示和报表,您可以轻松了解网络状况、性能以及故障分析。应用场景 网络性能监控:云拨测可以帮助企业和...

WAF接入配置最佳实践

这种情况下,在将域名接入WAF后可能会出现访问空白页502的错误信息,您只需禁用该配置选项即可解决该问题。防护策略配置。参考以下推荐防护配置对已接入的网站业务进行防护:规则防护引擎 一般情况下,建议选用 拦截 模式,并选用 中等规则...

控制面核心组件

未来思考 本次大促,控制面的重心在于解决规模化问题,后续控制面将在下述领域深入探索:服务发现 精细化路由 Policy As Code 蚂蚁团队将与社区深度合作,控制面将支持通过 MCP 对接多种注册中心,例如 SOFARegistry(已开源),Nacos等,...

配置监控告警

创建的告警规则模板会出现在告警规则模板列表中,您可以进行 编辑 或 删除。在ARMS控制台配置 说明 使用RAM用户、RAM角色等身份访问时,需要具有访问应用实时监控服务权限,详情请参见 访问控制概述。登录 实时计算控制台。单击目标工作...

使用PTS监测日常业务

随着移动互联网的日益普及,业务连续性的要求越来越高,如何先于用户发现不同地域或者运营商网络下的核心功能可用性问题是所有移动互联网场景下的业务都需要思考或者解决的问题。本文以典型的电商业务为例,介绍如何使用PTS进行日常业务的...

使用PTS监测日常业务

随着移动互联网的日益普及,业务连续性的要求越来越高,如何先于用户发现不同地域或者运营商网络下的核心功能可用性问题是所有移动互联网场景下的业务都需要思考或者解决的问题。本文以典型的电商业务为例,介绍如何使用PTS进行日常业务的...

B-tree并发控制优化

为了解决上述的数据读写错误问题,InnoDB采用同时持有多个节点锁的方式来保证B-tree并发读写的一致性,并设计了加锁规则以防止多个线程访问B-tree结构时出现死锁的问题。在B-tree并发控制算法的实现上,InnoDB进行了多次优化迭代,改进的...

客户端连接常见问题

本文介绍 云消息队列 MQTT 版 客户端连接服务端时的常见问题。使用安卓的Demo,返回连接失败报错。问题描述 资源填写正确,且网络可以连通。AK(AccessKey ID)、SK(AccessKey Secret)填写正确且已授权。可能原因 接入格式不正确,正确...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 云数据库 Redis 版 云服务器 ECS Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用