分布式链路概述

分布式链路(原 SOFAStack 中间件中的 概述)逐步融合到业务智能可观测服务中,实现监控和链路分析一体化,方便用户对问题进行跟踪定位,对应用性能、调用链路进行实时分析。背景信息 分布式链路是面向分布式架构、微服务(比如 Spring ...

Linux系统常用内核网络参数介绍与常见问题处理

什么/var/log/messages日志中会出现“Time wait bucket table overflow”错误信息?为什么Linux系统的ECS实例中,出现大量的处于FIN_WAIT2状态的TCP连接?为什么Linux系统的ECS实例中,出现大量的处于CLOSE_WAIT状态的TCP连接?为什么...

云数据库录入

为避免干扰,请勿在录入信息的前后添加空格等符号。操作步骤 以录入阿里云RDS MySQL数据库举例。登录 数据管理DMS 5.0。在控制台首页左侧的 数据库实例 区域,单击新增实例 图标。说明 您也可以在控制台首页的搜索框中,输入 实例管理,在...

常见问题

一般使用常见问题 数据源类 配置和接入类 告警类 数据源类 日志支持哪些时间格式?支持如下时间格式:normal:最常见的时间格式 2016-12-13 10:00:14 apache:apache 时间格式 08/May/2017 01:13:52_long:完整时间戳,精确到毫秒,格式 ...

常见问题

本文汇总了使用冷热分离功能时的常见问题。Q:数据什么时候进入冷存储?A:Lindorm通过 compaction 机制异步将冷数据从热存储归档至冷存储,系统触发时间默认为冷热分界线的一半,最小为1天,最大为 major compaction 周期的一半,major ...

CDN回源时网站出现5xx报错的排查方法

问题描述 当您使用阿里云CDN加速站点访问资源后,客户端的请求将首先发送到CDN的L1节点(一级节点),再回源到L2节点(二级节点),然后再回源到源站。因此如果访问过程中出现问题,可能涉及到多级网络链路的问题。当CDN回源源站异常失败时...

常见问题

本章节汇总了使用ARMS告警管理监控的常见问题。本页目录 ARMS Prometheus监控新旧版本告警规则有何不同?指定了新的通知策略,仍然收到了旧的告警通知?为什么配置了告警规则的通知策略,告警还是发给我了?为什么通知策略中出现了标签为_...

SSL-VPN连接常见问题

原因分类 原因 解决方案 公网链路质量不佳 如果您使用SSL-VPN连接进行长距离通信(例如美国(硅谷)到新加坡),在客户端访问VPC的过程中,则可能会出现客户端间歇性中断下线的情况。请在阿里云侧将SSL服务端的 协议 修改为 TCP(可靠性更...

常见问题

当您使用阿里云E-MapReduce(简称EMR)on ACK 时,可以根据本文...如果在绑定了Bucket A的EMR on ACK集群执行Spark作业尝试读写另一个Bucket B时,将会出现访问拒绝错误:“AccessDenied The bucket you access does not belong to you”。

添加加速域名

说明 在某些情况下,用户实际请求回源到不同源站的比例并不一定会与域名配置中源站的权重比例相同,例如:回源QPS较低(例如不到10QPS),回源到不同源站的概率分布不太均匀,因此会出现实际回源权重与源站配置的权重不一致的情况。...

实例容灾

多可用区将物理服务器部署在不同的可用区,当一个可用区出现故障时,可以将业务在短时间内切换到另一个可用区。整个切换过程中应用代码无需变更。说明 主备切换期间产生1次30秒内的连接闪断,建议您在业务低峰期操作,并确保应用具备自动...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。Ingress版本过低 异常影响:集群内...

错误码

说明:PolarDB-X 向后端数据节点异步创建连接时,如果在短时间创建大量连接,或者数据节点建立连接速度太慢,会出现等待超时。该问题通常是由于后端数据节点压力过大或异常导致的,建议使用 PolarDB-X 读写分离,或者升级更高规格,减轻后...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。具体操作,请参见 CoreDNS手动升级...

里程碑计划

支持调整项目列宽 将鼠标置于图示位置后,会出现 符号,将其水平拖动可调整项目列表宽度。2.甘特图 里程碑计划页面右侧为项目里程碑的甘特图,页面功能包括如下图所示几部分:A.图例说明 在里程碑图例中,里程碑节点根据时间及完成情况的...

米连科技

但是由于自建的ES平台在高业务量下查询变得非常缓慢,当出现系统问题故障排查效率较低,用户体验无法得到充分和及时的保障。数据分析能力缺乏 伊对始终坚持以数据驱动产品运营,从最早的统计报表类需求,逐步扩展到基于算法的推荐、风控...

常见问题解答

A:通过 上传音频质检 发起的任务,以及在控制台页面发起 数据集质检 的任务,质检的效率取决于录音转文件的效率,正常情况下,例如发起2小时录音的质检任务,一般会在5分钟内质检完成,但是遇到文件转写服务转写排队较多时,会有一个排队...

共享内存通信(SMC)常见问题

如果您在Alibaba Cloud Linux 3系统中启用了共享内存通信SMC(Shared Memory Communication),且使用过程中遇到无法正常通信、部分端口不可用、对比TCP没有应用性能提升等问题,可以参考本文提供的方案进行排查并解决。启用SMC后应用性能...

CLB健康检查FAQ

如上所述,由于健康检查成功后,负载均衡服务器直接发送TCP RST包中断了连接,并没有做进一步的业务数据交互,导致上层业务(例如Java连接池等)认为相应的连接是异常的,所以会出现 Connection reset by peer 等错误信息。解决方案 更换...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

云效常见问题

工作项 定义 使用场景 需求 代表所需要解决的问题 用户需要借助产品实现某个目标,但是产品尚未支持 缺陷 当系统没有按设计运行的时候,即产生了缺陷 产品出现故障问题,运行方式和结果不符合设计期望 任务 代表一个小粒度的活动 研发...

PolarDB MySQL版8.0.1版本发布日志

修复RO节点的物理机出现故障时,RW节点在特殊情况下未将其复制关系中断,而引发RW节点刷脏受阻的问题。修复HA后,因表数量过多而引发table cache淘汰导致Autoinc回退的问题。修复多主集群缓存中心重启情况下,读写节点可能无法启动的问题。...

常见问题

使用rsync同步时报错"input/output error"问题分析:ossfs与rsync同步使用本身会出现问题。此案例中,用户对一个141 GB的大文件进行cp操作,使磁盘读写处于非常高的负载状态,从而产生此报错。解决方案:如果想要将OSS文件下载到本地ECS,...

配置源站

说明 在某些情况下,用户实际请求回源到不同源站的比例并不一定会与域名配置中源站的权重比例相同,例如:回源QPS较低(例如不到10QPS),回源到不同源站的概率分布不太均匀,因此会出现实际回源权重与源站配置的权重不一致的情况。...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

调优集群性能

如下图所示,某个大表分布不均,存储节点0上的Shard_0和Shard_1中数据量较大,而在存储节点1上的Shard_2和Shard_3中数据量较小,那么当您查询这个大表时,较大概率会出现存储节点0需要处理的数据多,存储节点1上需要处理的数据少的情况,...

应用容灾

当某机房出现故障,可以做到机房级的快速切换。更精细化的场景,如果是某中心内某应用的故障,还需要做到应用级的切换。为了实现机房间的流量调度,同城应用多活架构下,建立多个服务部署的逻辑区,这个逻辑区称之为“单元格(Cell)”。每...

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

ARMS告警精细管理最佳实践

背景知识 在告警管理中有一个非常重要的指标Mean Time To Contain(MTTC),MTTC描述了从检测到故障事件到控制和解决该事件所需的平均时间。它是一个关键指标,因为它衡量了一个组织对事件的响应能力和效率。较短的MTTC意味着组织能够快速...

混沌工程缓存实战系列-Redis

因为服务端出现故障更加真实,所以可以从服务端层面去制造故障,但对于问题定位和排查的要求更高。注入故障,观察指标的变化。缓存监控指标 目前支持的可监控的缓存指标如下:指标 说明 缓存QPS QPS是最通用也是最易观察的指标。缓存命中...

服务发布策略

蓝绿部署通过使用额外的实例资源来解决服务发布期间的不可用问题,当服务新版本出现故障时,也可以快速将流量切回旧版本。如下图所示,某服务旧版本为v1,对新版本v2进行冗余部署。版本升级时,将现有流量全部切换为新版本v2。当新版本v2...

iOS SDK

符号表说明 查看文档「第七步符号表」必选 错误还原时需要,需要进行符号表打包 附录 SDK上报策略 第一步引入&配置SDK 1.1 集成SDK 1.pod引入 在终端执行pod setup命令,拉取最新pod库时间较长。pod setup 2.组件引入 引入统计所需组件库...

如何书写正则表达式

开头的所有 IP 地址,无论后面出现什么数字。在示例 2 中,\d 匹配最后一个句号之后从 0 到 9 的所有数字,{1,3} 表示最后一个句号之后可以出现 1-3 位数。在这种情况下,正则表达式匹配以 192.168.1.开头的所有完整 IP 地址。注意,该正...

常见报错及解决方案

Q:谐云组件故障排查思路 A:elasticsearch《故障排查思路》mysql《故障排查思路》redis《故障排查思路》harbor《故障排查思路》通用排查《中间件通用故障排查思路》ingress《故障排查思路》rocketmq《故障排查思路》kafka《故障排查思路》...

专线接入常见问题

阿里云侧线路出现故障时您可以通过提交工单的方式联系阿里云售后支持人员解决故障问题。速率不符合预期怎么办?对于路由器接口的规格在1Gbps以下的情况,可以使用iperf等工具测试带宽。如果无法超过10Mbps,则有可能是专线某一侧的端口协商...

组复制简介

如果此时备节点已经被切换成新主节点,就会出现主节点数据少于备节点,主备节点数据不一致的情况。全局 事务强一致性 组复制具备集群的节点的数据全局强一致读和全局强一致写能力,并且可根据业务需要修改group_replication_consistency...

弹性加速计算实例EAIS安全性说明

各可用区之间可以实现故障隔离,即如果一个可用区出现故障,不会影响其他可用区的正常运行。每个地域完全独立,不同地域的可用区完全隔离,但同一个地域内的可用区之间使用低时延链路相连。EAIS默认检查云服务器资源池中云服务器的健康状态...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

创建自定义监控

告警等级 在 总览 页面的 告警信息 中做分类统计,以及在告警接收文案中出现告警指标的等级标注。目前提供红色告警、橙色告警(P1)、普通告警(P2)、普通告警(P3)、普通告警(P4)。文中示例选择默认等级 普通告警(P2)。检测频率...

端云互联最佳实践

环境隔离 在项目研发中,一般会区分开发、测试和生产等多套环境,并且在开发过程的不同阶段,使用不同的环境。对于端云互联,我们推荐您在开发或测试环境中使用,以提高研发生产力。但同时有必要对生产环境进行严格的安全控制,以避免数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 Web应用防火墙 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用