使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

日志全观测应用概述

针对这些数据,可以根据业务的需求和环境,选择对应的方案,分析并定位全链路的异常问题并进行日常运维。本文对阿里云Elasticsearch的日志全观测应用进行了汇总。相关文档 描述 通过Elastic实现Kubernetes容器全观测 Elastic可观测性是通过...

使用限制

SuSE Linux Enterprise Server 12.1由于系统本身的原因导致在VMware环境下存在重启后黑屏的问题出现此类问题与CDR无关。Alibaba Cloud Linux 2.1903 LTS 64位 目前支持Alibaba Cloud Linux 2.1903 LTS 64位如下的内核版本:4.19.91-25.1....

运维服务内容说明

问题清单》4 故障救援 有效协调资源,推动故障快速定位恢复,故障应急响应分钟。《故障报告》5 监控预警 帮助客户完善监控体系,及时处理告警事件,提升主动预警和快恢能力。《事件清单》6 智能巡检 定期健康巡检,提前识别风险隐患,...

使用ACK AI助手进行故障排查和智能问答

若ACK AI助手无法定位问题的根因并提供可用的解决方案,您可以发起进一步发起诊断,对异常的Pod、Node节点发起基于ACK技术专家诊断经验的深度故障诊断功能。更多信息,请参见 使用集群诊断。前提条件 已开通 容器服务 Kubernetes 版 并已...

CLB七层监听FAQ

添加证书时,为什么会出现KeyEncryption的错误?负载均衡HTTPS支持哪些SSL协议版本?HTTPS session ticket的保持时间是多久?可以上传包含DH PARAMETERS字段的证书吗?HTTPS监听是否支持SNI?HTTP或HTTPS监听访问后端服务器的HTTP协议版本...

安装WAF客户端

您在本地服务器上安装并启动vagent后,服务器的系统进程中将会出现 AliYunDunWaf,表示vagent正在工作,可以与阿里云WAF服务端进行通信。这时,您才可以通过部署集群配置,将该服务器添加为WAF的本地防护节点。相关操作,请参见 部署混合云...

热线接入环境要求

然后开始复现问题并按照上述步骤3~6,在问题出现后保存抓包文件,把抓包文件、问题发生的时间段、会话接触编号一并提供给技术人员分析定位问题。热线客服上下班操作规范 上班动作规范 热线上班前先通过产品自带工具进行环境质量检测。下班...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

智能分析-异常根因定位分析利器

传统监控只能去发现和通知那些已知可能发生的故障,而可观测性则能够协助发现并定位未知的问题。OpenTelemetry作为当下可观测领域主流的开源项目,旨在提供可观测性领域的标准化方案,解决观测数据的数据模型、采集、处理、导出等标准化...

Fast Query Cache

当缓存命中率较低时,性能无提升甚至会出现严重降低。由于以上问题,MySQL原生Query Cache没有得到广泛应用,在最新版的MySQL 8.0中,取消此功能。阿里云数据库团队对Query Cache进行重新设计和全新实现,解决了以上几个主要问题:优化并发...

读写访问文件类问题

问题现象 文件存储NAS为多客户端提供了统一名字空间的文件共享读写能力,但在多进程或多客户端并发写同一个文件的场景中(典型的例如并发写同一个日志文件),各进程分别维护了独立的文件描述符及写入位置等上下文信息,而NFS协议本身并...

Spark

Spark访问外部数据源时,为什么会出现网络连接失败问题?Spark SQL应用使用SHOW TABLES或SHOW DATABASE命令查询库表时,为什么显示的库表与实际库表不符?Spark应用为什么提示错误日志oss object 403?如何定位Spark应用运行速度变慢的原因...

连接问题

SDK的MQTT的Buffer默认为1024个字节,当接收的单次MQTT消息长度超过该值时,就会出现此错误。在SDK源码中搜索宏 CONFIG_MQTT_RX_MAXLEN 的值为所需的大小,可解决该问题。同理,如果发送消息时遇到该报错,您可以修改 CONFIG_MQTT_TX_...

产品架构

Holo Master Hologres原生部署在K8s上,当某个Worker出现故障时,由K8s进行快速拉起创建一个新的Worker,保障Worker级别的可用性。在Worker内部,每个组件的可用性则由Holo Master负责,当组件出现状态不正常时,Holo Master则快速重新拉...

PolarDB代理配置与流量异常

一致性级别 最终一致性:不考虑数据的同步情况,按负载进行节点请求的调度,会出现写入的数据未同步完成,只读节点上读取不到的情况。会话一致性:简单理解就是指在同一个连接里的前后请求,一般在写入后立即请求数据时使用,也是 PolarDB ...

PolarDB HTAP实时数据分析技术解密

但是应用这个方案的前提是用户需要迁移到对应的NewSQL数据库系统,而这会出现各种兼容性适配问题。一体化的行列混合存储方案 较多副本Divergent Design方法更进一步的方案,是在同一个数据库实例中采用行列混合存储,同时响应TP型和AP型...

可用性与可靠性

备份恢复 在某些极端异常的场景,例如整个机房出现故障或者用户数据误删,导致数据丢失,AnalyticDB PostgreSQL版 仍然可以通过远端数据备份的方式恢复集群,提供服务,为极端场景或者用户数据误删情况下提供进一步的数据恢复手段。...

服务管控和治理

故障隔离能够定位到异常的服务实例,实现实例级别精细化的隔离和摘流,使故障影响的范围更小、更可控。更多信息,请参见 故障隔离。服务拓扑 实际业务中,应用之间的关联与依赖非常复杂,需要通过全局视角检查具体的局部异常。您可以在...

列存索引技术架构介绍

本文介绍了列存索引的技术背景、简介以及技术架构等内容。技术背景 MySQL生态HTAP数据库解决方案 MySQL是一款主要面向OLTP型场景设计的开源数据库,开源社区的研发方向侧重于加强其事务处理能力。如提升单核性能、多核扩展性和增强集群能力...

iOS 符号表管理

移动分析支持通过符号表对 iOS App 的闪退日志进行反向解析,以便定位 App 中的问题代码,帮助提高排查、解决线上异常问题的效率,同时提供 iOS 符号表管理功能以便导入、查询符号表并进行符号表反解测试。什么是符号表 符号表是内存地址与...

播放异常自主排查

相关文档 若您按照上述流程进行排查后依旧无法定位问题原因,可通过查看下述文档,看是否有相同的案例及解决方案:播放器SDK通用问题 Web播放器见问题 Android播放器常见问题 iOS播放器常见问题 获取技术支持 若您按照上述流程仍无法解决您...

超低延时直播常见问题

本文主要介绍使用超低延时直播中遇到的常见问题。对于同一场直播,可以同时使用标准直播和超低延时直播进行观看吗?可以。针对同一场直播分别生成标准直播和超低延时直播的播放地址用于观看。例如,标准直播RTMP使用 rtmp:/${播放域名}/...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:在左侧导航栏,选择 连续复制型容灾>云上容...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

分布式链路概述

分布式链路(原 SOFAStack 中间件中的 概述)逐步融合到业务智能可观测服务中,实现监控和链路分析一体化,方便用户对问题进行跟踪定位,对应用性能、调用链路进行实时分析。背景信息 分布式链路是面向分布式架构、微服务(比如 Spring ...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

URL转发类问题排查

介绍URL转发的常见问题。概念 URL转发包含URL隐性转发和URL显性转发,主要是指将一个域名指向另外一个已经存在的站点时,可以通过URL转发...解决:此类问题一般为用户网站安全策略设置问题,建议用户检查配置,或者只使用显性URL转发配置。

如何快速定位及解决数据库问题

SHOW PROCESSLIST WHERE INFO IS NOT NULL 一般情况下,语句堆积伴随着数据库卡慢一起出现,因此如果该语句的显示结果中没有大量执行时间大于0的语句,则基本可以断定问题不在数据库层面,反之,则说明数据库可能存在瓶颈。通过堆栈信息...

证书合并申请

重要 提交OV或EV证书申请后,CA中心一般会在1个工作日(具体时间以CA中心所在地的时间为准,如遇节假日该时间会顺延)内向您提交证书申请时填写的邮箱中发送证书初审邮件或电话确认,请您及时接听来自CA中心的电话或确认来自CA中心的邮件。...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

设计原则

在数据中心或服务器出现故障或灾难时,能够快速恢复数据并保持业务的正常运行,可以最大程度地减少因数据丢失或损毁而对企业造成的影响;数据容灾可以提高企业的安全性和可信度。对于一些重要的数据和业务,通过实施数据容灾措施,可以保障...

自动SQL限流

除了上述的问题,在现实生活中可能还会出现各种特殊情况,比如值班人员联系不上、工作人员身边没有电脑、信息太多分析难度大、压力大紧张操作失误等。因此需要尽可能的把异常发现、异常SQL定位、SQL限流、跟踪/回滚的整体流程自动化处理。...

EDAS直播公告

2020-02-12 微服务治理实践之离群实例摘除 微服务架构中,由于服务集群中的某些实例出现故障,但仅仅因此而进行服务降级,对应用的伤害过大。是否可以通过自动地对故障实例进行短暂隔离,待实例恢复后再继续处理业务请求,以便保障服务的高...

播放异常自主排查

相关文档 若您按照上述流程进行排查后依旧无法定位问题原因,可通过查看下述文档,看是否有相同的案例及解决方案:各端播放器公共常见问题 Web播放器常见问题 Android播放器常见问题 iOS播放器常见问题 获取技术支持 若您按照上述流程仍...

播放异常自主排查

相关文档 若您按照上述流程进行排查后依旧无法定位问题原因,可通过查看下述文档,看是否有相同的案例及解决方案:各端播放器公共常见问题 Web播放器常见问题 Android播放器常见问题 iOS播放器常见问题 获取技术支持 若您按照上述流程仍...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用