使用前须知

阿里云全球加速服务联合日志服务提供访问日志功能,用于记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。本文介绍全球加速访问日志功能相关的资产、费用以及使用限制等信息。简介 您可以为全球加速实例的一个...

实例启动异常常见错误与对应解决方案

Windows 1662001135:Windows系统因异常进入恢复环境 问题现象 Windows系统ECS实例在较长时间内正常运行,但是重启实例后无法进入操作系统。通过VNC登录实例时,Windows系统启动界面显示 系统恢复选项。问题原因 系统恢复选项 表示...

连接保持

PolarDB 新增支持连接保持功能,避免由于一些运维操作(如升级配置、主备切换或升级小版本等)或非运维操作故障(如节点所在服务器故障)导致的连接闪断或新建连接短暂失败的问题,进一步提高 PolarDB 的高可用性。前提条件 PolarDB 数据库...

关键技术竞争力

基于混沌工程的红蓝攻防能力 TRaaS 基于混沌工程、建立演练机制,提供故障注入、演练编排体系能力,支持在不同环境、不同阶段,主动对业务系统进行故障注入,从而在主动观测单应用健壮性的同时,验证整个体系的故障发现能力、应急响应能力...

什么是应用高可用服务AHAS

应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的SaaS产品,主要包含多活容灾、故障演练和流量防护三个独立的功能模块。其中流量防护已迁移至微服务治理服务MSE。多活容灾 多活容灾MSHA(Multi-...

配置任务常见错误码及排查方法

原因:通讯链路故障,JDBC驱动程序数据包成功发送到源数据库服务器,但未收到来自源数据库的数据包。解决方法:排查数据库的连接数是否过多。参考 communications link failure 处理。联系技术支持解决。DTS.Msg.SQLExecuteError....

使用访问日志

全球加速提供访问日志功能,可以记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。访问日志介绍 您可以选择为全球加速实例的一个或者多个终端节点组创建访问日志,采集到的访问日志将会投递到终端节点组所在地域...

使用访问日志

全球加速提供访问日志功能,可以记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。访问日志介绍 您可以选择为全球加速实例的一个或者多个终端节点组创建访问日志,采集到的访问日志将会投递到终端节点组所在地域...

混沌工程缓存实战系列-Redis

雪崩:当缓存服务器重启或者大量缓存集中在某一个时间失效,这样在失效的时候,也会给后端系统(例如数据库)带来很大压力。缓存RT 缓存响应时间。缓存RT对业务的影响分成多个方面。如果RT变化较少,对于业务访问缓存很少次数的情况下...

主备切换

若您收到短信、邮件、控制台站内信等通知,告知您 Tair 实例已完成主备切换,您可以参考本文了解主备切换的原因、影响和处理建议等。为什么会触发主备切换?实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例...

主备切换

若您收到短信、邮件、控制台站内信等通知,告知您 Redis 实例已完成主备切换,您可以参考本文了解主备切换的原因、影响和处理建议等。为什么会触发主备切换?实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例...

SysAK 2.2.0版本导致运行DNF命令发生错误,如何处理...

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍Alibaba Cloud Linux 2/3系统的SysAK 2.2.0版本导致运行DNF(Dandified ...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

2021年

2021年10月 功能名称 功能概述 变更分类 产品文档 新增阿里云消息队列RocketMQ 异地双活(单元化)容灾架构新增阿里云消息队列RocketMQ,支持纳多活Topic、Group,配置同步链路以及生效Consumer多活路由规则。新增 配置MQ 多活接入层网关...

通过可观测性能力进行故障处理最佳实践

本文为您介绍如何将 云消息队列 RocketMQ 版 可观测性功能应用于 云消息队列 RocketMQ 版 的故障管理场景中,为您的日常运维和故障处理提供实践方案。设计思路 核心问题 运维场景下,故障处理的核心问题如下:服务出现异常如何预警并上报 ...

错误码

遇到该错误的通常原因是数据节点故障,请联系技术支持。PXC-4108 ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW 描述:变量(variable)不允许被设置为NULL。示例:ERR-CODE:[PXC-4108][ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW]System ...

CLB健康检查FAQ

如下图所示,传统型负载均衡CLB健康检查使用的地址是100.64.0.0/10,后端服务器务必不能屏蔽该地址。您无需在ECS安全组中额外针对该地址配置放行策略,但如有配置iptables等安全策略,请务必放行(100.64.0.0/10 是阿里云保留地址,...

查看智能洞察事件列表

智能洞察支持对不同地域的不同应用进行...Pod pending突增 Pod pending突增 类型的事件详情页面显示了最近30分钟内问题集群的内存和CPU总量、请求总量以及使用总量的趋势图,同时可以查看相应时间内关联事件以及相应Deployment的配置信息。

故障诊断

lastState.terminated.reason="OOMKilled"]|any'#对jq表达式的结果进行匹配,结果是否匹配'true'-type:regexp expression:"true"#问题严重等级:Critical/Warning/Info level:Critical#问题总结 summary:Pod因OOM被Kill#问题原因,支持...

上下文查询

通过查看指定日志的上下文信息,您可以在业务故障排查中快速查找相关故障信息,方便定位问题。应用场景 例如,O2O外卖网站在服务器上的程序日志里会记录一次订单成交的轨迹:用户登录>浏览商品>选择物品>加入购物车>下单>订单支付>支付扣款...

搭建高可用架构

设置监控报警 为避免实例因为CPU、磁盘、内存、连接等原因导致实例不可用,建议您监控实例相关性能,并设置超过阈值时 自动报警,防患于未然。恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使...

集群高可用架构推荐配置

节点池高可用配置 您可以基于节点的弹性伸缩、部署集、多AZ,结合K8s调度的拓扑分布约束,确保服务在不同的故障域(failure-domain)资源充足且有所隔离,从而当某一故障域出现问题时,服务仍然可以保持运行,减少单点故障的风险,提高系统...

为什么实例会发生主备切换?

云数据库MongoDB实例发生主备切换的常见原因如下:人工操作:您或者您授权的阿里云技术专家手动发起的主备切换。风险隐患:阿里云检测到实例存在潜在风险,此类风险可能会影响实例的正常使用。系统会自动下发主动运维任务来处理此类风险项...

Mesh 常见问题

XDS 配置不下发 问题原因:Pilot 未启动或 Pilot 与 MOSN 网络不通。解决方案:查看 MOSN 连接 Pilot 是否正常。进入 MOSN 容器,执行如下命令,如果和pilot没有链接则检查pilot的地址是否填写正确 netstat-na|grep 15050 进到MOSN容器,在...

主备切换

Q:主备切换后,超过十分钟,实例状态仍未恢复运行中,可能是什么原因?如何处理?RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几...

ECS系统事件概述

说明 计划内运维事件也称主动运维事件,是阿里云基于百万级服务器的管理运维经验,服务上万家大型企业客户的能力沉淀,以及达摩院的前沿机器学习算法,对底层宿主机的软硬件故障风险进行预测和主动规避。当宿主机上的故障风险无法规避时,...

变更备案

请您在过户成功3~5天以后再操作变更备案,否则信息未同步至工信部,可能导致变更备案被局驳回。变更证明:如持有者名称发生变更,需提供变更证明。阿里云在进行ICP备案申请审核及核查过程中,对于核查结果不合格的ICP备案需尽快修改ICP...

GxP欧盟附录11标准合规包

16.1 为了提供支持关键过程的计算机化系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...

管理MSFE接入层集群

在接入层创建集群,能够实现故障转移(failover)和故障恢复(failback),还可以在不同节点间分摊流量,从而应对流量高峰。本文介绍如何创建接入层集群,以及在集群中新增CLB和服务器。前提条件 已创建ECS实例,并为安全组开放8090端口,...

DDH常见问题

如果您因为过保迁移等原因被分配了一台新的物理服务器,您的DDH会对应一个新的机器码,该机器码就是这台新物理服务器的唯一识别码。DDH故障时是否会自动迁移到健康的DDH?阿里云为您提供DDH故障迁移服务,开启服务后,DDH因故障停机时,会...

K8s应用运维管理最佳实践

在Java类型应用中,如果出现故障Pod实例,可以借助Arthas诊断,排查Pod故障点。相关文档,请参见 Arthas诊断。如果应用无法正常启动,可以将启动命令修改为 sleep,再通过 kubectl exec 手动启动进程,观察输出并分析原因。相关文档,请...

使用ACK AI助手进行故障排查和智能问答

若ACK AI助手无法定位问题的根因并提供可用的解决方案,您可以发起进一步发起诊断,对异常的Pod、Node节点发起基于ACK技术专家诊断经验的深度故障诊断功能。更多信息,请参见 使用集群诊断。前提条件 已开通 容器服务 Kubernetes 版 并已...

SSL-VPN连接常见问题

本文汇总了建立SSL-VPN连接时出现客户端连接失败、流量不通现象的常见原因并提供了相应的解决方案。常见问题快捷链接 客户端连接问题 客户端连接失败怎么办?客户端之前连接成功,但间歇性中断下线怎么办?仅部分客户端连接成功怎么办?SSL...

访问控制常见问题

IP黑白名单配置时有IP地址数量限制,配置IP地址算1个还是多个IP地址数?CDN 配置IP黑白名单时,最多可配置约700个IPv6地址,2000个IPv4地址。1个IP地址算1个IP地址数配置。需要在源站将CDN设置为访问白名单,能提供阿里云CDN访问源站的...

ECS容灾常见问题

请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动识别辅助弹性网卡的IP地址并添加路由,导致无法正常使用辅助弹性网卡。若ECS实例配置了...

ECS容灾常见问题

请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动识别辅助弹性网卡的IP地址并添加路由,导致无法正常使用辅助弹性网卡。若ECS实例配置了...

什么是阿里云域名服务

在阿里云交易平台上,系统会在域名交易的同时确认您的注册信息,以便在交易成功后自动完成过户,如果偶尔因网络原因或者其他原因导致系统未完成自动过户,您可以手动操作域名过户,具体请参见 域名持有者信息修改(过户)。网站域名备案:...

云盘异步复制容灾常见问题

请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动识别辅助弹性网卡的IP地址并添加路由,导致无法正常使用辅助弹性网卡。若ECS实例配置了...

自建VPN无法连通

放行了192.168.1.0/24网段说明 线下服务器(192.168.1.xxx)-ECS实例(网关)这网络没有问题,但是 ECS实例(网关)-其他ECS实例(172.xx.x.45)这网络有问题。检查发现网关和其他ECS实例不在一个安全组下。所以只放行192.168.1.0/24时候,172....

通过错/慢调用链排查应用产生异常的原因

在生产环境中,引发应用异常(如耗时突增、错误率突增)的原因有很多,常见的包括流量不均、单机故障、程序异常和依赖组件故障等。在新应用上线或大促备战前通常建议做一次系统性的性能调优,分析当前系统存在哪些性能瓶颈,梳理出常出错的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 检索分析服务 Elasticsearch版 运维安全中心(堡垒机) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用