什么是应用配置管理ACM?

凭借配置变更、配置推送、历史版本管理、灰度发布、配置变更审计等配置管理工具,ACM能帮助您集中管理所有应用环境中的配置,降低分布式系统中管理配置的成本,并降低因错误的配置变更造成可用性下降甚至发生故障的风险。迁移到MSE Nacos ...

查看实例的系统日志和屏幕截图

您可以利用这些功能分析排查实例故障,例如诊断操作系统无响应、异常重启或者无法连接实例等。前提条件 实例必须处于 运行中(Running)状态才能获取系统日志和屏幕截图。背景信息 云服务器ECS的系统日志是运维诊断的重要一环。如果您需要...

盒式云电脑终端AS01

V6.4.0-2023年8月 变更类型 变更点 变更说明 新增 新增外设故障诊断功能 无影云电脑 外设管理面板的 操作 列新增 诊断 功能,从而检查USB外设的连接链路是否正常。优化 提升网络检测能力 在原有网络检测能力的基础上,增强IP地址冲突、外网...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

单实例快速恢复

实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器(Resource Manager)负责周期性健康检查。当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致)...

无影23.8寸一体机US01

V6.4.0-2023年8月 变更类型 变更点 变更说明 新增 新增外设故障诊断功能 无影云电脑 外设管理面板的 操作 列新增 诊断 功能,从而检查USB外设的连接链路是否正常。优化 提升网络检测能力 在原有网络检测能力的基础上,增强IP地址冲突、外网...

Pod诊断

具体操作,请参见 网络管理FAQ。节点CSI组件状态 检查节点CSI组件是否正常。请检查集群件存储组件状态。具体操作,请参见 存储FAQ-CSI。ClusterComponent 检查项名称 检查项说明 修复方案 集群免密插件版本检查 检查集群免密插件版本是否过...

作业调试

重要 如果您没有配置该参数,则按Apache Flink默认的重启策略,即当有Task失败时,如果没有开启Checkpoint,JobManager进程不会重启。如果开启了Checkpoint,则JobManager进程会重启。其他配置 在此设置更多Flink配置。例如 taskmanager....

设置集群参数和节点参数

说明 对于 是否重启 栏显示为 是 的参数,修改完成后,需要重启集群内的所有节点,新的参数值才会生效。重启前,请提前做好业务安排,谨慎操作。若您的 PolarDB MySQL版 集群版本为8.0,您还可以修改参数 innodb_fast_startup 的值为 ON 来...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

IIS Web网站访问故障

本文介绍IIS(Internet Information Service)作为Web服务的网站,访问故障相关的问题及解决方案。本文介绍的IIS Web网站访问故障相关问题如下:访问部署在Windows实例上的基于IIS搭建的Web网站时,提示“500-内部服务器错误”,如何处理?...

ping不通云服务(SAG-100WM)

如果CLOUD的LED灯是亮的,表示设备和阿里云VPN隧道是正常的,登录 云服务器ECS管理控制台,查看专有网络VPC(Virtual Private Cloud)中ECS实例的安全组规则,流量是否放行。如果CLOUD LED灯是暗的,表示设备和阿里云VPN隧道未正常建立,请...

Pod异常问题排查

Pod故障诊断 登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 详情。在集群管理页左侧导航栏,选择 工作负载>容器组。在 容器组 页面,单击目标容器组右侧 操作...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

集群管理常见问题

本文汇总了集群管理的常见问题。EMR支持哪些地域?EMR集群是否支持升级版本?高可用集群为什么部署3个Master节点?如何开启磁盘加密?开启后有什么影响?如何清理创建失败的集群?创建集群时报错“ECS库存不足”,该如何处理?是否支持磁盘...

同城多活常见问题

因为这样会涉及业务重启恢复,如果每次容灾演练都需要全部业务配合进行机器重启及顺序控制,这样是用户无法接受的。数据库是两个机房各一个主备,还是主机房一主一备,备机房一备的部署形态?一主一备。若新增备节点,成本可控下可多备节点...

使用须知及高危风险操作说明

阿里云容器服务Kubernetes版(简称容器服务ACK)提供容器服务相关的技术架构以及核心组件的托管服务,对于非托管组件以及运行在ACK集群中的应用,不当操作可能会导致业务故障。为了更好地预估和避免相关的操作风险,在使用容器服务ACK前,...

Pod异常问题排查

Pod故障诊断 登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 详情。在集群管理页左侧导航栏,选择 工作负载>容器组。在 容器组 页面,单击目标容器组右侧 操作...

如何通过DMS授权的方式安全访问数据库

概述 在企业环境中,存在阿里云账号共用的情况,看似操作便捷,但是该操作权限粒度不够细分,可能存在以下安全隐患:每个员工都拥有高危权限,故障几率提升,如释放资源、重启实例等。员工的操作日志无法区分,很难对其操作行为进行审计。...

功能发布记录(2020~2021年)

优化 管理实例专有网络VPC 引擎实例支持单节点重启 引擎实例支持单节点重启,满足集群在特殊场景下的运维需求,丰富运维可操作性。新增 重启实例 最佳实践 支持将应用配置从ACM迁移到MSE Nacos,享受更加稳定高性能服务。新增 将应用配置从...

MongoDB 7.0

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

MongoDB 4.0

实例管理 功能 通用型云盘版 功能影响及建议 创建单节点实例 单节点实例的故障恢复时间较长,无SLA保障。变更单节点实例配置 变更配置的完成时间与多种因素(如网络、任务队列、数量大小)有关,建议您在业务低峰期执行变配操作,并确保您...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

关停或启动网站站点

相关文档 网站由于耗资源严重而影响性能时,阿里云会暂停您的网站,并向您发送网站耗资源(客户程序故障)停权通知,您可以通过关闭或重启站点方式来解决该问题。更多信息,请参见 网站耗资源(客户程序故障)的处理方法。

集群高可用架构推荐配置

您可以通过在Pod配置中添加相应的探针和重启策略来进行配置。示例如下。apiVersion:v1 kind:Pod metadata:name:app-with-probe spec:containers:name:app-container image:app-image livenessProbe:httpGet:path:/health port:80 ...

MongoDB 4.4

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

K8s应用运维管理最佳实践

在Java类型应用中,如果出现故障Pod实例,可以借助Arthas诊断,排查Pod故障点。相关文档,请参见 Arthas诊断。如果应用无法正常启动,可以将启动命令修改为 sleep,再通过 kubectl exec 手动启动进程,观察输出并分析原因。相关文档,请...

MongoDB 5.0

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

产品优势

安全可靠 DTS底层为服务集群,如果集群内任何一个节点宕机或发生故障,控制中心都能够将这个节点上的所有任务快速切换到其他节点上,链路稳定性高。DTS内部对部分传输链路提供7×24小时的数据准确性校验,快速发现并纠正传输数据,保障传输...

MongoDB 6.0

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

在云桌面内挂载CPFS文件系统

管理控制台或者无影云电脑客户端重启云电脑。说明 在重启云电脑前,请确认添加挂载配置和挂载路径正确,确保手动挂载成功,避免云电脑重启后CPFS文件系统挂载失效。如果自动挂载配置成功,在云电脑重启后,可以通过 df-h 命令查看已挂载...

MongoDB 4.2

重启实例 重启实例会对实例的节点执行轮转重启,每个节点会有30秒左右的闪断,如果集合的数量较多(超过1万),闪断时间也会随着变长,重启前请做好业务安排并确保应用有重连机制。重启副本集实例可能导致主备切换,连接节点的角色发生变化...

MSE注册配置中心高可用最佳实践

spring.cloud.nacos.discovery.namingPushEmptyProtection=true Dubbo应用 在 registry.url 里添加以下参数:namingPushEmptyProtection=true 持久化缓存 客户端的推空保护生效后,如果您使用容器进行部署,当容器重启后,可能会丢失缓存...

排查因连接数耗尽导致的数据库连接问题

故障表现 不同的MongoDB实例规格支持的最大连接数有所不同,详情请参见 实例规格概述。部署的应用程序突然无法连接数据库。已正确设置了白名单,通过Mongo Shell连接数据库时,提示如下错误:2019-07-10T10:30:43.597+0800 E QUERY[js]...

绑定辅助弹性网卡

弹性网卡可以实现高可用集群搭建、低成本故障转移和精细化的网络管理。您可以随ECS实例创建绑定辅助弹性网卡,也可以单独创建辅助弹性网卡再绑定到ECS实例上。本文主要为您介绍在单独创建辅助弹性网卡后,如何绑定辅助弹性网卡。前提条件 ...

DDH常见问题

阿里云为您提供DDH故障迁移服务,开启服务后,DDH因故障停机时,会自动迁移至健康的DDH。更多信息,请参见 修改DDH故障迁移配置。购买DDH时怎么选择云盘和公网带宽?创建DDH的时候不需要选择云盘和公网带宽,在DDH上创建ECS实例的时候才...

查询并配置计划内事件

为保证能够及时接收风险通知信息,请登录 消息中心,并完成以下操作:勾选 故障消息 中的 云数据库故障或运维通知 和 应急风险预警通知。设置消息接收人(推荐设置为数据库运维人员)。操作步骤 登录 Lindorm管理控制台。在左侧导航栏中,...

存储资源

存储资源是指用于存储和管理数据的硬件和软件资源,包括节点的本地磁盘、分布式文件存储、数据库和缓存等。存储资源的主要作用是存储和管理系统的数据。存储资源需要提供数据的持久性、可靠性和高效性,以满足系统的数据存储和访问需求。...

开通读写分离(只读地址)

RDS SQL Server提供管理只读实例的能力,并提供了一个只读地址,您可以在应用程序中配置主实例地址和只读地址,以此实现读写分离。读写分离即系统会将写请求转发到主实例,将读请求转发到只读地址,只读地址会根据权重将读请求自动转发给备...

使用Tablestore作为存储后端

Namespace高可用模式采用Active和Standby互备方式,支持自动故障转移,当Active Namespace出现异常或者异常中止时,客户端可以请求自动切换到新的Active节点。进入SmartData的 namespace 服务配置,配置以下参数。修改 jfs.namespace....
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据管理 密钥管理服务 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用