应急预案:专有云V3环境中ECS集群进行上下电的方法

1.概述 本文主要介绍在专有云V3环境中,ECS集群进行上下电的方法。1.1.适用范围 专有云V3企业版,ECS 说明:适用于专有云企业版V3.0.0~V3.12.1r环境,包含V3.0.0和V3.12.1r环境。1.2.用户告知 适用平台:x86 授权...

通用方案:专有云V3环境AnalyticDB集群的上电方法

1.概述 本文主要介绍在专有云V3环境,发生集群断电后,如何启动AnalyticDB集群,恢复业务。1.1.适用范围 专有云V3,AnalyticDB 说明:适用...r ttrl|grep[$Hostname]说明:[$Hostname]为没有nodemonitor进程的主机名。...

通用方案:专有云V2环境AnalyticDB集群的上电方法

1.概述 本文主要介绍在专有云V2环境,发生集群断电后,如何启动AnalyticDB集群,恢复业务。1.1.适用范围 专有云V2,AnalyticDB 1.2.风险...r ttrl|grep[$Hostname]说明:[$Hostname]为没有nodemonitor进程的主机名。...

应急预案:RocketMQ集群Broker节点禁止写入数据的通用...

1.概述 本文主要介绍专有云V3环境中,RocketMQ集群Broker节点禁止写入数据的通用方法。1.1.适用范围 专有云V2企业版,RocketMQ 专有云V3企业版,RocketMQ 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术...

应急预案:专有云V3环境中RocketMQ集群Broker节点上电...

1.概述 本文主要介绍在专有云V3环境中,RocketMQ集群Broker节点的上电方法。1.1.适用范围 专有云V3企业版,RocketMQ 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) 临时或固化方案:固化 ...

应急预案:baseService集群中aliyunid_appaccess容器...

1.概述 本文主要介绍在专有云V3环境中,baseService集群中aliyunid_appaccess容器的Jetty日志清理方案。1.1.适用范围 专有云V3企业版,基础服务设备 说明:本文适用于专有云V3.0~3.10的环境。1.2.用户告知 适用平台...

创建或扩容支持GPU计算的Kubernetes集群时如何安装...

一般情况下,在创建或者扩容支持GPU计算的Kubernetes集群时,您不需要指定计算节点安装NVIDIA驱动的版本。若您需要指定安装某个驱动版本时,本文将为您介绍在创建支持GPU计算的Kubernetes集群时,如何安装NVIDIA驱动...

通用方案:RocketMQ集群Broker节点禁止写入数据的通用...

1.概述 本文主要介绍专有云环境中,RocketMQ集群Broker节点禁止写入数据的通用方法。方案总览 类别 内容 风险等级(方案执行的影响)中 操作方式 黑屏 操作复杂度 中 预估执行时长 10分钟 客户业务的影响 有 可监控...

应急预案:专有云V3环境中RocketMQ集群Broker节点断电...

1.概述 本文主要介绍在专有云V3环境中,RocketMQ集群Broker节点的断电方法。1.1.适用范围 专有云V3企业版,RocketMQ 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) 临时或固化方案:固化 ...

应急预案:盘古TiantengId为1210*以下版本NAS集群高...

1.概述 本文主要介绍在专有云V3环境中,盘古TiantengId为1210*以下版本,NAS集群高水位的应急处理方法。1.1.适用范围 专有云V3企业版,NAS 说明:适用于专有云V3.5.2及以上版本,盘古TiantengId为1210*以下版本。1.2...

通用方案:自动清理伏羲集群机器FuxiMonitor服务的...

1.概述 本文主要介绍在专有云V3环境中,伏羲集群的机器中FuxiMonitor服务的stdout日志文件自动清理方法。1.1.适用范围 专有云V3,伏羲 说明:仅适用于专有云V3.7之前的版本。1.2.风险说明 清理脏数据无风险。2.问题...

通用方案:baseService集群中aliyunid_appaccess容器...

1.概述 本文主要介绍在专有云V3环境中,baseService集群中aliyunid_appaccess容器的Jetty日志清理方案。1.1.适用范围 专有云V3,基础服务设备 说明:本文适用于专有云V3.0~3.10的环境。1.2.风险说明 不会影响客户...

应急预案:盘古TiantengId为1210*及之后版本NAS集群高...

1.概述 本文主要介绍在专有云V3环境中,盘古TiantengId为1210*及之后版本,NAS集群高水位的应急处理方法。1.1.适用范围 专有云V3企业版,NAS 说明:适用于专有云V3.5.2及以上版本,盘古TiantengId为1210*及之后版本...

应急预案:专有云V3环境中如何清理test-tianji集群的...

1.概述 本文主要介绍在专有云V3环境中,如何清理test-tianji集群的Rolling任务。1.1.适用范围 专有云V3,天基 说明:本文适用于专有云V3.8所有版本,包含V3.8.0及V3.8.1。1.2.用户告知 适用平台:x86、ARM 授权级别...

应急预案:专有云V3环境ECS集群盘古水位过高的处理...

1.概述 本文主要介绍在专有云V3环境ECS集群中,盘古水位过高的处理方法。1.1.适用范围 专有云V3企业版,ECS、盘古 说明:适用于专有云V3.0.0~V3.15.0环境,包含V3.0.0和V3.15.0环境。1.2.用户告知 适用平台:x86 ...

如何在Kubernetes集群的GPU节点中升级Kernel

概述 本文主要介绍如何在Kubernetes集群的GPU节点中升级Kernel。详细信息 说明: 确认当前Kubernetes集群节点的Kernel版本低于3.10.0-957.21.3。登录GPU节点,如何登录GPU节点,请参见kubectl连接Kubernetes集群的...

通用方案:专有云V3环境OSS集群的使用量达到90%后禁止...

1.概述 本文主要介绍在专有云V3环境中,OSS集群的使用量达到90%后禁止写入的修复方法。1.1.适用范围 专有云V3,盘古、OSS 说明:适用于盘古0.16,0.16.1,0.16.2,2.0版本。1.2.风险说明 修改盘古配置,可能会影响...

应急预案:企业版Kubernetes集群无法正常启动Pod

1.概述 本文主要介绍在专有云V3环境中,企业版Kubernetes集群无法正常启动Pod。1.1.适用范围 专有云V3,容器服务 说明:适用于专有云V3.8~V3.12环境。1.2.用户告知 适用平台:x86 授权级别:L2(二线技术支持工程师...

通用方案:专有云环境OTS集群Chunk数量过高的处理方法

1.概述 本文主要介绍在专有云环境,OTS集群Chunk数量过高的处理方法。1.1.适用范围 专有云V2,OTS 专有云V3,OTS 1.2.用户告知 操作方式:黑屏 操作复杂度:中 风险等级:中 说明:处理的过程中可能会出现部分业务...

天基控制台中部署详情页面存在大量未达终态产品集群的...

1.概述 在专有云V3环境中,天基控制台的部署详情页面存在大量未达终态的产品集群。本文主要介绍定位此问题的应急排查方法。1.1.适用范围 专有云V3,天基 1.2.风险说明 本文为应急排查方案,所有操作仅为查询操作,无...

应急预案:专有云V3.8环境网络集群问题的检查及修复...

1.概述 本文主要介绍在专有云V3.8环境中,网络集群问题的检查及修复方法。1.1.适用范围 专有云V3,天基 说明:适用于专有云V3.8及V3.9环境。1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) ...

应急预案:如何修改SLS中Inner_OTS集群RDS的数据保存...

Inner_OTS集群中存储了大量的SLS日志信息,其中RDS的占有量最大。为了改善Inner_OTS集群的可用性,需要缩短RDS日志的保存周期。3. 解决方案 详情请参见以下KB文档。KB 85742 通用方案:在SLS控制台修改RDS日志的保存...

应急预案:专有云V3环境Public_OTS集群中服务启动和...

1.概述 本文主要介绍在专有云V3环境,Public_OTS集群中服务启动和停止的方法。1.1.适用范围 专有云V3企业版,OTS 1.2.用户告知 适用平台:x86 授权级别:L3(产品研发工程师) 临时或固化方案:固化 操作复杂度:中 ...

升级容器服务ACK的共享GPU专业版集群后GPU共享调度...

升级集群服务ACK中的共享GPU专业版集群后,kube-scheduler组件中关于ack-cgpu应用的extender配置会丢失,导致集群的GPU共享调度无法正常工作。...如果GPU共享调度未生效,容器被分配的显存等于宿主机的GPU显存容量。...

通用方案:专有云V3环境中Public_OTS集群中服务启动和...

1.概述 本文主要介绍在专有云V3环境中,Public_OTS集群中服务的启动和停止方法。1.1.适用范围 专有云V3,OTS 说明:适用于专有云V3环境下的Public_OTS集群。1.2.用户告知 操作复杂度:低 风险等级:高 说明:操作...

通用方案:专有云V3环境的Inner_OTS集群中服务启动和...

1.概述 本文主要介绍在专有云V3环境,Inner_OTS集群中服务的启动和停止方法。1.1.适用范围 专有云V3,OTS 说明:适用于专有云V3环境下的Inner_OTS集群。1.2.风险说明 停止OTS服务后,OTS业务的上层调度者 Blink、SLS...

应急预案:专有云V3环境的Inner_OTS集群中服务启动和...

1.概述 本文主要介绍在专有云V3环境,Inner_OTS集群中服务的启动和停止方法。1.1.适用范围 专有云V3企业版,OTS 1.2.用户告知 适用平台:x86 授权级别:L3(产品研发工程师) 临时或固化方案:固化 操作复杂度:中 ...

应急预案:专有云V3环境伏羲集群的机器中FuxiMonitor...

1.概述 本文主要介绍在专有云V3环境中,伏羲集群的机器中FuxiMonitor服务的stdout日志文件自动清理方法。1.1.适用范围 专有云V3企业版,伏羲 说明:仅适用于专有云V3.7之前的版本。1.2.用户告知 适用平台:x86、ARM ...

通用方案:专有云V3环境OTS集群Chunk数量过高的处理...

1.概述 本文主要介绍在专有云V3环境中,OTS集群Chunk数量过高的处理方法。方案总览 类别 内容 国产化 否 风险等级(方案执行的影响)中 操作方式 黑屏 操作复杂度 中 预估执行时长 N/A 客户业务的影响 有 可监控性 ...

应急预案:专有云V3环境OSS集群的使用量达到90%后禁止...

1.概述 本文主要介绍在专有云V3环境中,OSS集群的使用量达到90%后禁止写入的修复方法。1.1.适用范围 专有云V3企业版,OSS 说明:适用于盘古0.16,0.16.1,0.16.2,2.0版本。1.2.用户告知 适用平台:x86 授权级别:L2...

通过AS_SupT工具收集天基控制台中大量产品集群未达终...

概述 本文主要介绍如何通过AS_SupT工具收集天基控制台中大量产品集群未达终态的信息。详细信息 通过AS_SupT工具可以收集异常的服务角色和告警信息,帮助快速定位产品集群未达终态的问题根源,提高工作效率及缩短故障...

通用方案:专有云V3.8环境网络集群问题的检查及修复...

1.概述 本文主要介绍在专有云V3.8环境中,网络集群问题的检查及修复方法。1.1.适用范围 专有云V3,天基 说明:适用于专有云V3.8所有版本(V3.8.0和V3.8.1)集群网络问题的检查和修复。1.2.风险说明 无风险,方案中的...

应急预案:专有云V3环境中如何重启DNCS集群中的dncs-...

1.概述 本文主要介绍在曙光V3和方舟V3环境中,如何重启DNCS集群中的dncs-server容器。1.1.适用范围 曙光V3,DNCS 方舟V3,DNCS 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) 临时或固化方案...

应急预案:宿主机磁盘满导致女娲服务异常处理应急预案

1.概述 本文主要介绍在专有云环境中,宿主机磁盘满导致女娲服务异常的处理方法。1.1.适用范围 专有云V2企业版,女娲 专有云V3...环境检查 检查nuwa服务 铜雀巡检报nuwa服务异常,需要登录集群AG服务器,检查nuwa服务。...

应急预案:专有云V3环境中清理OSS集群ChijiSlave#角色...

1.概述 本文主要介绍在专有云V3环境中,如何清理OSS集群ChijiSlave#角色对应机器的日志文件。1.1.适用范围 专有云V3企业版,OSS 说明:适用于专有云V3.0.0~V3.5.1环境,包含V3.0.0和V3.5.1环境。1.2.用户告知 适用...

通用方案:专有云V3环境中如何清理OSS集群ChijiSlave#...

1.概述 本文主要介绍在专有云V3环境中,如何清理OSS集群ChijiSlave#角色对应机器的日志文件。方案总览 类别 内容 国产化 否 风险等级(方案执行的影响)中 操作方式 黑屏 操作复杂度 中 预估执行时长 35分钟 客户...

云原生数据仓库AnalyticDB 3.0集群中删除数据库提示...

问题描述 云原生数据仓库AnalyticDB 3.0集群中,使用drop database[$DataBase]语句删除数据库时,出现以下错误。说明 [$DataBase]为数据库名称。schema is not empty.问题原因 云原生数据仓库AnalyticDB 3.0集群中的...

天基控制台中部署详情页面存在大量未达终态产品集群的...

1.概述 在专有云V3环境中,天基控制台的部署详情页面存在大量未达终态的产品集群。本文主要介绍定位此问题的应急排查方法。1.1.适用范围 专有云V3企业版,天基 1.2.用户告知 适用平台:x86、ARM 授权级别:L1(一线...

Kubernetes集群使用CentOS 7.6系统时kubelet日志含有...

问题描述 Kubernetes集群使用CentOS 7.6版本的系统时,kubelet日志中可能存在以下告警信息。Reason:KubeletNotReady Message:PLEG is not healthy:问题原因 CentOS 7.6系统使用的systemd-219-62.el7_6.6.x86_64软件...

通用方案:曙光V3和方舟V3环境中如何重启DNCS集群中的...

1.概述 本文主要介绍在曙光V3和方舟V3环境中,如何重启DNCS集群中的dncs-server容器。1.1.适用范围 曙光V3,DNCS 方舟V3,DNCS 1.2.风险说明 如果现场环境中已经存在与dncs-server容器相关的故障或者异常,需要重启...

扩容磁盘

集群基础信息页面下方的主机信息区域,单击待扩容ECS实例的ECS ID。跳转至ECS控制台。扩容系统盘。在左侧导航栏中,单击云盘。在云盘页面,系统盘所在行的操作列,选择更多>云盘扩容。在磁盘扩容页面,选择在线扩...

如何进行分批发布或者分组发布

如果一个应用有多台实例,可以...关于实例分组的详细操作,请参考管理部署在 ECS 集群中的应用的实例分组。在批次右侧的下拉菜单中,选择发布批次。选择分批方式,然后单击发布。即可基于分组和批次进行应用发布了。

如何在本地使用 jconsole 或 jvisualvm 监控运行在 ...

当监控各应用使用的 Java 虚拟机的堆内存、线程、MBean 时,除了使用 EDAS 为 ECS 集群和 Swarm 集群中部署的应用提供的“应用诊断” 功能以外,还可以使用 JDK 自带的 jconsole 或者 jvisualvm(这两个小程序默认...

应用实例说明

应用实例个数是指您真正用来部署应用的 ECS 实例数或者 Docker 实例数。例1:您的账户购买了100台 ECS,在其中的60台上安装了 EDAS-Agent;部署了 App1,App2和 App3一共3个应用,这3个应用总计占用了50台机器,那么...

创建应用时的安全组规则

在 EDAS 上创建的应用所部署的 ECS 实例会使用您的账号默认启用如下两个安全组规则: 监控告警日志采集:端口范围:8182/8182;适用网络类型:经典网络;健康检查健康检查: 授权类型:100.104.0.0/16。...

如何分批升降级应用的运行环境

对应用的运行环境版本进行升降级,会造成应用的不可用。您可以选择在访问流量小的时候进行,也可以选择分批进行。相关操作请参见运行环境升降级。

购买了 EDAS 之后,是否需要另行购买 ECS?

EDAS 是分布式应用的构建和管理平台,本身不包含 ECS 资源,您需要另行购买 ECS。购买之后,EDAS 能够自动同步您账号下的 ECS 资源并进行使用和管理。

EDAS 的 Java 版本是哪个版本,我能够选择吗?

Remedy EDAS 提供7,8 两个版本的 Java,默认使用的是 Java 7,您也可以在安装 EDAS Agent 过程中,进行 Java 版本的选择。具体用法如下:install.sh-ak-sk[-java(default)|8>]例如如下指定使用 JDK 7:wget-q ...

应用部署在多个实例后,如何实现负载均衡?

EDAS 中提供 HTTP 服务的 Web 应用,需要使用 SLB 来进行负载均衡,您可以在 EDAS 的应用配置页面,进行 SLB 的配置。具体配置步骤,请参考SLB 绑定概述。对于 EDAS 的 RPC 服务提供者对应的应用,您无需考虑负载...
共有8条 < 1 2 3 4 ... 8 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
专有宿主机 云虚拟主机 云数据库专属集群 云数据库 Redis 版 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用