1.概述 本文主要介绍在专有云V3环境中,ECS集群进行上下电的方法。1.1.适用范围 专有云V3企业版,ECS 说明:适用于专有云企业版V3.0.0~V3.12.1r环境,包含V3.0.0和V3.12.1r环境。1.2.用户告知 适用平台:x86 授权...
1.概述 本文主要介绍在专有云V3环境,发生集群断电后,如何启动AnalyticDB集群,恢复业务。1.1.适用范围 专有云V3,AnalyticDB 说明:适用...r ttrl|grep[$Hostname]说明:[$Hostname]为没有nodemonitor进程的主机名。...
1.概述 本文主要介绍在专有云V2环境,发生集群断电后,如何启动AnalyticDB集群,恢复业务。1.1.适用范围 专有云V2,AnalyticDB 1.2.风险...r ttrl|grep[$Hostname]说明:[$Hostname]为没有nodemonitor进程的主机名。...
1.概述 本文主要介绍专有云V3环境中,RocketMQ集群Broker节点禁止写入数据的通用方法。1.1.适用范围 专有云V2企业版,RocketMQ 专有云V3企业版,RocketMQ 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术...
1.概述 本文主要介绍在专有云V3环境中,RocketMQ集群Broker节点的上电方法。1.1.适用范围 专有云V3企业版,RocketMQ 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) 临时或固化方案:固化 ...
1.概述 本文主要介绍在专有云V3环境中,baseService集群中aliyunid_appaccess容器的Jetty日志清理方案。1.1.适用范围 专有云V3企业版,基础服务设备 说明:本文适用于专有云V3.0~3.10的环境。1.2.用户告知 适用平台...
一般情况下,在创建或者扩容支持GPU计算的Kubernetes集群时,您不需要指定计算节点安装NVIDIA驱动的版本。若您需要指定安装某个驱动版本时,本文将为您介绍在创建支持GPU计算的Kubernetes集群时,如何安装NVIDIA驱动...
1.概述 本文主要介绍专有云环境中,RocketMQ集群Broker节点禁止写入数据的通用方法。方案总览 类别 内容 风险等级(方案执行的影响)中 操作方式 黑屏 操作复杂度 中 预估执行时长 10分钟 客户业务的影响 有 可监控...
1.概述 本文主要介绍在专有云V3环境中,RocketMQ集群Broker节点的断电方法。1.1.适用范围 专有云V3企业版,RocketMQ 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) 临时或固化方案:固化 ...
1.概述 本文主要介绍在专有云V3环境中,盘古TiantengId为1210*以下版本,NAS集群高水位的应急处理方法。1.1.适用范围 专有云V3企业版,NAS 说明:适用于专有云V3.5.2及以上版本,盘古TiantengId为1210*以下版本。1.2...
1.概述 本文主要介绍在专有云V3环境中,伏羲集群的机器中FuxiMonitor服务的stdout日志文件自动清理方法。1.1.适用范围 专有云V3,伏羲 说明:仅适用于专有云V3.7之前的版本。1.2.风险说明 清理脏数据无风险。2.问题...
1.概述 本文主要介绍在专有云V3环境中,baseService集群中aliyunid_appaccess容器的Jetty日志清理方案。1.1.适用范围 专有云V3,基础服务设备 说明:本文适用于专有云V3.0~3.10的环境。1.2.风险说明 不会影响客户...
1.概述 本文主要介绍在专有云V3环境中,盘古TiantengId为1210*及之后版本,NAS集群高水位的应急处理方法。1.1.适用范围 专有云V3企业版,NAS 说明:适用于专有云V3.5.2及以上版本,盘古TiantengId为1210*及之后版本...
1.概述 本文主要介绍在专有云V3环境中,如何清理test-tianji集群的Rolling任务。1.1.适用范围 专有云V3,天基 说明:本文适用于专有云V3.8所有版本,包含V3.8.0及V3.8.1。1.2.用户告知 适用平台:x86、ARM 授权级别...
1.概述 本文主要介绍在专有云V3环境ECS集群中,盘古水位过高的处理方法。1.1.适用范围 专有云V3企业版,ECS、盘古 说明:适用于专有云V3.0.0~V3.15.0环境,包含V3.0.0和V3.15.0环境。1.2.用户告知 适用平台:x86 ...
概述 本文主要介绍如何在Kubernetes集群的GPU节点中升级Kernel。详细信息 说明: 确认当前Kubernetes集群节点的Kernel版本低于3.10.0-957.21.3。登录GPU节点,如何登录GPU节点,请参见kubectl连接Kubernetes集群的...
1.概述 本文主要介绍在专有云V3环境中,OSS集群的使用量达到90%后禁止写入的修复方法。1.1.适用范围 专有云V3,盘古、OSS 说明:适用于盘古0.16,0.16.1,0.16.2,2.0版本。1.2.风险说明 修改盘古配置,可能会影响...
1.概述 本文主要介绍在专有云V3环境中,企业版Kubernetes集群无法正常启动Pod。1.1.适用范围 专有云V3,容器服务 说明:适用于专有云V3.8~V3.12环境。1.2.用户告知 适用平台:x86 授权级别:L2(二线技术支持工程师...
1.概述 本文主要介绍在专有云环境,OTS集群Chunk数量过高的处理方法。1.1.适用范围 专有云V2,OTS 专有云V3,OTS 1.2.用户告知 操作方式:黑屏 操作复杂度:中 风险等级:中 说明:处理的过程中可能会出现部分业务...
1.概述 在专有云V3环境中,天基控制台的部署详情页面存在大量未达终态的产品集群。本文主要介绍定位此问题的应急排查方法。1.1.适用范围 专有云V3,天基 1.2.风险说明 本文为应急排查方案,所有操作仅为查询操作,无...
1.概述 本文主要介绍在专有云V3.8环境中,网络集群问题的检查及修复方法。1.1.适用范围 专有云V3,天基 说明:适用于专有云V3.8及V3.9环境。1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) ...
Inner_OTS集群中存储了大量的SLS日志信息,其中RDS的占有量最大。为了改善Inner_OTS集群的可用性,需要缩短RDS日志的保存周期。3. 解决方案 详情请参见以下KB文档。KB 85742 通用方案:在SLS控制台修改RDS日志的保存...
1.概述 本文主要介绍在专有云V3环境,Public_OTS集群中服务启动和停止的方法。1.1.适用范围 专有云V3企业版,OTS 1.2.用户告知 适用平台:x86 授权级别:L3(产品研发工程师) 临时或固化方案:固化 操作复杂度:中 ...
升级集群服务ACK中的共享GPU专业版集群后,kube-scheduler组件中关于ack-cgpu应用的extender配置会丢失,导致集群的GPU共享调度无法正常工作。...如果GPU共享调度未生效,容器被分配的显存等于宿主机的GPU显存容量。...
1.概述 本文主要介绍在专有云V3环境中,Public_OTS集群中服务的启动和停止方法。1.1.适用范围 专有云V3,OTS 说明:适用于专有云V3环境下的Public_OTS集群。1.2.用户告知 操作复杂度:低 风险等级:高 说明:操作...
1.概述 本文主要介绍在专有云V3环境,Inner_OTS集群中服务的启动和停止方法。1.1.适用范围 专有云V3,OTS 说明:适用于专有云V3环境下的Inner_OTS集群。1.2.风险说明 停止OTS服务后,OTS业务的上层调度者 Blink、SLS...
1.概述 本文主要介绍在专有云V3环境,Inner_OTS集群中服务的启动和停止方法。1.1.适用范围 专有云V3企业版,OTS 1.2.用户告知 适用平台:x86 授权级别:L3(产品研发工程师) 临时或固化方案:固化 操作复杂度:中 ...
1.概述 本文主要介绍在专有云V3环境中,伏羲集群的机器中FuxiMonitor服务的stdout日志文件自动清理方法。1.1.适用范围 专有云V3企业版,伏羲 说明:仅适用于专有云V3.7之前的版本。1.2.用户告知 适用平台:x86、ARM ...
1.概述 本文主要介绍在专有云V3环境中,OTS集群Chunk数量过高的处理方法。方案总览 类别 内容 国产化 否 风险等级(方案执行的影响)中 操作方式 黑屏 操作复杂度 中 预估执行时长 N/A 客户业务的影响 有 可监控性 ...
1.概述 本文主要介绍在专有云V3环境中,OSS集群的使用量达到90%后禁止写入的修复方法。1.1.适用范围 专有云V3企业版,OSS 说明:适用于盘古0.16,0.16.1,0.16.2,2.0版本。1.2.用户告知 适用平台:x86 授权级别:L2...
概述 本文主要介绍如何通过AS_SupT工具收集天基控制台中大量产品集群未达终态的信息。详细信息 通过AS_SupT工具可以收集异常的服务角色和告警信息,帮助快速定位产品集群未达终态的问题根源,提高工作效率及缩短故障...
1.概述 本文主要介绍在专有云V3.8环境中,网络集群问题的检查及修复方法。1.1.适用范围 专有云V3,天基 说明:适用于专有云V3.8所有版本(V3.8.0和V3.8.1)集群网络问题的检查和修复。1.2.风险说明 无风险,方案中的...
1.概述 本文主要介绍在曙光V3和方舟V3环境中,如何重启DNCS集群中的dncs-server容器。1.1.适用范围 曙光V3,DNCS 方舟V3,DNCS 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) 临时或固化方案...
1.概述 本文主要介绍在专有云环境中,宿主机磁盘满导致女娲服务异常的处理方法。1.1.适用范围 专有云V2企业版,女娲 专有云V3...环境检查 检查nuwa服务 铜雀巡检报nuwa服务异常,需要登录集群AG服务器,检查nuwa服务。...
1.概述 本文主要介绍在专有云V3环境中,如何清理OSS集群ChijiSlave#角色对应机器的日志文件。1.1.适用范围 专有云V3企业版,OSS 说明:适用于专有云V3.0.0~V3.5.1环境,包含V3.0.0和V3.5.1环境。1.2.用户告知 适用...
1.概述 本文主要介绍在专有云V3环境中,如何清理OSS集群ChijiSlave#角色对应机器的日志文件。方案总览 类别 内容 国产化 否 风险等级(方案执行的影响)中 操作方式 黑屏 操作复杂度 中 预估执行时长 35分钟 客户...
问题描述 云原生数据仓库AnalyticDB 3.0集群中,使用drop database[$DataBase]语句删除数据库时,出现以下错误。说明 [$DataBase]为数据库名称。schema is not empty.问题原因 云原生数据仓库AnalyticDB 3.0集群中的...
1.概述 在专有云V3环境中,天基控制台的部署详情页面存在大量未达终态的产品集群。本文主要介绍定位此问题的应急排查方法。1.1.适用范围 专有云V3企业版,天基 1.2.用户告知 适用平台:x86、ARM 授权级别:L1(一线...
问题描述 Kubernetes集群使用CentOS 7.6版本的系统时,kubelet日志中可能存在以下告警信息。Reason:KubeletNotReady Message:PLEG is not healthy:问题原因 CentOS 7.6系统使用的systemd-219-62.el7_6.6.x86_64软件...
1.概述 本文主要介绍在曙光V3和方舟V3环境中,如何重启DNCS集群中的dncs-server容器。1.1.适用范围 曙光V3,DNCS 方舟V3,DNCS 1.2.风险说明 如果现场环境中已经存在与dncs-server容器相关的故障或者异常,需要重启...
在集群基础信息页面下方的主机信息区域,单击待扩容ECS实例的ECS ID。跳转至ECS控制台。扩容系统盘。在左侧导航栏中,单击云盘。在云盘页面,系统盘所在行的操作列,选择更多>云盘扩容。在磁盘扩容页面,选择在线扩...
如果一个应用有多台实例,可以...关于实例分组的详细操作,请参考管理部署在 ECS 集群中的应用的实例分组。在批次右侧的下拉菜单中,选择发布批次。选择分批方式,然后单击发布。即可基于分组和批次进行应用发布了。
当监控各应用使用的 Java 虚拟机的堆内存、线程、MBean 时,除了使用 EDAS 为 ECS 集群和 Swarm 集群中部署的应用提供的“应用诊断” 功能以外,还可以使用 JDK 自带的 jconsole 或者 jvisualvm(这两个小程序默认...
应用实例个数是指您真正用来部署应用的 ECS 实例数或者 Docker 实例数。例1:您的账户购买了100台 ECS,在其中的60台上安装了 EDAS-Agent;部署了 App1,App2和 App3一共3个应用,这3个应用总计占用了50台机器,那么...
在 EDAS 上创建的应用所部署的 ECS 实例会使用您的账号默认启用如下两个安全组规则: 监控告警日志采集:端口范围:8182/8182;适用网络类型:经典网络;健康检查健康检查: 授权类型:100.104.0.0/16。...
对应用的运行环境版本进行升降级,会造成应用的不可用。您可以选择在访问流量小的时候进行,也可以选择分批进行。相关操作请参见运行环境升降级。
EDAS 是分布式应用的构建和管理平台,本身不包含 ECS 资源,您需要另行购买 ECS。购买之后,EDAS 能够自动同步您账号下的 ECS 资源并进行使用和管理。
Remedy EDAS 提供7,8 两个版本的 Java,默认使用的是 Java 7,您也可以在安装 EDAS Agent 过程中,进行 Java 版本的选择。具体用法如下:install.sh-ak-sk[-java(default)|8>]例如如下指定使用 JDK 7:wget-q ...
EDAS 中提供 HTTP 服务的 Web 应用,需要使用 SLB 来进行负载均衡,您可以在 EDAS 的应用配置页面,进行 SLB 的配置。具体配置步骤,请参考SLB 绑定概述。对于 EDAS 的 RPC 服务提供者对应的应用,您无需考虑负载...