错误

解决方案:请提交 工单,或联系Dataphin的支持人员协助处理。DPN.Bbox.MetaCenterServiceError 错误原因:元数据服务不可用。解决方案:请提交 工单,或联系Dataphin的支持人员协助处理。DPN.Bbox.ModelNotFound 错误原因:根据模型ID查询...

WAL日志并行回放

Hold List:并行执行框架中,每个子进程调度执行回放子任务所使用的链表。原理介绍 概述 一条WAL日志可能修改多个数据块Block,因此可以使用如下定义来表示WAL日志的回放过程:假设第 i 条WAL日志LSN为 LSN i ​,其修改了 m 个数据块,则...

Linux实例系统总体负载的查询及分析

nice:通过nice改变了进程调度优先级的进程,在用户模式下消耗的CPU时间比例。system:系统模式下消耗的CPU时间比例。iowait:CPU等待磁盘I/O导致空闲状态消耗的时间比例。steal:利用Xen等操作系统虚拟化技术,等待其它虚拟CPU计算占用的...

接入问题

解决方案:登录Worker查看SchedulerX的日志,日志路径为/${user.home}/logs/schedulerx/worker.log。如果是admin账号启动进程,日志路径为/home/admin/logs/schedulerx/worker.log。如果是root账号启动进程,日志路径为/root/logs/...

使用Gang scheduling

功能介绍 Gang scheduling策略可在并发系统中将多个相关联的进程调度到不同处理器上同时运行。最主要的原则是保证所有相关联的进程能够同时启动,防止部分进程的异常,避免整个关联进程组的阻塞。例如,当您提交一个包含多个任务的批量Job...

使用Gang scheduling

功能介绍 Gang scheduling策略可在并发系统中将多个相关联的进程调度到不同处理器上同时运行。最主要的原则是保证所有相关联的进程能够同时启动,防止部分进程的异常,避免整个关联进程组的阻塞。例如,当您提交一个包含多个任务的批量Job...

云盘存储卷FAQ

原因2解决方案:将Pod重新调度到其他节点。具体操作,请参见 调度应用至指定节点。原因3解决方案:检查Pod是否包含 fsGroup 配置,当磁盘中文件过多时,使用 fsGroup 会导致挂载超时,此时,需要将配置修改为在Init Container中执行 chgrp...

接入问题

解决方案:登录Worker查看SchedulerX的日志,日志路径为/${user.home}/logs/schedulerx/worker.log。如果是admin账号启动进程,日志路径为/home/admin/logs/schedulerx/worker.log。如果是root账号启动进程,日志路径为/root/logs/...

接入问题

解决方案:登录Worker查看SchedulerX的日志,日志路径为/${user.home}/logs/schedulerx/worker.log。如果是admin账号启动进程,日志路径为/home/admin/logs/schedulerx/worker.log。如果是root账号启动进程,日志路径为/root/logs/...

节点异常问题排查

DiskPressure 节点IP资源不足-InvalidVSwitchId.IpNotEnough 节点网络异常处理 节点网络异常 节点其他异常处理 节点异常重启 如何解决auditd进程占用大量磁盘IO或者系统日志中出现audit:backlog limit exceeded错误的问题 诊断流程 查看...

节点异常问题排查

DiskPressure 节点IP资源不足-InvalidVSwitchId.IpNotEnough 节点网络异常处理 节点网络异常 节点其他异常处理 节点异常重启 如何解决auditd进程占用大量磁盘IO或者系统日志中出现audit:backlog limit exceeded错误的问题 诊断流程 查看...

开发PyODPS 3任务

with instance.open_reader(tunnel=True,limit=False)as reader:说明 若您未开启 Instance Tunnel,可能导致获取数据格式错误解决方法请参见 Python SDK常见问题。设置运行参数 您可以通过设置 hints 参数,来设置运行时的参数,参数类型...

版本说明

解决进程采集cred指标时,偶现的插件停用问题。3.5.2 分类 说明 发布时间 2021-06-30 新特性 可用性监控任务可调整监控频率。可用性监控易用性优化,例如:本地日志更加全面和规范。增加Uptime指标,用于查看系统从上次启动到当前的运行...

开发PyODPS 2任务

with instance.open_reader(tunnel=True,limit=False)as reader:说明 若您未开启 Instance Tunnel,可能导致获取数据格式错误解决方法请参见 Python SDK常见问题。设置运行参数 您可以通过设置 hints 参数,来设置运行时的参数,参数类型...

开发PyODPS 3任务

with instance.open_reader(tunnel=True,limit=False)as reader:说明 若您未开启 Instance Tunnel,可能导致获取数据格式错误解决方法请参见 Python SDK常见问题。设置运行参数 您可以通过设置 hints 参数,来设置运行时的参数,参数类型...

开发PyODPS 2任务

with instance.open_reader(tunnel=True,limit=False)as reader:说明 若您未开启 Instance Tunnel,可能导致获取数据格式错误解决方法请参见 Python SDK常见问题。设置运行参数 您可以通过设置 hints 参数,来设置运行时的参数,参数类型...

自定义资源组

如果返回两个进程,则说明是该原因导致,解决方法如下:登录ECS,对上述 ps 出的两个进程执行 kill-9。执行命令 chown admin:admin/home/admin/-R。切换至admin账号。执行命令/home/admin/alisatasknode/target/alisatasknode/bin/...

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod...

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod...

如何使用Prometheus监控Windows

错误(次/秒)Critical WMI(PageFaultsPersec)当进程请求内存中找不到的页面时,就会发生以下页面错误。软页面错误:表示在内存中的其他位置找到了该页面。硬页面错误:表示必须从磁盘检索页面。当前指标包括软错误和硬错误。软页面...

如何使用Prometheus监控Windows

错误(次/秒)Critical WMI(PageFaultsPersec)当进程请求内存中找不到的页面时,就会发生以下页面错误。软页面错误:表示在内存中的其他位置找到了该页面。硬页面错误:表示必须从磁盘检索页面。当前指标包括软错误和硬错误。软页面...

在PyODPS节点中调用第三方包

如果您的PyODPS任务需要访问特殊的网络环境(如VPC网络或IDC网络中的数据源或服务等),请使用独享调度资源组,并参考 网络连通解决方案 打通独享资源组与目标环境的网络连通。PyODPS语法及更多信息请参见 PyODPS文档。PyODPS节点分为...

Pod诊断

采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 Pod诊断覆盖的典型异常场景和AI智能诊断支持场景如下表所示。类别 支持的异常...

消息 Mesh

消息 Mesh 流量调度 消息 Mesh 的流量调度,示例如下:流量调度流程说明如下:控制平面会将与流量调度相关的规则下发至 MOSN,规则主要包含该应用下所有容器节点的 IP 地址与流量权重,这是能够进行精细化流量调度的前提。当 MOSN 收到消息...

Pod诊断

采集的信息包括系统版本,以及负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 Pod诊断覆盖的典型异常场景和AI智能诊断支持场景如下表所示。类别 支持的异常场景 Pod...

Pod诊断

采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 Pod诊断覆盖的典型异常场景和AI智能诊断支持场景如下表所示。类别 支持的异常...

2019年

修复任务实现类配置错误的情况下会触发Spring Boot的ServeletWebServer停止的逻辑,导致业务进程在,但是Web服务被shutdown问题。修复系统启动变量 user.dir='/',任务会卡住的问题。客户端 springContext.getBean 报 ...

资源使用优化

容器化改造,提升资源利用率 容器技术通过隔离运行在主机上不同进程,实现进程之间、进程和宿主操作系统相互隔离、互不影响,它有自己的一套文件系统资源和从属进程。容器服务没有管理程序的额外开销,与底层共享操作系统,性能更加优良,...

任务实例状态异常

解决措施 按照下图所示,在 工作空间配置 页面,检查工作空间是否开启调度。说明 如有需要请协调主账号开启工作空间调度。有周期任务,有其他周期实例,但是这个任务没有产生周期实例 问题现象 有周期任务,有其他周期实例,但是这个任务...

边缘模拟器环境搭建常见问题

错误一:docker daemon is not running 错误现象:解决方法:在 cmd.exe 中执行,开启守护进程即可,具体命令如下:cd C:\Program Files\Docker\Docker DockerCli.exe-SwitchDaemon 错误二:windows下拉取边缘模拟器的镜像失败 错误现象:...

Windows系统实例的宕机问题排查

当Windows操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统事件来定位原因并解决。...

为何Pod中仍存在已恢复故障的“僵尸进程”?

在容器中,故障演练进程的父进程是PID=1的进程,容器中的一号进程不具有进程资源回收的能力,所以导致故障演练进程被终止之后,资源没有得到回收,从而成为僵尸进程解决方案 通过手动共享PID Namespace解决该问题。在Pod的YAML文件中增加...

在ECS实例内访问网站提示“Nginx 502...”错误如何处理...

本文介绍在ECS实例上使用浏览器访问网站时,提示“Nginx 502 Bad Gateway”错误的问题原因和解决方案。问题原因“Nginx 502 Bad Gateway”错误表示访问请求的php-cgi进程已经开始执行,但是由于读取资源失败等原因没有执行完毕,导致...

错误

4301 内部协程调度错误。4302 解码错误。4303 缓冲区非正常溢出。4304 未知的视频封装格式(非MP4)。4400 未知错误MEDIA_ERR_SRC_NOT_SUPPORTED(由于服务器或网络原因不能加载资源,或者格式不支持)。4500 服务端请求错误,查看Network...

调度至Arm节点

注意事项 如果您的ACK集群同时存在Arm节点和x86节点,为了防止不支持Arm的应用和组件被错误调度到Arm节点,请为Arm节点添加污点 kubernetes.io/arch=arm64:NoSchedule。如果您的集群版本为v1.24之前,在使用 nodeSelector 或者 ...

配置Arm节点池

注意事项 如果您的ACK集群同时存在Arm节点和x86节点,为了防止不支持Arm的应用和组件被错误调度到Arm节点,请为Arm节点添加污点 kubernetes.io/arch=arm64:NoSchedule。如果您的集群版本为v1.24之前,在使用 nodeSelector 或者 ...

其他常见问题

解决方案 检查客户端应用配置文件中的 AntVIP 地址。详情请参见 properties 配置项。任务调度客户端不在线 问题现象 任务调度控制台显示客户端不在线。问题原因 客户端和服务端之间的 TCP 长连接建立失败。解决方案 控制台显示客户端在线,...

通过ack-co-scheduler组件实现协同调度

Gang scheduling 阿里云容器服务ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度的问题。使用以下模板向集群中提交Tensorflow分布式作业。关于如何运行Tensorflow的分布式作业,...

Shared Server

支持配置Shared Server调试日志,方便排查后端进程调度相关的任何问题。参数说明 Shared Server的典型配置参数说明如下:参数 说明 polar_enable_shm_aset 是否开启全局共享内存。默认关闭,重启生效。取值如下:on:开启全局共享内存。off...

错误处理

常见错误码(V2.3.5版本及以上)错误名称 错误码(Error Code)错误描述和解决办法(Error Message)MISSING_PARAM 10101 参数缺失,根据详细错误信息补充参数。INVALID_PARAM 10102 参数无效,查看详细错误信息。SIGN_NOT_MATCH 10103 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
音视频通信 商标服务 视觉计算服务 批量计算 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用