任务中心

任务中心主要是对离线、在线模型自动化调度运行进行任务式管理,每次任务调度时,都将按照模型设置好的参数和数据自动进行运行,通过任务状态监控单次任务的健康情况。在线服务 在线服务模块展示并管理用户添加的服务,已创建的服务支持...

模型训练

Designer提供了丰富的建模组件,您可以使用工作流,可视化的灵活构建模型、调试模型并周期性地调度模型,以完成模型训练。本文为您介绍使用Designer训练模型的具体操作步骤。前提条件 已创建工作流。您可以根据业务需要创建空白工作流或...

错误

解决方案:请提交 工单,或联系Dataphin的支持人员协助处理。DPN.Bbox.MetaCenterServiceError 错误原因:元数据服务不可用。解决方案:请提交 工单,或联系Dataphin的支持人员协助处理。DPN.Bbox.ModelNotFound 错误原因:根据模型ID查询...

2019年

分布式模型支持拉模型解决因为单机性能引起的木桶效应,支持动态扩容拉子任务。拉模型支持全局子任务并发度,可以进行限流。JobContext增加 wfInstanceId。客户端启动失败抛异常,堵塞JVM启动,尽早发现问题。客户端启动打印mvn依赖JAR的...

历史记录

分布式模型支持拉模型解决因为单机性能引起的木桶效应,支持动态扩容拉子任务。拉模型支持全局子任务并发度,可以进行限流。JobContext增加 wfInstanceId。客户端启动失败抛异常,堵塞JVM启动,尽早发现问题。客户端启动打印mvn依赖JAR的...

节点伸缩概述

基于以上问题,ACK通过 节点伸缩(资源层)和 工作负载伸缩(调度层)两层弹性模型解决。节点伸缩 基于资源的使用率来触发应用副本的变化,也就是调度单元的变化。以下介绍技术细节。如何判断节点的弹出?节点伸缩通过监听Pending状态的...

Java SDK

schedule.timestamp(执行调度时间)data.timestamp(调度数据时间)无 1.8.13,2023-09-08 功能名称 变更类型 功能描述 相关文档 执行线程模型调整 新增 执行线程模型调整。模型切换为 非共享 线程池模式。共享线程池模型下共享线程池参数...

历史功能发布记录(2023年)

全部 自助诊断GPU节点问题 ACK调度器支持IP感知调度和拓扑调度等功能 IP感知调度 当Pod调度到某节点上时,由于可用IP不足无法启动,该节点将被标记为缺少IP状态并被拉黑五分钟。IP感知调度可防止大量Pod由于IP不足而导致的启动失败问题。...

API插件管理

本文介绍应用中心-插件中心的功能介绍。2024年6月30日我们将升级调整插件功能,现有版本将会下线。...如何解决:如果注册的API接口返回了具体的错误信息,该错误信息会跟随错误码一并返回给开发者,开发者可以根据具体错误信息来排查问题。

DataWorks权限相关

本文内容将为您介绍几个常见权限问题的解决方法。问题汇总 与DataWorks权限相关的问题及解决方法,请单击如下链接查看。工作空间配置绑定HologresDB按钮为灰色 绑定HologresDB时环境初始化失败 绑定HologresDB时报错“同名计算引擎实例已经...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度的问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度的问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

常见问题

解决方法:执行命令 show proc"/cluster_balance;和 show proc"/statistic;查看是否有tablet正在进行rebalance:如果有,则等待执行完成。如果没有,则可以执行命令 set disable_balance=true,然后发起创建物化视图操作。数据查询缓慢,...

文字变形API详情

输入内容&效果示意 输入文字(input.text):桂林山水 描述提示词(input.prompt):山峦叠嶂、漓江蜿蜒、岩石奇秀 返回结果:模型概览 模型模型简介 wordart-semantic WordArt锦书-文字变形可以对输入的文字边缘轮廓进行创意变形,根据提示...

文字变形API详情

输入内容&效果示意 输入文字(input.text):桂林山水 描述提示词(input.prompt):山峦叠嶂、漓江蜿蜒、岩石奇秀 返回结果:模型概览 模型模型简介 wordart-semantic WordArt锦书-文字变形可以对输入的文字边缘轮廓进行创意变形,根据提示...

涂鸦作画API详情

输入内容&效果示意 模型概览 模型模型简介 wanx-sketch-to-image-lite 通义万相-涂鸦作画通过手绘任意内容加文字描述,即可生成精美的涂鸦绘画作品,作品中的内容在参考手绘线条的同时,兼顾创意性和趣味性。HTTP调用接口 功能描述 本...

涂鸦作画API详情

输入内容&效果示意 模型概览 模型模型简介 wanx-sketch-to-image-lite 通义万相-涂鸦作画通过手绘任意内容加文字描述,即可生成精美的涂鸦绘画作品,作品中的内容在参考手绘线条的同时,兼顾创意性和趣味性。HTTP调用接口 功能描述 本...

API详情

模型概览 模型模型简介 stable-diffusion-xl stable-diffusion-xl相比于v1.5做了重大的改进,并且与当前为开源的文生图SOTA模型(midjorney)效果相当,具体改进之处包括:更大的unet backbone,是之前的3倍;增加了refinement模块用于...

如何在调度任务中自动同步PAI模型至OSS

本文为您介绍如何在调度任务中,自动同步PAI模型至OSS。前提条件 在开始执行操作之前,请确认您已经完成以下准备工作:已开通OSS并创建OSS Bucket存储空间,详情请参见 开通OSS服务 和 控制台快速入门。已完成OSS访问授权,详情请参见 云...

任务实例状态异常

解决措施 按照下图所示,在 工作空间配置 页面,检查工作空间是否开启调度。说明 如有需要请协调主账号开启工作空间调度。有周期任务,有其他周期实例,但是这个任务没有产生周期实例 问题现象 有周期任务,有其他周期实例,但是这个任务...

LLM定制

定制模型介绍 为了更好的满足用户的搜索问答体验,OpenSearch智能问答版推出了LLM定制模型的功能,用户可以根据实际的业务场景需要训练专属的大模型。操作步骤 说明 LLM定制模型只支持智能问答版实例为专业版的进行创建 创建模型 1、创建...

流程简介

创建模型 模型为数据探索的核心部分,将数据及算子编排成模型,并对模型列表进行统一管理,包含模型版本管理、模型任务管理、模型复制、模型归档等操作。配置调度任务/服务 任务中心主要是对 离线 模型自动化调度运行进行任务式管理。

如何定义Manifest

包括插件相关的API出入参、插件作用等关键信息,大模型会根据Manifest的信息知晓当前的插件可以完成什么(What),什么时候该调度(When),如何完成要完成的事情(How),从而完成插件的调度、调用,完成大模型和三方API的结合。...

功能简介

数据探索(Data Discovery)是一款面向业务人员的业务模型(智能数据与智能算子组装)编排、调试、运行及运营管理产品,旨在将“大数据”变成“人人都可用的大数据”。数据探索面向行业客户和业务人员,提供工具内容一体化的业务模型构建...

使用POP API创建自学习模型

GetAsrLmModel 删除自学习模型:DeleteAsrLmModel 列举自学习模型:ListAsrLmModel 自学习模型的训练与发布 添加数据集到自学习模型:AddDataToAsrLmModel 从自学习模型中删除数据集:RemoveDataFromAsrLmModel 训练自学习模型:...

离线调度

通过大数据开发套件对模型进行调度。每天凌晨对广告投放进行CTR预测,甄选出符合标准的广告进行推送。本工作流数据集是通过Random算法随机生成的,因此不对工作流结果进行评估,仅介绍如何构建工作流及大数据开发套件调度。步骤一:准备...

调度至Arm节点

注意事项 如果您的ACK集群同时存在Arm节点和x86节点,为了防止不支持Arm的应用和组件被错误调度到Arm节点,请为Arm节点添加污点 kubernetes.io/arch=arm64:NoSchedule。如果您的集群版本为v1.24之前,在使用 nodeSelector 或者 ...

其他常见问题

解决方案 检查客户端应用配置文件中的 AntVIP 地址。详情请参见 properties 配置项。任务调度客户端不在线 问题现象 任务调度控制台显示客户端不在线。问题原因 客户端和服务端之间的 TCP 长连接建立失败。解决方案 控制台显示客户端在线,...

通过ack-co-scheduler组件实现协同调度

Gang scheduling 阿里云容器服务ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度的问题。使用以下模板向集群中提交Tensorflow分布式作业。关于如何运行Tensorflow的分布式作业,...

语音识别问题排查

本文为您介绍语音识别中出现问题的排查步骤及解决方案。排查步骤 使用cooledit或者Adobe Audition软件查看语音格式,播放试听并查看分轨情况、波形、能量和频谱图。ASR识别标准格式:8KHz或16KHz采样率、16bit采样位数、单声道的语音数据...

Stream模型

模型主要解决以下问题场景:现有的Map模型每次运行都需要等待所有子任务执行完,单个子任务耗时影响整体的后续运行。对子任务的生产速率和分发处理提供全局的并发控制。调度服务端提供任务运行期的监控报警。前提条件 已创建应用(任务...

故障排除

服务器内部出现错误,请稍后重试或者联系客服人员帮忙解决。ModelCenter.MinTrainingcount The number of model training records is less than 4.模型训练数据少于4条。40003 An error occurred while authenticating the model.模型鉴权...

任务触发与执行问题

任务执行超时 问题现象 出现 TIMEOUT 错误。问题原因 客户端处理超时。解决方法 查看超时时间是否配置太小。建议根据任务的实际执行情况设置合理的超时时间。查看客户端错误日志 common-error.log。自定义参数不存在 问题现象 出现 javax....

UpdateModel-更新模型

A0F049F0-8D69-5BAC-8F10-B*A34C 示例 正常返回示例 JSON 格式 {"RequestId":"A0F049F0-8D69-5BAC-8F10-B*A34C"} 错误码 访问 错误中心 查看更多错误码。变更历史 变更时间 变更内容概要 操作 2023-10-26 API 内部配置变更,不影响调用 看...

常用错误码ErrorCode

1200 远程计算服务中输入的 token ID 无效 检查 token ID 是否有效以及正确输入-1201 与远程计算服务器连接错误 检查远程计算服务器地址是否正确,网络连接是否畅通-2000 输入或读取优化模型错误 检查优化模型是否正确-2001 优化模型为空 ...

CreateModel-创建模型

模型模型版本的集合,创建模型时需要指定模型名称,描述等信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出...

Hologres权限相关

Hologres具有专家权限模型、简单权限模型和基于Schema级别的简单权限模型(简称SLPM),那么该如何选择合适的Hologres权限模型,具体操作场景说明如下:专家权限模型指的是Postgres原生的权限模型,若您对Postgres及其权限管理已经比较熟悉...

补数据

本文为您介绍补数据的相关问题。补数据功能说明 为什么小时分钟任务补数据选择了并行但实际不生效?...场景示例:对月调度任务进行补数据 任务调度周期定义:定时每月1号0点调度的任务,在补数据时,需要选择业务为上个月末。

接入问题

解决方案:登录Worker查看SchedulerX的日志,日志路径为/${user.home}/logs/schedulerx/worker.log。如果是admin账号启动进程,日志路径为/home/admin/logs/schedulerx/worker.log。如果是root账号启动进程,日志路径为/root/logs/...

GPU实例FAQ

预留实例失败可能有以下原因:预留实例启动超时 错误码:"FunctionNotStarted"错误信息:"Function instance health check failed on port XXX in 120 seconds"解决方案:检查应用启动逻辑,是否存在公网模型下载、10 GB以上大模型加载逻辑...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
音视频通信 批量计算 商标服务 表格存储 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用