[帮助文档] LLM-文件后缀过滤组件说明

LLM-文件后缀过滤组件主要用于大语言模型(LLM)的文本数据预处理工作,根据文件名后缀对文本进行过滤,过滤掉指定后缀名的样本。

[帮助文档] 通过HTTP协议下载文件并同步至目标数据源

DataWorks数据集成支持HttpFile数据源,可以通过HTTP协议下载文件并同步文件至目标数据源。

阿里云大数据工程师ACA认证(2023版)

21 课时 |
807 人已学 |
免费

基于MaxCompute的热门话题分析

8 课时 |
329 人已学 |
免费

独家揭秘当下大数据体系

4 课时 |
331 人已学 |
免费
开发者课程背景图

[帮助文档] 使用Check节点检查MaxCompute分区表、FTP文件或OSS文件是否可用

DataWorks的Check节点可用于检查目标对象(MaxCompute分区表、FTP文件或OSS文件)是否可用,当Check节点满足检查策略后会返回运行成功状态。如果某任务的运行依赖目标对象,您可使用Check节点检查目标对象,并设置该任务为Check节点的下游任务,当Check节点满足检查策略...

[帮助文档] 如何调用函数计算服务对oss中的PDF文件添加水印

本文为您介绍如何在DataWorks中通过函数计算节点调用函数计算服务,实现周期性对OSS中的增量PDF文件添加水印。

用dataworks 解析 oss的orc文件写入odps正常 有告诉我这个是哪里配置问题吗?

用dataworks 解析 oss的orc文件写入odps正常 但是我用开源 datax的脚本方式去解析oss的orc文件到hdfs 读取和写入数据是异常的 数据出现乱码和空值 有大佬告诉我这个是哪里配置问题吗?

[帮助文档] 如何使用加密文件访问RDS

EMR Hive服务默认使用明文保存密码来访问本地MySQL或RDS MySQL,但也可以使用加密文件来访问这些数据库。本文为您介绍如何使用加密文件访问RDS MySQL。

DataWorks更新或添加函数文件getregion失败,错误信息:发生MaxCompute异常?

DataWorks更新或添加函数文件getregion失败,错误信息:发生MaxCompute异常。异常错误码:InvalidParameter,异常信息:ODPS-0420031: Invalid xml in HTTP request body - Error resource format.?...

我外部表映射的文件,文件被删掉,这张表,大数据计算MaxCompute分区值还会存在是吗?

问题1:我外部表映射的文件,文件被删掉,我这张外表创建了最近七天,每天作为一个分区,我show partitions这张表,大数据计算MaxCompute分区值还会存在是吗?问题2:这些分区值没有数据,但其实作为元数据存放了。是这个意思吗?

默认文件块大小能通过什么命令查吗?在MaxCompute的odpscmd中

默认文件块大小能通过什么命令查吗?在MaxCompute的odpscmd中

MaxCompute有没有本地txt文件数据导入odps表的相关资料?

问题一:MaxCompute有没有本地txt文件数据导入odps表的相关资料?问题二:没有datawork,有除tunnel意外的方法吗?python语言写

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里巴巴大数据计算
阿里巴巴大数据计算
阿里大数据官方技术圈
347750+人已加入
加入
相关电子书
更多
Lindorm一站式车联网数据平台
Lindorm一站式AI数据平台实战
Lindorm:打造AI时代的 一体化数据平台
立即下载 立即下载 立即下载