Iceberg连接器

Iceberg是一种开放的数据湖表格式,使用Iceberg连接器可以用来查询Iceberg格式数据文件。背景信息 Iceberg的详细信息,请参见 Iceberg概述。本文为您介绍Iceberg连接器相关的内容和操作,具体如下:配置Iceberg连接器 示例:查询Iceberg...

存储格式与SerDe

DLA内置了处理各类数据文件的Serialize/Deserilize(简称SerDe,用于序列化和反序列化),您无需编写程序,直接选用一款或多款SerDe来匹配OSS上的数据文件格式。通过SerDe,DLA可以对OSS上的多种格式的文件进行查询分析,包括纯文本文件...

功能特性

挂载DBFS 卸载DBFS 从ECS云服务器上卸载数据文件存储 卸载DBFS 扩容DBFS 支持业务友好地在线扩充存储容量 在线扩容 格式化DBFS 格式数据文件存储操作会清空已写入的数据,建议操作前创建快照备份数据文件存储数据-重命名DBFS ...

整体架构

Transaction Table2.0的增量存储和处理架构的特殊设计主要集中在五个模块:数据接入、计算引擎、数据优化服务、元数据管理、数据文件组织,其他部分与MaxCompute通用的架构一致。本文为您介绍Transaction Table2.0的核心架构要点。...

准备工作

数据文件(点文件和边文件)导入至图数据库GDB实例前,您需要先准备好需要导入的数据文件、获取导入过程中使用到的实例信息等,使导入操作更加流畅。前提条件 已创建图数据库GDB实例,创建方法请参见 创建实例。已创建Bucket,创建方法请...

基于OSS外表的单表多文件查询

一般情况下,OSS外表存储的数据是冷数据,数据量比较大,当单个CSV格式数据文件过大时,对其进行查询会非常耗时。因此 PolarDB 支持单表多文件查询功能,您可以将单个OSS外表的数据文件拆分为多个小的数据文件,以加快查询速度。本文介绍...

导入数据并查询

本文以数据文件存储在OSS中为例,介绍如何将OSS中的数据文件导入 AnalyticDB for MySQL 的 adb_demo 数据库中并进行查询。前提条件 通过以下步骤在OSS中创建存储 AnalyticDB for MySQL 数据的目录。开通OSS服务。详情请参见 开通OSS服务。...

UNLOAD

导出的开源格式文件不支持添加后缀名。注意事项 UNLOAD命令本身不计费,UNLOAD命令中的查询子句需要扫描数据并使用计算资源计算结果,因此查询子句按照普通SQL作业计费。通过OSS存储结构化数据在一些场景中可以节省存储费用,但需要提前...

UNLOAD

导出的开源格式文件不支持添加后缀名。注意事项 UNLOAD命令本身不计费,UNLOAD命令中的查询子句需要扫描数据并使用计算资源计算结果,因此查询子句按照普通SQL作业计费。通过OSS存储结构化数据在一些场景中可以节省存储费用,但需要提前...

备份集查询功能概览

通过 Hive 的方式直接对文件进行查询,但是这种方式对数据文件格式有严格的要求,且技术成本较高。数据库备份服务DBS提供了云上备份数据查询功能,您只需要简单的SQL语句,即可查询到您的备份数据,且备份数据不会被修改,该功能只针对查询...

从OSS导入数据

说明 进入点文件和边文件网页后,单击右键,然后单击 另存为保存为CSV格式文件。您也可以使用其它数据进行导入测试,图数据库GDB对CSV数据的文件格式有要求,具体要求,请参见 CSV数据文件格式。上传数据至OSS 以下内容为通过OSS控制台上传...

使用DataWorks(离线与实时)

场景2:导入本地文件至MaxCompute 同步能力说明 当前支持将 CSV 和 自定义文本文件 两种格式文件数据导入MaxCompute,其中 自定义文本文件 支持.txt、.csv 和.log 类型的文件。操作入口与通用操作指导 登录 DataWorks控制台,单击左侧导航...

概述

数据源作为脚本文件或输出文件的输入数据,其中:自定义Topic数据是设备上报的原始数据格式.物模型属性上报Topic的数据格式,请参见 设备属性上报.数据服务中数据解析后数据格式为JSON格式。API数据:指通过开放接口 ImportDTData 来触发...

数据湖管理FAQ

OSS存储CSV格式文件时,为什么OSS元数据发现不出任何表?OSS存储CSV格式文件时,为什么OSS元数据发现的字段类型不对?OSS元数据发现,是否支持CSV文件第一行是说明,第二行是文件头,第三行才是数据?多库合并/一键建仓相关问题 如何处理一...

Catalog概述

数据文件以不同的格式存储在分布式文件系统或对象存储系统中。当FE将生成的查询计划分发给各个BE后,各个BE会并行扫描Hive存储系统中的目标数据,并执行计算返回查询结果。查询数据 查询内部数据 如果需要查询存储在StarRocks中的数据,请...

Catalog概述

数据文件以不同的格式存储在分布式文件系统或对象存储系统中。当FE将生成的查询计划分发给各个BE后,各个BE会并行扫描Hive存储系统中的目标数据,并执行计算返回查询结果。查询数据 查询内部数据 如果需要查询存储在StarRocks中的数据,请...

数据格式

本文为您介绍Transaction Table2.0的表数据格式详情。Transaction Table2.0的表关键属性 您可以在执行建表命令Create Table时设置Transaction Table2.0的关键属性:primary key(PK)及 tblproperties("transactional"="true")。primary key...

使用MaxCompute控制台(离线)

仅支持上传一个CSV文件或XLSX文件:CSV文件:最大支持上传5 GB数据文件里的数据以半角逗号(,)分隔。XLSX文件:最大支持上传100 MB数据。默认仅上传XLSX文件中首个Sheet页的数据,如果有多个Sheet,则其他Sheet的数据将被忽略。阿里云...

使用OSS Foreign Table导出数据

支持的文件格式 OSS FDW目前仅支持导出如下格式数据文件:支持导出CSV、TEXT格式的非压缩文本文件。支持导出CSV、TEXT格式的GZIP压缩文件。支持导出ORC格式的二进制文件。关于ORC与 AnalyticDB PostgreSQL版 的数据类型的区别,请参见 ...

Parquet

Parquet是Apache开源项目Hadoop支持的一种列存储文件格式,同一份数据以ORC格式和Parquet格式存储时,其数据扫描性能要优于普通文本CSV格式。本文介绍如何在DLA中为Parquet类型的文件创建表。前提条件 请参见文档 文件格式转换,准备...

数据下载

在DataWorks的数据开发(DataStudio)、数据分析、安全中心模块下载的CSV、XLSX格式文件数据将同步保存至数据下载功能。通过该功能,您可将所需历史下载文件重新下载至本地使用,也可追溯历史下载记录的操作详情。前提条件 已通过如下模块...

数据归档常见问题

数据文件格式是什么?目前支持CSV、IBD 和ORC格式。如何判断当前表或分区是否归档成功?归档完成后,您可以通过以下两种方式来查看表或分区是否归档成功:执行 SHOW CREATE TABLE table_name;命令查看表结构信息,以此来确认表或者分区...

CSV数据文件格式

本文介绍需要导入至图数据库GDB实例的CSV数据文件格式。背景信息 CSV数据文件遵循RFC 4180 CSV规范。更多信息,请参见 CSV文件的一般格式和MIME类型。重要 所有文件必须采用UTF-8格式编码。注意事项 必须将点和边分别放到单独的文件。说明 ...

Tunnel命令常见问题

使用Tunnel Upload命令上传数据时,需要上传很多数据文件到一个表中,是否有方法写一个脚本就可以把文件夹下的所有数据文件上传上去?使用Tunnel Upload命令上传数据时,如何实现批量上传一个目录下的多个文件到同一张表,并且每个文件放在...

Hive连接器

背景信息 Hive数仓系统由以下三部分内容组成:不同格式数据文件,通常存储在Hadoop分布式文件系统(HDFS)或对象存储系统(例如,阿里云OSS)中。存储数据文件到Schema和Table映射的元数据。该元数据存储在数据库(例如,MySQL)中,并...

版本发布记录

深度集成的生态 接入融合分析和数据回流能力 目前支持如下数据源的接入融合分析和数据回流能力,包括对象存储OSS上7种以上结构化、半结构化、以及多种压缩格式数据文件,表格存储,AnalyticDB,云数据库版或自建数据库(MySQL、...

Hudi概述

Merge On Read 使用列式文件格式(Parquet)和行式文件格式(Avro)混合的方式来存储数据。Merge On Read使用列式格式存放Base数据,同时使用行式格式存放增量数据。最新写入的增量数据存放至行式文件中,根据可配置的策略执行COMPACTION...

入门概述

通过NFSv3协议访问CPFS文件系统 协议服务 在服务器中卸载挂载的文件系统 卸载文件系统 删除文件系统 删除文件系统 与对象存储OSS之间实现数据流动 数据流动 监测文件的使用量 数据监控 备份文件系统中的数据 文件存储CPFS(NFS协议)备份 ...

数据导入概览

从阿里云对象存储OSS导入数据至图数据库GDB实例 图数据库GDB服务端集成有数据导入模块,可以获取您提供的.csv格式的OSS数据文件,并将其解析为图中的点数据和边数据,然后将点数据和边数据导入至图数据库GDB实例。步骤 步骤说明 ① 将需要...

通过控制台投递数据到OSS

通过表格存储控制台创建投递任务,将表格存储数据表中的数据投递到OSS Bucket中存储。前提条件 已开通OSS服务且在表格存储实例所在地域创建Bucket,详情请参见 开通OSS服务。说明 数据湖投递支持投递到和表格存储相同地域的任意OSS Bucket...

引擎简介

Lindorm文件引擎是面向海量非结构化数据的分布式文件存储服务,与多模引擎共享存储,LindormDFS支撑,充分利用了对象存储的低成本与高可靠、块存储的高性能等优势,并通过高低速分层存储、副本共享去重、智能冷热转存等技术,面向用户提供...

数据归档至专属存储

本文为您介绍如何将数据归档至专属存储中(存储在 DMS)、将专属存储数据转存至OSS,以及删除归档至专属存储数据等操作。前提条件 源数据库类型为:MySQL:RDS MySQL、PolarDB MySQL版、AnalyticDB MySQL 3.0。说明 MySQL数据库账号...

ORC文件

ORC是为Hadoop作业而设计的自描述,类型感知的列存储文件格式。它针对大型流式数据读取进行了优化,但集成了对快速查询所需要行的相关支持。ORC和Parquet文件格式的区别:本质上Parquet针对Spark进行了优化,而ORC针对Hive进行的优化。前提...

计费常见问题

已购通用型NAS资源包容量 例如,您领取了一个通用型NAS资源包(50 GiB,3个月),在一个计费周期内,您账号下的容量型NAS文件系统A实际存储数据100 GiB,那么在这个计费周期内文件系统A先使用资源包抵扣50 GiB,超出的50 GiB存储容量将按量...

增量备份数据上云(SQL Server 2008 R2云盘、2012及...

您需要先将全量备份文件上传至阿里云的对象存储服务(OSS),并通过RDS控制台将全量备份数据恢复至指定的RDS SQL Server数据库中。然后通过RDS控制台将差异备份或日志备份文件导入该RDS SQL Server数据库中,以实现增量备份上云的效果。该...

配置Hive输出组件

根据Hive中数据存储格式不同,支持选择压缩格式不同:数据存储格式为 orc:支持选择的压缩格式包括 zlib、snappy。数据存储格式为 parquet:支持选择的压缩格式包括 snappy、gzip。数据存储格式为 textfile:支持选择的压缩格式包括 gzip、...

OSS数据

支持的字段类型与使用限制 离线读 OSS Reader实现了从OSS读取数据并转为数据集成协议的功能,OSS本身是无结构化数据存储。对于数据集成而言,OSS Reader支持的功能如下。支持 不支持 支持且仅支持读取TXT格式文件,且要求TXT中schema为...

概述

归档后的数据格式会转变为CSV或ORC格式并分成多个文件存储在OSS上,PolarStore中的这部分数据会被自动删除,存储费用也会随着存储空间容量的降低而减少。说明 冷数据归档完成后,PolarStore中的原表会转变为OSS上的归档表,归档表不支持...

数据写入OSS

更多OSS存储空间、OSS目录、上传数据文件操作信息,请参见 创建存储空间、创建目录 和 上传文件。示例:通过内置文本数据解析器将数据写入OSS-非分区路径 读取 示例:通过内置文本数据解析器创建OSS外部表-非分区表 中创建的OSS外部表mc_...

敏感数据溯源

说明 例如,您查询表A之前未开启 数据水印 功能,此时,即使您开启了 数据水印 功能并启动对该数据文件的溯源任务,仍然无法通过 数据溯源 功能溯源到此次查询操作。创建并执行数据溯源任务 进入数据保护伞。在左侧导航栏,单击 数据溯源,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库文件存储 文件存储 CPFS 对象存储 云数据库 RDS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用