在数据库备份场景下,有4个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量。数据量 说明 数据库磁盘空间 由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲空间组成。说明 RDS中为:购买时选择的存储...
如果需要收缩一个SQL Server的数据文件,必须使用 DBCC SHRINKDATABASE 命令收缩指定数据库的指定数据或日志文件大小,或者使用 DBCC SHRINKFILE 命令收缩当前数据库的指定数据或日志文件大小。MySQL表的空间是独立的一个文件,所以收缩...
如果需要收缩一个SQL Server的数据文件,必须使用 DBCC SHRINKDATABASE 命令收缩指定数据库的指定数据或日志文件大小,或者使用 DBCC SHRINKFILE 命令收缩当前数据库的指定数据或日志文件大小。MySQL表的空间是独立的一个文件,所以收缩...
本文为您介绍使用Tunnel命令过程中的常见问题。问题类别 常见问题 Tunnel Upload Tunnel Upload是否支持通配符或正则表达式?Tunnel Upload对文件大小是否有限制?记录大小是否有限制?...导入文件夹中的文件数据时,提示字段不匹配,但是...
在安全合规或静态数据加密等场景下,推荐使用透明数据加密TDE(Transparent Data Encryption)功能,对数据文件执行实时I/O加密和解密,确保敏感数据在写入磁盘之前进行加密,从磁盘读入内存时进行解密,阻止可能的攻击者绕过数据库直接从...
数据资产:数据资源平台中存在大量的数据表、标签、API等各类数据资产,数据管理者通过数据汇聚、数据治理、数据分析后,需要对整个平台数据进行统一管控,了解平台的核心数据资产,提供对应的数据资产管理规范。统一服务 应用:是调用API...
大Key和热Key产生的原因 未正确使用Redis、业务规划不足、无效数据的堆积、访问量突增等都会产生大Key与热Key,如:大key 在不适用的场景下使用Redis,易造成Key的value过大,如使用String类型的Key存放大体积二进制文件型数据;...
大Key和热Key产生的原因 未正确使用 Tair 命令、业务规划不足、无效数据的堆积、访问量突增等都会产生大Key与热Key,如:大key 在不适用的场景下使用 Tair,易造成Key的value过大,如使用String类型的Key存放大体积二进制文件型数据;...
当您需要将大批量数据导入至数据库时,可以使用数据管理DMS提供的数据导入功能,导入SQL、CSV、Excel类型的文件。前提条件 数据库类型如下:关系型数据库 MySQL:RDS MySQL、PolarDB MySQL版、MyBase MySQL、PolarDB分布式版、AnalyticDB ...
子查询多阶段执行 类似,Merge作业也是作为一个单独的 tab 页显示,自动合并小文件多出来的Merge Task,虽然会增加当前作业整体执行时间,但是会让结果表在合并后产生的文件数和文件大小更合理,从而避免对文件系统产生过大压力,也使得表...
本文介绍PolarDB PostgreSQL版时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级网格分解成高层级...
本文介绍PolarDB PostgreSQL版(兼容Oracle)时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级...
举一个简单的例子,假设一张表包含10个表文件,对于表中的x列,它的取值为[1,10],如果每个表文件的x列的分布均为[1,10],则对于查询条件:where x,无法跳过任何一个表文件,因此,也无法实现性能提升,而如果每个表文件的min-max均为0,...
4.1 性能优化 增强 ST_ImportFrom 函数,增加OSS文件映射为内存文件功能,提升数据导入速度。GisT索引 和 TrajGisT索引 新增算子族trajgist_ops_multi,用于多外包框索引键值。新增矢量金字塔支持元数据信息查询。Bug修复 修复轨迹对象执行...
本文介绍 PolarDB PostgreSQL版(兼容Oracle)的产品功能动态,分别为内核小版本、控制台、时空数据库和API的更新说明。说明 您可通过如下语句查看 PolarDB PostgreSQL版(兼容Oracle)的内核小版本的版本号:show polar_version;2020年12...
本文为您介绍如何查看单个数据库文件系统所有快照的容量。前提条件 您已经为某个文件系统至少创建过一份快照。具体操作,请参见 创建快照。根据快照链查看快照容量 快照链是一个数据库文件系统中所有快照组成的关系链,一个文件系统对应一...
快照链是一个数据库文件系统中所有快照组成的关系链。一个数据库文件系统(以下简称文件系统)对应一条快照链,快照链有以下信息:快照容量:快照链中所有快照占用的存储空间。快照个数:文件系统当前快照数量。每个文件系统最多只能创建...
当 odps.sql.groupby.skewindata=true 打开时,使用SQL写入数据,数据比较分散,压缩比较小。如果希望数据的压缩比较高,您可以在使用SQL写入数据时进行局部排序。使用GROUP BY分组查询100亿条数据会不会影响性能?GROUP BY对数据量有没有...
无 通过LOAD DATA导入本地数据 修复通过LOAD DATA将本地数据导入 数仓版(3.0)时,CSV格式文件不兼容、数据错乱分割的问题。无 冷数据存储 修复冷数据存储的问题,提升查询的命中率及查询性能。无 2023年11月 数仓版 类别 名称 说明 相关...
小文件指的是 10 MB 以上,128 MB 以下大小的文件。tinyFileCount:极小文件个数。极小文件指的是 0 MB 以上,10 MB 以下大小的文件。emptyFileCount:空文件个数。空文件指的是 0 MB 大小的文件。largeFileRatio:大文件个数占比。大文件指的...
Linux发行版 下载 Ubuntu 22.04(x64)ossfs_1.91.2_ubuntu22.04_amd64.deb Ubuntu 20.04(x64)ossfs_1.91.2_ubuntu20.04_amd64.deb Ubuntu 18.04(x64)ossfs_1.91.2_ubuntu18.04_amd64.deb Ubuntu 16.04(x64)ossfs_1.91.2_ubuntu16.04_amd64....
云原生内存数据库Tair 内存型(简称内存型)适合并发量大、读写热点多、高性能场景,内存型重点增强了多线程性能并集成多个自研扩展数据结构。购买方式 创建实例 主要优势 类别 说明 兼容性 100%兼容原生Redis,无需修改业务代码,提供 ...
温数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据的数据量大小。冷数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据的数据量大小。极冷数据指的是 90 日以内...
RDS SQL Server支持自动备份和手动备份两种方式,您可以通过设置备份策略调整RDS数据备份和日志备份的周期实现自动备份,或手动备份数据。备份功能说明 数据备份 备份方式 功能说明 物理备份 支持全量物理备份和增量物理备份,暂不支持逻辑...
RDS MySQL支持全量备份导入功能,可以将对象存储OSS中的MySQL备份数据导入至RDS,并恢复至新实例。前提条件 使用的阿里云账号为主账号。自建数据库符合上云条件。更多信息,请参见 附录5:使用限制。已在目标地域创建了OSS Bucket。如未...
此外MaxCompute写入到OSS外部表的数据,会存储在LOCATION目录下的.odps 文件夹中,并维护了一个.meta 文件,用于保证MaxCompute数据的一致性。odps 文件夹中的内容只有MaxCompute能正确处理,其他引擎读取可能报错。MaxCompute新增 odps....
数据同步过程中,可以修改源表中的字段类型,目前仅支持整型数据类型之间、浮点数据类型之间的列类型更改,并且只能将取值范围小的数据类型更改为取值范围大的数据类型,或者将单精度数据类型更改为双精度数据类型。整型数据类型:支持...
索引碎片率统计的是逻辑上相邻的索引页在物理位置上不一致的比例,和索引页中的空闲空间比例不是一个概念,只是碎片率较高的索引大概率也是可回收空间比例较大的索引。如果需要分析某个索引的页内平均空闲空间比例,可以使用SAMPLED或...
Hive文件大小分布Top信息提供以下数据:Hive库空文件个数Top Hive库极小文件个数Top Hive库小文件个数Top Hive库中等文件个数Top Hive库大文件个数Top 说明 Hive小文件会导致NameNode压力以及分片问题,大量的小文件会严重拖累计算流程,...
如何通过OSS外部表将多个小文件输出为一个文件?性能问题 基于外部表执行SQL作业时,运行慢,如何解决?自定义Extractor在读取非结构化数据时,如果数据字段存在DATETIME类型,报错ODPS-0123131,如何解决?问题现象 自定义Extractor在读取...
支持导出ORC格式的二进制文件。关于ORC与 AnalyticDB PostgreSQL版 的数据类型的区别,请参见 ORC文件数据类型对照表。创建OSS Server和创建OSS User Mapping 使用OSS FDW前您需要提前创建OSS Server以及OSS User Mapping。创建OSS Server...
结构 说明 table files 表文件,由一个或多个数据文件组成,文件数量与文件大小有关,超过1 GB就会生成一个新的数据文件。file 数据文件,由多个数据块组成。page 数据块,由多个数据行组成。page header 数据块头,详细信息请参见 数据...
日志数据格式复杂,不利于直接分析 ActionTrail中保存的是JSON格式的数据,一行内有多条数据,数据以一个Array的形式保存,例如[{"eventId":"event0".},{"eventId":"event1".}]。理论上可以分析上述格式的JSON数据,但非常不便,需要先把每...
Top导入热表潜在小文件分析 针对表级别的数据导入情况,系统将会对每个表的所有导入任务生成的数据文件进行深入分析,以评估其潜在的小文件问题严重程度,并据此计算出一个影响得分。根据该得分从高至低排序,选出Top 20个受小文件问题影响...
当客户端应用使用“扩展查询”协议发出一个 FETCH 命令,绑定协议消息会指定使用文本还是二进制格式检索数据。这种选择会覆盖定义游标时指定的方式。因此,在使用扩展查询协议时,这样一个二进制游标的概念实际是被废弃的—任何游标都可以...
COPY TO 把一个表的内容复制 到 一个文件,而 COPY FROM 则从一个文件复制数据到一个表(把数据追加到表中原有数据)。COPY TO 也能复制一个 SELECT 查询的结果。如果指定了一个列列表,COPY TO 将只把指定列的数据复制到文件。对于 COPY ...
分拆计算,把一个大SQL拆成多个小SQL。文件格式是ORC,为什么看扫描量是扫描了整个文件,而不是只扫描SQL里面指定的列?分析型的查询往往只会获取一个表里面少数几列的数据,这样执行引擎比如Presto在实际扫描底层数据的时候只需要扫描需要...
此处的有效数据不包括由于类型转换错误等数据质量问题而被过滤的数据,数据质量问题可以参见 数据导入常见问题。MySQL和HTTP协议 StarRocks提供MySQL协议和HTTP协议两种访问协议接口来提交作业。Broker Load Broker导入,即通过部署的...
背景信息 在海量大数据场景下,一张表中的部分业务数据随着时间的推移仅作为归档数据或者访问频率很低,同时这部分历史数据体量非常大,比如订单数据或者监控数据,降低这部分数据的存储成本将会极大的节省企业的成本。因此,如何以极简的...
为了更好地满足各种不同的业务场景,StarRocks支持多种数据模型,StarRocks中存储的数据需要按照特定的模型进行组织。本文为您介绍数据导入的基本概念、原理、系统配置、不同导入方式的适用场景,以及一些最佳实践案例和常见问题。背景信息...