发展历程

深度参与和推动全球大数据领域标准化建设 MaxCompute代表阿里巴巴计算平台,成为国际TPC(Transaction Processing Performance Council)委员会大数据评测标准BigBench的委员会委员,是中国担任此国际性能标准化测试组织委员的唯一企业。...

计费常见问题

通过DataWorks执行补数据操作后,为什么费用产生较波动?通过DataWorks将调度任务的调度周期从天改为小时后,为什么费用增加?运行全表扫描后,为什么费用增加?下载费用 通过ECS云主机使用内网从MaxCompute下载数据,收取流量费用...

大数据安全治理的难点

大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,难免出现遗漏的...

常见问题

所以您只需要会使用SQL、Python、Java等开发语言就可以使用MaxCompute进行数据分析。如何理解开源与云原生的大数据技术与产品?推荐您阅读 从开源到云原生,你不得不知的大数据实战。MaxCompute作为大数据平台,对业务数据是否有好的监控...

索引优化

大数据集场景下优先考虑稀疏索引:如果您的数据量非常地大,并且您的查询限定条件为<、、=、>=、>,需要大数据量的表中取出少于50%的数据,那么使用稀疏索引(BRIN Index或者AOCS表的metascan)可以极地减少无效数据的加载。...

常见问题

什么会触发主备切换?如何获取requestId 如何导入Redis数据 从节点数据为什么与其主节点不同步?集群架构实例变配后,数据会自动均衡吗?Redis标准架构升级至集群架构后需要修改代码吗?如何查询Key在哪个数据节点和Slot 为什么云原生版...

JindoFS介绍和使用

JindoFS是基于阿里云对象存储OSS,为开源大数据生态构建的Hadoop兼容文件系统(Hadoop Compatible File System,HCFS)。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS...

数据加工过程卡点校验

为保障线上数据的准确性,每次变更都需要经过测试再发布到线上生产环境,且生产环境测试通过后才算发布成功。任务变更或数据重跑。在进行更新操作前,需要通知下游变更原因、变更逻辑、变更时间等信息。下游对此次变更没有异议后,再按照...

常见问题

实时同步MySQL数据源时速度为什么会变慢?实时同步中选择单库与选择多库的内存占用模式为什么会有差异?实时同步任务DDL策略有哪些?实时同步MySQL数据常见问题 实时同步MySQL数据源的数据时,一开始读到数据,一段时间后无法读到数据,...

什么是数据库自治服务DAS

数据库是所有企业业务的基座,企业内的研发、测试、运营和运维人员每天都需要数据库进行操作或者查询,但是使用数据库的人员对数据库的了解程度参差不齐,所以数据库的稳定性不断受到如下问题的挑战。视频简介 数据库运维和管理的挑战 ...

常见问题

ClickHouse每次写入都会生成一个data part,如果每次写入一条或者少量的数据,那造成ClickHouse内部有大量的data part(给merge和查询造成很的负担)。为了防止出现大量的data part,ClickHouse内部做了很多限制,这就是too many ...

常见问题

支持的数据库部署位置(接入方式)阿里云实例 有公网IP的自建数据库 通过数据库网关DG接入的自建数据库 通过云企业网CEN接入的自建数据库 ECS上的自建数据库 通过专线/VPN网关/智能接入网关接入的自建数据库 阿里云实例 通过数据库网关DG接...

按时间戳冷热分离

注意事项 若某一行数据同时包含热数据和冷数据,例如更新了部分列导致一行数据中既存在热数据又存在冷数据的场景,开启查询热数据优先功能导致该行的查询结果分两次返回,即Scanner返回的Result集合中,对于同一个Rowkey有两个对应的...

执行补数据并查看补数据实例(旧版)

注意事项 实例运行相关 当补一个区间的数据时,在启动补数据的第一天存在一个运行失败的实例,则当天的补数据实例被置为失败状态,第二天的实例也不会启动运行(只有当天的全部任务实例成功,第二天的任务实例才开始运行)。...

实时同步常见问题

实时同步MySQL数据源时速度为什么会变慢?实时同步中选择单库与选择多库的内存占用模式为什么会有差异?实时同步任务DDL策略有哪些?写入目标数据源时,对源端DDL及DML操作的注意事项 源表有默认值,通过数据集成创建的目标表,默认值、...

DML操作常见问题

当多个作业同时处于元数据提交阶段时,每个作业都需要对单表表上的元数据加锁、写入、再解锁。如果同时多个作业写入,该表元数据总是处于加锁写入的状态,可能出现部分作业在尝试加锁超时之前一直没有抢到锁,从而导致报错 cannot acquire ...

离线同步常见问题

数据同步原则:来源端数据源的数据要能写入目的端数据源(来源端和目的端类型需要匹配,字段定义的大小需要匹配),即源端数据类型需要与写端数据类型匹配,源端是VARCHAR类型的数据不可写到INT类型的目标列中;目标端的数据类型定义的大小...

配置跨库Spark SQL节点

在线业务产生大量的数据,当需要对这些数据进行加工分析时,一般需要将在线业务的数据同步到专门用于数据加工和分析的数据仓库,再进行数据分析。数据仓库的数据回流到在线库,用于数据查询。在数据仓库中对数据进行加工分析后,往往需要...

Tunnel命令常见问题

使用Tunnel Upload命令上传数据时,设置了经典网络的Endpoint,但为什么会连接到外网的Tunnel Endpoint?在DataStudio上执行Tunnel Upload命令上传分区数据时报错,如何解决?使用Tunnel Upload命令上传数据时,如果数据中有回车或空格,为...

X-Engine简介

读操作 LSM处理多版本数据的方式是新版本数据记录追加在老版本数据后面,从物理上看,一条记录不同的版本可能存放在不同的层,在查询的时候需要找到合适的版本(根据事务隔离级别定义的可见性规则),一般查询是查找最新的数据,总是由...

常见问题

但是当需要匹配的数据量较或本身存储的字符串内容较长时,查询性能可能随着数据量的增大而降低。分词查询:数据查询时,搜索引擎先对原始字符串进行分词,再对分词字段执行关键词匹配操作,例如在通用搜索引擎产品中进行关键词检索。...

数据库代理常见问题

每个RDS实例在开通数据库代理后,可以申请1~7个代理地址,每个代理地址可以申请1个内网连接地址和外网连接地址,更多信息,请参见 新增代理连接地址。数据库代理的性能随着代理地址的增多而提升吗?不会。如果您的RDS MySQL实例为高...

分区表常见问题

如果表的数据量很,则需要在业务低峰期执行重写操作。您可以通过以下SQL语句来查询重写DDL的执行进度和预估剩余时间:SELECT pl.ID,pl.INFO,esc.THREAD_ID,esc.EVENT_NAME,(esc.WORK_COMPLETED/esc.WORK_ESTIMATED)*100 as PROGRESS,pl....

SmartData常见问题

Hortonworks版本(Hortonworks Data Platform,简称HDP)和Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)可以使用,但可能存在冲突,需要修改配置 fs.oss.impl=JindoOssFileSystem。JindoFS可以在ECS自...

数据风险点监控

因此,哪些数据需要配置DQC规则、应该配置什么规则,也需要根据数据资产等级来确定。例如A1、A2类数据监控率要达到90%以上,规则类型需要3种以上,而不重要的数据资产没有强制要求。检测规则由离线开发人员配置,确保数据准确性。不同的...

PolarDB PostgreSQL版(兼容Oracle)间的迁移

由于全量数据迁移并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量迁移完成后目标数据库的表存储空间比源实例的表存储空间。请确认DTS对数据类型为FLOAT或DOUBLE的列的迁移精度是否符合业务预期。DTS通过 ROUND(COLUMN,...

RDS术语

DMS Data Management,数据管理,是一种阿里云提供的图形化的数据管理工具,集数据管理、结构管理、访问安全、BI图表、数据趋势、数据轨迹、性能与优化和服务器管理于一体的数据管理服务。支持MySQL、SQL Server、PostgreSQL、MongoDB、...

RDS术语

DMS Data Management,数据管理,是一种阿里云提供的图形化的数据管理工具,集数据管理、结构管理、访问安全、BI图表、数据趋势、数据轨迹、性能与优化和服务器管理于一体的数据管理服务。支持MySQL、SQL Server、PostgreSQL、MongoDB、...

RDS SQL Server迁移至云原生数据仓库 AnalyticDB ...

数据传输服务DTS(Data Transmission Service)支持将 RDS SQL Server 的数据迁移至 云原生数据仓库AnalyticDB PostgreSQL版,帮助您轻松实现数据的传输。通过 AnalyticDB PostgreSQL版 提供的数据在线分析服务和离线数据处理功能,您可以...

跨云账号迁移云数据库Redis实例

如果源和目标库是云数据库Redis社区版或企业版,当数据库执行变配操作(如规格升级、更改端口号等)导致DTS无法获取连续的日志数据和正确的链接信息,从而导致迁移任务中断。您如果遇到此类情况,为了保证数据一致性,建议执行变配操作...

云数据库Redis间的迁移

由于全量数据迁移并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量迁移完成后目标数据库的表存储空间比源实例的表存储空间。DTS尝试恢复七天之内迁移失败任务。因此业务切换至目标实例前,请务必结束或释放该任务,或者...

RDS术语

DMS Data Management,数据管理,是一种阿里云提供的图形化的数据管理工具,集数据管理、结构管理、访问安全、BI图表、数据趋势、数据轨迹、性能与优化和服务器管理于一体的数据管理服务。支持MySQL、SQL Server、PostgreSQL、MongoDB、...

恢复全量数据

如果您拥有原实例的数据备份和日志备份,可以将其恢复到新实例中,可用于误操作后恢复以及分析历史数据等场景。前提条件 原实例需要满足如下条件:实例运行状态为 运行中 且没有被锁定。当前没有进行中的迁移任务。已完成备份。RDS默认有...

RDS术语

A AliPG 阿里云支持一系列兼容PostgreSQL的云数据库服务产品,这些云数据库服务采用统一的数据库内核(简称AliPG),AliPG兼容PostgreSQL开源数据库,于2015年正式商用,支持PostgreSQL主流版本,已稳定运行多年,支撑了大量阿里巴巴集团...

RDS术语

DMS Data Management,数据管理,是一种阿里云提供的图形化的数据管理工具,集数据管理、结构管理、访问安全、BI图表、数据趋势、数据轨迹、性能与优化和服务器管理于一体的数据管理服务。支持MySQL、SQL Server、PostgreSQL、MongoDB、...

常见问题

DAS企业版 V3超出最近7天的数据,采用的存储方式是冷数据存储,相较DAS企业版 V1数据的存储方式,数据没有全文索引等信息,并且底层采用snappy对数据进行高效压缩,所以数据量最多可降低为旧版的30%,从而极降低了存储成本。如何查看企业...

什么是数据库网关

使用指引 如果您是第一次使用数据库网关,您可以参考下述步骤开始使用:准备工作 新建数据库网关 添加数据库 为什么选择数据库网关 数据库网关提供安全可靠、低成本的数据库接入服务,通过数据库网关您可以安全且低成本地将第三方云或本地...

从自建Redis迁移至Tair实例

如果数据库业务量较或服务器规格较低,可能加重数据库压力,甚至导致数据库服务不可用。建议您在执行数据迁移前谨慎评估,在业务低峰期执行数据迁移。如果目标数据库内存不足,触发数据逐出时,由于 云原生内存数据库Tair 的默认数据...

RDS SQL Server迁移至RDS MySQL

由于全量数据迁移并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量迁移完成后目标数据库的表存储空间比源实例的表存储空间。特殊情况 源实例为RDS SQL Server时,DTS在源RDS SQL Server实例中创建一个 rdsdt_dtsacct ...

云数据库MongoDB版(分片集群架构)间的双向同步

数据传输服务DTS(Data Transmission Service)支持 云数据库MongoDB版(分片集群架构)间的双向同步,适用于异地多活(单元化)、数据异地容灾等多种应用场景。本文介绍双向数据同步的配置步骤。前提条件 已创建源和目标 云数据库MongoDB...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用