数据重排

使用 DISTRIBUTE BY+SORT BY、CLUSTER BY 排序方法进行数据排序前请查看表中数值的分布情况,对列值占比大的列进行重排,存储优化效果会比较好。表数据越大,进行数据重排后,存储优化效果会更好。使用示例 本文将MaxCompute公共数据集TPC-...

常见问题

如何优化,请参见 如果有导出的需求,怎么做比较好数据类型设置不合理。如何优化,请参见 如何通过调整数据类型来提升查询性能?分片数设置不合理。如何优化,请参见 分片数量对查询和写入性能有什么影响?如果您的查询场景不属于以上...

离线集成概述

解决企业复杂大数据批处理难题,支持企业精细化运营、数据营销、智能推荐等大数据业务场景。离线集成功能底层基于Spark开发,支持提升Hadoop平台运行速度的应用场景。说明 如果您在使用该功能的过程中有任何疑问或问题,请使用钉钉搜索钉钉...

调试实时任务

手动输入数据 适用于采集的数据比较少,或者需要修改已采集到的数据的场景。自动抽样数据 自动抽样到的数据是随机的,所以适用于对采集到的数据没有限制的场景。针对HBase、MySQL、MaxCompute、DataHub、Kafka数据源支持自动抽样数据,您可...

调试实时任务

手动输入数据 适用于采集的数据比较少,或者需要修改已采集到的数据的场景。自动抽样数据 自动抽样到的数据是随机的,所以适用于对采集到的数据没有限制的场景。针对HBase、MySQL、MaxCompute、DataHub、Kafka数据源支持自动抽样数据,您...

确定需求

您在构建数据仓库之前,首先需要确定构建数据仓库的目标与需求,并进行全面的业务调研。您需要了解真实的业务需求,以及确定数据仓库要解决的问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功...

确定需求

您在构建数据仓库之前,首先需要确定构建数据仓库的目标与需求,并进行全面的业务调研。您需要了解真实的业务需求,以及确定数据仓库要解决的问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功...

表设计规范

数据集市的数据比较容易生成,所以无需保留久远的历史数据。按数据变更规划数据的保存方式:记录客户属性、产品属性的历史变化情况,以便追溯某个时点的值。在事实表里冗余维表的字段,即把事件发生时的各种维度属性值与该事件绑定起来。...

确定需求

本教程中,假设用户是电商营销部门的营销数据分析师。数据需求为最近一天某个商品类目(例如厨具)在各省的销售总额、该类目销售额Top10的商品名称、各省用户购买力分布(人均消费额)等,用于营销分析。最终的业务需求是通过营销分析完成...

明确统计指标

确定指标 本教程中,用户是A公司电商营销部门的营销数据分析师。数据需求为最近一天厨具类目的商品在各省的销售总额、该类目销售额前10的商品名称、各省用户购买力分布(人均消费额)等,用于营销分析。基于规范定义,确认业务过程为确认收...

导入数据字典

为了创建完整的字段标准,需要先完善数据字典的管理,创建好数据字典后,可以用来规范数据标准字段的值域范围,保证关联了字段标准的表及字段可以自动设置数据质量规则,规范数据质量。通过导入数据字典可以实现批量创建数据字典。本文介绍...

导入数据字典

为了创建完整的字段标准,需要先完善数据字典的管理,创建好数据字典后,可以用来规范数据标准字段的值域范围,保证关联了字段标准的表及字段可以自动设置数据质量规则,规范数据质量。通过导入数据字典可以实现批量创建数据字典。本文介绍...

新建数据

数据同步前,需要准备好数据源作为数据源端或目标端。您可以通过新建数据源,供数据同步时使用。本文介绍如何新建数据源。背景信息 数据同步支持关系型数据库、文件、消息队列等类型数据源的配置。操作步骤 登录 数据资源平台控制台。在...

新建数据

数据同步前,需要准备好数据源作为数据源端或目标端。您可以通过新建数据源,供数据同步时使用。本文介绍如何新建数据源。背景信息 数据同步支持关系型数据库、文件、消息队列等类型数据源的配置。操作步骤 登录企业数据智能平台。在页面...

引擎简介

典型场景 大数据场景:海量数据存储与分析 广告场景:海量广告营销数据的实时存储 金融&零售:海量订单记录与风控数据的实时存储 车联网:车辆轨迹与状况数据的高效存储处理 互联网社交:高效、稳定的社交Feed流信息存储 访问方式 通过...

DataWorks数据服务对接DataV最佳实践

前提条件 要想实现DataWorks数据服务与DataV的对接,您需要提前准备好数据源,并开通 什么是DataV数据可视化。新建数据源 数据服务支持丰富的数据源类型,如下所示:关系型数据库:RDS、DRDS、MySQL、PostgreSQL、Oracle和SQL Server 分析...

什么是DataWorks

阿里云上发展历程 2015年DataWorks正式上云,将多年沉淀的大数据建设方法论产品化输出,服务阿里云上客户,通过不断迭代的产品能力,DataWorks正在与各行各业的客户与合作伙伴一起,通过全链路数据治理,管得好数据、用得好数据,让数据从...

一键创建OSS数据仓库

配置好数据源后,单击 测试连接,进行连通性测试。建仓配置 Schema名称 设置Schema的名称,即RDS、PolarDB for MySQL、MongoDB数据库或者ECS自建数据库在DLA中的映射数据库名称。数据位置 建仓时,RDS、PolarDB for MySQL、MongoDB数据库...

应用场景

广告场景:海量广告营销数据的实时存储 使用Lindorm存储广告营销中的画像特征、用户事件、点击流、广告物料等重要数据,提供高并发、低延迟、灵活可靠的能力,帮助您快速构建实时竞价、广告定位投放等系统服务。优势 低延迟:单个毫秒响应...

资源组操作及网络连通

如果您使用VPC连接地址添加的数据源:请确认您已经为独享数据集成资源组绑定好数据库所在的VPC。已经将独享数据集成资源组绑定的交换机网段添加至数据库白名单。详情请参见:使用独享数据集成资源组执行任务需要在数据库添加的IP白名单。...

新建 ADB 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建云原生数据仓库 AnalyticDB MySQL 版(简称 ADB)数据源。背景信息 ADB 的基本介绍请参见 基础数据类型。ADB 的建表、分区表和分布表的详情请参见 ...

新建 PolarDB-X 2.0 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 PolarDB-X 2.0 数据源。背景信息 云原生数据库 PolarDB 分布式版(简称 PolarDB-X)是由阿里巴巴自主研发的云原生分布式数据库,为您提供高吞吐、大...

新建 Oracle 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 Oracle 数据源。操作步骤 登录 OceanBase 管理控制台。在左侧导航栏,单击 数据传输>数据源管理。在 数据源列表 页面,单击右上角的 新建数据源。在 ...

新建 MySQL 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输新建 MySQL 数据源。操作步骤 登录 OceanBase 管理控制台。在左侧导航栏,单击 数据传输>数据源管理。在 数据源列表 页面,单击右上角的 新建数据源。在 新建...

新建 DataHub 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 DataHub 数据源。操作步骤 登录 OceanBase 管理控制台。在左侧导航栏,单击 数据传输>数据源管理。在 数据源列表 页面,单击右上角的 新建数据源。在 ...

新建 PolarDB-X 1.0 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 PolarDB 数据源。背景信息 PolarDB-X 1.0 是由阿里巴巴自主研发的 PolarDB 分布式版数据库,融合分布式 SQL 引擎和分布式自研存储 X-DB,基于云原生...

新建数据字典

创建好数据字典后,可以用来规范数据元、指标、维度等的值域范围。例如:我们把“研究生”、“本科”、”高中“、”小学“等这类词统一用“教育水平”这个描述词作为集合包含进去。操作步骤 登录 数据资源平台控制台。在页面左上角,单击 ...

新建数据字典

创建好数据字典后,可以用来规范数据元、指标、维度等的值域范围。例如:我们把“研究生”、“本科”、”高中“、”小学“等这类词统一用“教育水平”这个描述词作为集合包含进去。操作步骤 登录企业数据智能平台。在页面左上角,单击 图标...

新建 Kafka 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 Kafka 数据源。使用限制 数据传输仅支持 Kafka 数据源作为数据同步的目标端。背景信息 数据传输的安全问题,贯穿服务连通性验证、链路创建和数据传输...

元数据采集

当您需要采集已开启白名单访问控制的数据源的元数据时,则需要提前配置好数据库的白名单权限。详情请参见 元数据采集的数据源有白名单访问控制时需要配置的白名单。DataWorks目前不建议跨地域采集元数据,即DataWorks所在的地域需要与数据...

新零售:杭州数云信息技术有限公司

PolarDB 采用存储和计算分离的架构,提供分钟级的配置升降级、秒级的故障恢复、全局数据一致性和免费的数据备份容灾服务,既融合了商业数据库稳定可靠、高性能、可扩展的特征,又具有开源云数据库简单开放、自我迭代的优势。本文介绍杭州...

客户案例

数据处理能力:随着阿里巴巴集团业务的高速发展,推广营销在商业引流上的重要性越发明显,报表作为营销产品的闭环,其诉求也越发的多样化、个性化,报表数据在近几年的发展中在量级上已经增长到TB甚至数十 TB 的规模。这个时候存储系统的...

文档更新动态(2023年)

更新说明 创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成配置优化 新增Apache Doris数据源的离线集成。...

功能更新动态(2023年)

创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成 新增Apache Doris数据源的离线集成。整库迁移任务支持...

水印使用限制

尽量选取数据取值比较多样的列嵌入水印,如果该列的值是可枚举穷尽的,则有可能因为特征不够导致提取失败。常见的适合嵌入水印的列如地址、姓名、UUID、金额、总数等,不适合嵌入水印的列如性别、状态等。嵌入水印后的数据会与原始值有差异...

数据库迁移

说明 如果存在不一致数据,可单击 查看详情 查看不一致的概览信息,在概览信息对话框中单击 详情 查看不一致的具体数据:如果数据比较少,可以通过手动修改的方式同步数据,如果数据比较大,查明数据不一致的原因,清理目标数据库后...

数据加密

可信执行环境依赖Intel SGX 安全增强型规格提供对密文数据进行比较和其它常见计算,具体规格清单请参见 RDS PostgreSQL主实例规格列表。其它规格(非Intel SGX 安全增强型规格):全密态功能可以利用密码学方法提供数据安全保护,此时其...

数据加密

可信执行环境依赖Intel SGX 安全增强型规格提供对密文数据进行比较和其它常见计算,具体规格清单请参见 RDS PostgreSQL主实例规格列表。其它规格(非Intel SGX 安全增强型规格):全密态功能可以利用密码学方法提供数据安全保护,此时其...

数据加密

可信执行环境依赖Intel SGX 安全增强型规格提供对密文数据进行比较和其它常见计算,具体规格清单请参见 RDS PostgreSQL主实例规格列表。其它规格(非Intel SGX 安全增强型规格):全密态功能可以利用密码学方法提供数据安全保护,此时其...

DB2数据

DB2数据源作为数据中枢,为您提供读取和写入DB2数据库的双向通道,能够快速解决海量数据的计算问题。本文为您介绍DataWorks的DB2数据同步的能力支持情况。支持的版本 DB2 Reader和DB2 Writer使用的DB2驱动版本为 IBM Data Server Driver ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用