什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时...

Schema约束

强约束 传统关系数据库类似,时序引擎会严格依据预先定义的表结构对写入数据的表名、字段名、数据类型进行校验。不匹配则写入失败。弱约束 写入数据的表不存在时,时序引擎不会报错,而是会自动创建对应的表。写入数据的新增一个标签...

应用评估

应用评估用于衡量应用与数据库整体迁移改造的情况,可以展示应用需要改造的地方,并给出改造建议。前提条件 全部应用采集包都已创建应用画像。背景信息 迁移数据库和应用的过程中存在以下几个难点问题:难以估算应用改造的工作量。难以制定...

什么是图数据库GDB?

数据传统关系数据库相比的优势 传统的关系数据库和图数据库无论是在模型,存储以及查询优化上都存在极的差异。比如社交用户关系中的2度查询请求,传统关系数据库处理起来至少是秒级别的,3度查询更差甚至无法支持。对比而言...

其他问题

任务实例 周期任务周期实例、补数据实例、测试实例是什么关系?资源组 日志和实例保留多长时间?为什么不能在调度资源组上进行大数据计算?其他 如何设置任务优先级?如何查看任务优先级?周期任务周期实例、补数据实例、测试实例是...

支持的数据库类型

数据安全中心DSC(Data Security ...PolarDB O引擎 非关系数据库 MongoDB Redis 大数据 TableStore(仅政务云)MaxCompute AnalyticDB MySQL版 AnalyticDB PostgreSQL版 非结构化数据库 OSS 自建数据库 MySQL SQL Server PostgreSQL Oracle

ADAM概览

异构数据库迁移ADAM(Advanced Database&Application Migration)提供数据库平滑迁云解决方案,全面评估上云可行性、成本和云存储选型,内置实施协助、数据迁移、应用迁移等工具,覆盖数据库迁移的全生命周期,帮助企业降低数据库和应用...

全球数据库市场发展机遇

Gartner 2016年数据显示,四大厂商的关系数据库超越90%的市场规模,一度占据了商业数据市场。伴随着云数据库的兴起和发展,云计算大潮来袭,传统数据市场正面临重新洗牌,云数据库在内的一批新生力量崛起,动摇了传统数据库的垄断...

相关的云服务

DataWorks作为阿里云一站式大数据开发治理平台,通常会计算引擎产品联合使用,此外使用DataWorks进行数据集成时通常联合进行数据传输的数据源产品一起使用。本文为您介绍典型场景下,使用DataWorks时通常会使用到的其他云产品。计算...

长周期指标的计算优化方案

影响性能的问题根源是多天汇总数据量过,建议您使用构建临时表的方式对每天的数据进行轻度汇总,这样可以去掉很多重复数据,减少数据量。实验方案 构建中间表,每天汇总一次。对于上述示例,构建 item_id+visitior_id 粒度的日汇总表,记...

审计日志

自定义数据源(支持新建离线数据源和实时数据源)AddCustomDataSource 创建实时自定义数据源。UpdateCustomDataSource 更新实时自定义数据源。DeleteCustomDataSource 删除实时自定义数据源。我的权限 ApplyPrivilege 申请权限。...

导入概述

StarRocks导入方式数据关系图如下。您可以根据不同的数据来源选择不同的导入方式:离线数据导入:如果数据源是Hive或HDFS,推荐使用 Broker Load。如果数据表很多导入比较麻烦可以使用Hive外表,性能会比Broker load导入效果差,但是...

升级数据库版本

本文介绍云数据库MongoDB支持升级的数据版本以及如何升级数据版本。注意事项 升级分片集群实例的数据版本时,实例的协议类型需为 MongoDB协议。升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

产品和业务限制

限制项 描述 例外申请方式 购买分析型数据库MySQL版的限制 账户余额大于等于500元现金 请联系技术支持 开通分析型数据库MySQL版的用户限制 用户需实名认证 无 可创建的最大分析型数据库MySQL版数 3个 联系技术支持申请更多 单个分析型数据...

离线同步能力说明

数据集成的离线同步功能为您提供数据读取(Reader)和写入插件(Writer),方便您通过定义来源去向数据源,并结合DataWorks调度参数使用,将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。使用限制 ...

基于Delta lake的一站式数据湖构建分析实战

企业构建和应用数据湖一般需要经历数据入湖、数据湖存储管理、数据湖探索分析等几个过程。本文主要介绍基于阿里云数据湖构建(DLF)构建一站式的数据入湖分析实战。背景信息 随着数据时代的不断发展,数据量爆发式增长,数据形式也变...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以阿里云...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

概述

本节为不熟悉关系数据库管理系统的人介绍 SQL 语言。将讨论创建、填充、查询和更新表等基本操作以及示例。还将讨论视图、外键和事务等更高级的概念。PolarDB PostgreSQL版(兼容Oracle)是关系数据库管理系统(RDBMS)。这意味着它是用于...

SQL Server数据

由于主备数据同步存在一定的时间差,特别在于某些特定情况,例如网络延迟等问题,导致备库同步恢复的数据与主库有较差别,从备库同步的数据不是一份当前时间的完整镜像。一致性约束 SQL Server在数据存储划分中属于RDBMS系统,对外可以...

准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

核心能力

数据资源平台提供了一站式数据资产定义、生产、管理服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

使用MaxCompute控制台(离线)

选择待上传数据及存放该数据的目标表后,您可预览数据详情,并配置数据所在文件的列目标表字段的映射关系,配置后相关数据才可被成功上传,配置方式如下。说明 目前仅支持预览前20条数据。类别 参数名 描述 上传文件数据预览 文件编码 若...

导入概述

StarRocks导入方式数据关系图如下。您可以根据不同的数据来源选择不同的导入方式:离线数据导入:如果数据源是Hive或HDFS,推荐使用 Broker Load。如果数据表很多导入比较麻烦可以使用Hive外表,性能会比Broker load导入效果差,但是...

Oracle数据

由于主备数据同步存在一定的时间差,在网络延迟等特定情况下,会导致备库同步恢复的数据与主库有较差别,从备库同步的数据不是一份当前时间的完整镜像。一致性约束 Oracle在数据存储划分中属于RDBMS系统,对外可以提供强一致性数据查询...

Vertica数据

Vertica是一款基于列存储的MPP架构的数据库,Vertica数据源为您提供读取和写入Vertica双向通道的功能,本文为您介绍DataWorks的Vertica数据同步的能力支持情况。支持的版本 Vertica Reader通过Vertica数据库驱动访问Vertica,您需要确认...

基本介绍

云原生多模数据库Lindorm的关系 云原生多模数据库Lindorm是阿里巴巴自主研发的多模型数据库,云数据库HBase增强版的内核由 云原生多模数据库Lindorm宽表引擎 提供,为了获取更新、更完善的能力,推荐直接使用云原生多模数据库Lindorm。...

MongoDB 4.0

升级数据版本 数据迁移 变更实例配置 按时间点将备份数据恢复至新建实例 恢复云数据库MongoDB单个或多个数据库 升级数据版本:升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低峰期执行并确保应用...

DB2数据

DB2数据源作为数据中枢,为您提供读取和写入DB2数据库的双向通道,能够快速解决海量数据的计算问题。本文为您介绍DataWorks的DB2数据同步的能力支持情况。支持的版本 DB2 Reader和DB2 Writer使用的DB2驱动版本为 IBM Data Server Driver ...

功能简介

数据探索(Data Discovery)是一款面向业务人员的业务模型(智能数据与智能算子组装)编排、调试、运行及运营管理产品,旨在将“大数据”变成“人人都可用的大数据”。数据探索面向行业客户和业务人员,提供工具内容一体化的业务模型构建...

MongoDB 4.4

第三方云数据库迁移至阿里云数据库MongoDB:使用MongoDB工具将MongoDB Atlas数据库迁移至阿里云数据库MongoDB 使用DTS将MongoDB Atlas数据库迁移至阿里云数据库MongoDB 使用DTS将华为云文档数据库迁移至阿里云数据库MongoDB 使用MongoDB...

映射关系概述

全部展开 视角下,为您展示每个对象(如字段)与数据标准的一一映射关系,如果一个对象映射到了多个数据标准,将生成多条映射关系。映射关系入口 在Dataphin首页,单击顶部菜单栏的 资产。按照下图指引,进入有效 映射 的映射关系页面。...

映射关系概述

全部展开 视角下,为您展示每个对象(如字段)与数据标准的一一映射关系,如果一个对象映射到了多个数据标准,将生成多条映射关系。映射关系入口 在Dataphin首页,单击顶部菜单栏的 资产。按照下图指引,进入有效 映射 的映射关系页面。...

MongoDB 5.0

第三方云数据库迁移至阿里云数据库MongoDB:使用MongoDB工具将MongoDB Atlas数据库迁移至阿里云数据库MongoDB 使用DTS将MongoDB Atlas数据库迁移至阿里云数据库MongoDB 使用DTS将华为云文档数据库迁移至阿里云数据库MongoDB 使用MongoDB...

应用场景

大数据场景 云数据库HBase支持海量全量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松Spark、MaxCompute等大数据平台集成,完成数据规模离线分析。优势如下:低成本:高压缩比,数据冷热分离,...

EMR Workbench

阿里云EMR Workbench是一个综合性的大数据分析和开发环境,作为阿里云E-MapReduce的一部分,它提供了EMR Notebook和EMR Workflow两个核心功能。通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用