什么是DataWorks

从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。产品架构 DataWorks十多年...

添加处理后数据数据管理

数据处理后,需要将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。本文以倾斜数据处理后为例,介绍如何添加处理后数据数据管理。前提条件 已新建数据处理任务,具体操作,请参见 新建数据处理任务。操作...

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

空间数据(邀测

入库任务 支持将Shapefile、GeoJSON和CSV文件类矢量数据添加到系统默认的空间数据库或者指定的PostGIS、Ganos数据库,方便对空间数据库进行空间检索、数据质检、血缘记录,打通数据...,使得空间数据被用于数仓建设、标签管理等数据中台任务...

功能简介

入库任务 支持将Shapefile、GeoJSON和CSV文件类矢量数据添加到系统默认的空间数据库或者指定的PostGIS、Ganos数据库,方便对空间数据库进行空间检索、数据质检、血缘记录,打通数据...,使得空间数据被用于数仓建设、标签管理等数据中台任务...

统一服务

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”的传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

准备工作

开通企业数据智能平台 企业数据智能平台默认为关闭状态,使用前需要前往 AnalyticDB PostgreSQL版 控制台开通。登录 云原生数据仓库AnalyticDB PostgreSQL版控制台。在控制台左上角,选择实例所在地域。...单击 开通数据中台

应用场景

构建数据中台,行业领域模型快速沉淀 场景:快速构建数据仓库,有效治理数据质量,实现政企客户各部门数据的业务协同和共享。痛点:以政务服务为例,政务服务部门众多,业务系统复杂、流程长,数据来源多且更新频率高;数据口径标准、数据...

产品优势

多场景支持:支持离线数仓搭建、数仓提速、离线数据分析、数据中台搭建、规模数据集成、离线计算、异构数据集成等。低门槛:近乎零代码,简单配置连线后即可满足各项离线数据集成任务,同时任务支持复杂调度。基于资产的虚拟湖:配合数据...

技术架构选型

教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

技术架构选型

教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

大数据安全治理的难点

通常,大数据系统的工作流涉及多部门、多责任人且跨系统的数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

教程概述

本文为您介绍当需要通过DataV展示海量数据的分析结果时,如何使用DataWorks的数据服务开发数据API,并快速在DataV调用API,最终将来自MaxCompute的数据成果展示在DataV大屏数据开发到数据服务再到数据分析展现一气呵成。注意 本案例...

手动添加数据

您可以通过 数据库备份DBS 的手动添加数据源功能,将不同环境的数据库添加至 数据库备份DBS ,便于后续对数据源进行管理与备份。费用说明 添加数据源操作不会产生费用,只有在添加数据源后开启备份才会产生费用。如何开启备份,请参见 ...

清除数据

您可以在控制清除 云原生内存数据库Tair 实例的所有过期数据或所有数据。操作步骤 说明 在 参数设置 禁用 FLUSHALL 命令不会影响控制台中 清除数据 功能。访问 Tair实例列表,在上方选择地域,然后单击目标实例ID。在 实例信息 页面...

清除数据

您可以在控制清除 云数据库 Redis 版 实例的所有过期数据或所有数据。操作步骤 说明 在 参数设置 禁用 FLUSHALL 命令不会影响控制台中 清除数据 功能。访问 Redis实例列表,在上方选择地域,然后单击目标实例ID。在 实例信息 页面,...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

教程概述

注意 本教程中数据仅供参考,无实际意义,旨在帮助您了解较为复杂的交互式可视化应用的配置方法。具体数据需要根据您的实际需求进行配置。具体操作步骤如下。准备工作。准备交互需求。配置学区房蓝图编辑器交互。创建学区地图可视化应用...

教程概述

注意 本教程中数据仅供参考,无实际意义,旨在帮助您了解较为复杂的交互式可视化应用的配置方法。具体数据需要根据您的实际需求进行配置。具体操作步骤如下。准备工作。准备交互需求。配置学区房蓝图编辑器交互。创建学区地图可视化应用...

数据质量保障原则

一致性 一致性通常体现在跨度很数据仓库。例如,某公司有很多业务数仓分支,对于同一份数据,在不同的数仓分支必须保证一致性。例如,从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要...

表设计规范

分区数量和数据量建议 建议单个分区数据量不要太。应尽量避免分区数据倾斜,避免单个表不同分区的数据量差异超过100万。分区设计时应合理规划分区个数,较细粒度的分区在跨分区扫描时会影响SQL的执行性能。单个分区中数据量较的...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...

集群性能监控概述

数据库 OceanBase 为您提供集群实例的数据库性能和主机性能监控功能,可在 OceanBase 管理控制台中查看监控数据,还支持自定义监控能力,您可按需配置常用监控指标作为自定义监控面板。查看监控数据 进入 OceanBase 管理控制。在左侧...

客户案例

基于飞天大数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率,构建大润发的数据中台体系。新金融行业:某互联网金融公司湖仓一体案例 客户架构如下。客户简介 公司的第一代数据湖是基于Hadoop+OSS搭建的,同时引入的数据中台...

教程概述

在DataHub通过DataConnector将数据同步到RDS MySQL数据。使用DataV将RDS MySQL数据展示在大屏上。说明 物联网平台转发至DataHub,是因为DataHub可以将数据同步至MaxCompute,为后续数据计算做准备。本案例的整体步骤如下:创建...

数据仓库研发规范概述

大数据时代,规范地进行数据资产管理已成为推动互联网大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会...

创建全球数据库网络

全球数据网络(Global Database Network,简称GDN)是由分布在同一个国家不同地域的多个 PolarDB 集群组成的网络网络中所有集群的数据均保持同步。当您的业务部署在多个地域时,利用GDN可以实现应用访问数据库的低延迟和高稳定性。本文...

数仓分层

在本教程中,从交易数据系统的数据经过DataWorks数据集成,同步到数据仓库的ODS层。经过数据开发形成事实宽表后,再以商品、地域等为维度进行公共汇总。整体的数据流向如下图所示。其中,ODS层到DIM层的ETL(萃取(Extract)、转置...

数仓分层

在本教程中,从交易数据系统的数据经过DataWorks数据集成,同步到数据仓库的ODS层。经过数据开发形成事实宽表后,再以商品、地域等为维度进行公共汇总。整体的数据流向如下图所示。其中,ODS层到DIM层的ETL(萃取(Extract)、转置...

我的看板

数据来源 在工作台中创建并发布的数据看板内容,会同步在此处展示,若数据看板仅编辑完成,但是未发布,则在此处不展示。如需编辑某一看板内容,请单击页面右上角的 前往可视化工作,编辑并发布对应数据看板后,刷新当前页面即可。操作...

创建DataHub项目

阿里云流数据处理平台DataHub是流式数据(Streaming Data)的处理平台,提供对流式数据的发布(Publish),订阅(Subscribe)和分发功能,让您可以轻松构建基于流式数据的分析和应用。前提条件 您已经完成了 创建RDS MySQL数据库表。操作...

添加 MySQL 数据源的白名单

进入云服务器 ECS 控制的 安全组 页面,在 创建安全组 右侧的下拉列表选择 专有网络 ID,粘贴 VPC ID 筛选安全组。单击目标安全组的名称,进入详情页面。在 入方向 快速添加 IP 地址。复制 OMS 控制 添加数据源 对话框显示的 ...

数据分析整体趋势

随着Google等互联网企业崛起,以Hadoop为代表的基于传统x86服务器集群的大数据技术迅速发展,同时开源分布式数据库如Greenplum等也成为相应替代方案,为广大小企业,尤其是互联网行业大大降低了数据分析的技术和成本门槛,还有分布式技术...

创建数据

概述 您可以通过以下方式创建 OceanBase 开发者中心(OceanBase Developer Center,ODC)数据源:ODC 首页创建数据源:进入 ODC 首页后,单击 新建连接 按钮创建数据源。公有云实例创建数据源:公有云的实例,单击 登录数据库,输入...

添加 Oracle 数据源的白名单

进入云服务器 ECS 控制的 安全组 页面,在 创建安全组 右侧的下拉列表选择 专有网络 ID,粘贴 VPC ID 筛选安全组。单击目标安全组的名称,进入详情页面。在 入方向 快速添加 IP 地址。复制 OMS 控制 添加数据源 对话框显示的 ...

添加 OceanBase 数据源的白名单

进入云服务器 ECS 控制的 安全组 页面,在 创建安全组 右侧的下拉列表选择 专有网络 ID,粘贴 VPC ID 筛选安全组。单击目标安全组的名称,进入详情页面。在 入方向 快速添加 IP 地址。复制 OMS 控制 新建数据源 对话框显示的 ...

添加 Kafka 数据源的白名单

进入云服务器 ECS 控制的 安全组 页面,在 创建安全组 右侧的下拉列表选择 专有网络 ID,通过 VPC ID 筛选安全组。单击目标安全组的名称,进入详情页面。在 入方向 快速添加 IP 地址。复制 OMS 控制 添加数据源 对话框显示的 ...

规格及选型

案例二:互联网SaaS用户 用户为互联网SaaS客户,需要建立数据中台,涉及多数据源包括RDS、Flink、OSS等,期待在平台上完成数据的ETL流程,实现多源处理以及分析侧不同场景的混合负载支持,需要高稳定性保证,同时平台对接数据应用支持报表...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据库备份 DBS 云数据库 MongoDB 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用