创建元数据

在基于HBase、Elasticsearch或MongoDB数据源创建服务单元之前,需要先创建对应数据中数据表的元数据,以实现通过元数据确定数据中数据表的结构。后续您可以通过该元数据读取到对应数据源的数据。本文为您介绍如何创建HBase、...

空间数据(邀测

入库任务 支持将Shapefile、GeoJSON和CSV文件类矢量数据添加到系统默认的空间数据库或者指定的PostGIS、Ganos数据库,方便对空间数据库进行空间检索、数据质检、血缘记录,打通数据...,使得空间数据被用于数仓建设、标签管理等数据中台任务...

功能简介

入库任务 支持将Shapefile、GeoJSON和CSV文件类矢量数据添加到系统默认的空间数据库或者指定的PostGIS、Ganos数据库,方便对空间数据库进行空间检索、数据质检、血缘记录,打通数据...,使得空间数据被用于数仓建设、标签管理等数据中台任务...

应用场景

可以将访问频度非常高的数据存储在云数据库 Memcache 版,底层数据存储在 RDS 。大型促销类业务 大型促销秒杀系统,系统整体访问压力非常。一般的数据库根本无法承载这样的读取压力,可选用云数据库 Memcache 版存储。带有计数器的...

划分数据

例如A公司电商营销业务板块可以划分为如下数据域,数据每一部分都是实际业务过程经过归纳抽象之后得出的。数据业务过程 会员店铺域 注册、登录、装修、开店、关店 商品域 发布、上架、下架、重发 日志域 曝光、浏览、单击 交易域 下...

划分数据

例如A公司电商营销业务板块可以划分为如下数据域,数据每一部分都是实际业务过程经过归纳抽象之后得出的。数据业务过程 会员店铺域 注册、登录、装修、开店、关店 商品域 发布、上架、下架、重发 日志域 曝光、浏览、点击 交易域 下...

伯俊软件

所属行业:互联网、软件 网站地址:上海伯俊软件科技有限公司 公司介绍 伯俊软件是国内老牌数字化服务商,创立20余年,已为3000多家中型企业提供数字化管理产品、解决方案、“业务+数据中台、培训及专业的技术服务,客户覆盖零售、制造...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

分析业务过程

业务过程进行分解,了解过程的每一个环节会产生哪些数据,数据的内容是什么数据在什么情况下会更新,更新的逻辑是什么。业务过程可以是单个业务事件,例如交易的支付、退款等;也可以是某个事件的状态,例如当前的账户余额等;还可以...

分析业务过程

业务过程进行分解,了解过程的每一个环节会产生哪些数据,数据的内容是什么数据在什么情况下会更新,更新的逻辑是什么。业务过程可以是单个业务事件,例如交易的支付、退款等;也可以是某个事件的状态,例如当前的账户余额等;还可以...

分析业务过程

业务过程进行分解,了解过程的每一个环节会产生哪些数据,数据的内容是什么数据在什么情况下会更新,更新逻辑是什么。业务过程可以是单个业务事件(例如交易的支付、退款),也可以是某个事件的状态(例如当前的账户余额),还可以是...

客户案例

基于飞天数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率,构建大润发的数据中台体系。新金融行业:某互联网金融公司湖仓一体案例 客户架构如下。客户简介 公司的第一代数据湖是基于Hadoop+OSS搭建的,同时引入的数据中台...

数据服务

什么数据服务无法连接ECS自建的数据库?是否必须开通API网关?如何配置数据源?数据服务是否支持MaxCompute(ODPS)数据源?向导模式生成API与脚本模式有何功能差异?数据服务的API分组的作用是什么,与API网关的分组有什么关联?...

DML无锁变更概览

DML无锁数据变更可以将单个SQL拆分成多个批次执行,能更好地满足业务方对大量数据变更的需求,例如历史数据清理、全表更新字段等,保证执行效率,减小对数据库性能、数据库空间等的影响。背景信息 当业务累积了大量数据时,需要定期清除表...

业务切换流程

为最大化地减少数据迁移对业务的影响,您可以参照本文的流程执行业务切换并建立回退方案。前提条件 已配置数据迁移任务,且数据迁移任务处于 迁移 或 已完成 状态,配置案例请参见 迁移方案概览。注意事项 由于执行业务切换操作需要停止...

业务切换流程

为最大化地减少数据迁移对业务的影响,您可以参照本文的流程执行业务切换并建立回退方案。前提条件 已配置数据迁移任务,且数据迁移任务处于 迁移 或 已完成 状态,配置案例请参见 迁移方案概览。注意事项 由于执行业务切换操作需要停止...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

创建HDFS数据

通过创建HDFS数据源能够实现Dataphin读取HDFS的业务数据或向HDFS写入数据。本文为您介绍如何创建HDFS数据源。背景信息 HDFS集群由NameNode和DataNode构成master-worker(主从)模式:NameNode用于构建命名空间,管理文件的元数据等。...

新零售:特步

业务架构 客户价值 基于 PolarDB-X+RDS的分布式数据解决方案+业务中台提升客户数据链路的时效性以及客户业务系统的吞吐能力,使订单、库存、商品、销售的数据能实时从业务端到业务中台再到报表系统做销售业务决策。基于 PolarDB-X+RDS的...

资产大盘

数据管理DMS 的资产大盘功能支持T+1离线汇总当前 DMS 租户下的所有实例、数据库、表数据,并图形化展示数据资产的引擎、环境、地域、来源、类目的分布占比及数量趋势。本文介绍如何使用DMS的资产大盘。注意事项 DMS 资产大盘的 表分布占比 ...

确定需求

举例:数据分析师需要了解A公司电商业务中厨具类目的成交金额。当获知这个需求后,您需要分析:根据什么(维度)汇总、汇总什么(度量)以及汇总的范围多(粒度)。例如,类目是维度,金额是度量,范围是全表。此外,还需要思考明细数据...

确定需求

举例:数据分析师需要了解A公司电商业务中厨具类目的成交金额。当获知这个需求后,您需要分析:根据什么(维度)汇总、汇总什么(度量)以及汇总的范围多(粒度)。例如,类目是维度,金额是度量,范围是全表。此外,还需要思考明细数据...

案例介绍

业务中台系统覆盖整个零售体系的会员(人)与商品/库存(货),并且集中处理订单与营销内容。电商系统与门店系统分别对应线上零售与线下零售。ERP系统主要是用于供应链管理。规划数仓 规划业务板块。某公司实行的是事业部制,各事业部之间...

MaxCompute函数管理

您可以通过MaxCompute函数面板,查看在MaxCompute计算引擎存在的函数、函数的变更历史,并可以一键添加函数至数据开发面板的业务流程。查看函数 进入 数据开发 页面。登录 DataWorks控制,切换至目标地域后,单击左侧导航栏的 数据...

使用创建反向任务功能

前提条件 已创建存储空间大于业务数据库已使用的灾备数据库,建议灾备数据业务数据大10%。已在业务数据库和灾备数据创建用于数据同步的账号。权限要求,请参见 RDS MySQL实例间的同步 或 RDS SQL Server间的同步。重要 灾备数据库的...

创建Impala数据

详细内容,请参见 附录:网络连通解决方案 测试成功后,单击 确定,完成Impala数据源的创建。后续步骤 完成Impala数据源的创建后,即可将Impala的业务数据引入至Dataphin或将Dataphin的数据写入至Impala。详情请参见 数据集成概述。

数据治理

数据地图 为什么数据地图数据总览页存储量和存储趋势图相差较?数据地图血缘展示延迟问题 数据地图新建表搜不到 当前表业务逻辑变更如何通知下游?哪些类型的Hive表支持在数据地图预览?数据保护伞 数据保护伞为什么有时候查询脱敏有...

数仓规划概述

业务分类 当企业业务比较复杂,不同类型业务彼此间需要共享数据域,但是又希望能在模型设计和应用过程快速定位本业务数据时,您可结合真实业务情况,规划不同的业务分类,在后续建模的维度表和明细表,将其关联到对应的业务分类。...

创建Impala数据

通过创建Impala数据源能够实现Dataphin读取Impala的业务数据或向Impala写入数据。本文为您介绍如何创建Impala数据源。背景信息 Impala是用于处理存储在Hadoop集群大量数据的SQL查询引擎。如果您使用的是Impala,在导出Dataphin数据至...

创建HBase数据

通过创建HBase数据源能够实现Dataphin读取HBase的业务数据或向HBase写入数据。本文为您介绍如何创建HBase数据源。背景信息 HBase是用于处理存储在Hadoop集群大量数据的SQL查询引擎。如果您使用的是HBase,在导出Dataphin数据至HBase,您...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

PolarDB-X适用场景

分布式快速改造 场景描述 当业务体量即将突破单机数据库承载极限和单表过导致性能、维护问题时,分布式改造是解决上述问题的高性价比方案数据库作为分布式改造的重点难点,"和使用单机数据库一样使用分布式数据库"一直是广大用户的核心...

产品简介

适用场景 如果您在大数据业务场景遇到如下问题,可以通过阿里云数据专家获取专属服务:受限于传统数据工作开展方式及组织管理模式,数字化转型遇难到数据各方面瓶颈;根据业务发展,难以从全局构建稳定的、变化的、集成的数据...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据数据同步到目标数据仓库OSS,...

新建AnalyticDB for MySQL 3.0数据

通过创建AnalyticDB for MySQL 3.0数据源能够实现Dataphin读取AnalyticDB for MySQL 3.0的业务数据或向AnalyticDB for MySQL 3.0写入数据。本文为您介绍如何创建AnalyticDB for MySQL 3.0数据源。背景信息 云原生数据仓库AnalyticDB ...

数据集成概述

为了解决上述问题,DataWorks提出了面向业务场景的同步任务配置化方案,支持不同数据源的一键同步功能,例如,“一键实时同步至Elasticsearch”、“一键实时同步至Hologres”和“一键实时同步至MaxCompute”功能等,通过此类功能,您只需要...

受众与核心能力

本文为您介绍DataWorks的产品定位、产品受众和产品的核心能力。产品定位 DataWorks致力于为数据开发者、数据分析师、数据资产管理者,打造一个具备...让数据从采集到展现、从分析到驱动应用得以一站式解决,真正实现数据业务化、业务数据化。

数据质量保障原则

一致性 一致性通常体现在跨度很数据仓库。例如,某公司有很多业务数仓分支,对于同一份数据,在不同的数仓分支必须保证一致性。例如,从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要...

适用场景

对于部分业务而言,只要SQL语法、数据类型、事务、索引支持较为完整,且具备有效手段可在各种极端场景下进行水平扩展,那么对于高速发展的业务而言,PolarDB-X 1.0 即是所有分布式数据最具生命力及延续性的方案。按成本选择 对于数据...

基于MaxCompute进行大数据BI分析

方案介绍 基于MaxCompute进行大数据BI分析的流程如下:通过数据集成同步业务数据和日志数据至MaxCompute。通过MaxCompute、DataWorks对数据进行ETL处理。同步处理后的结果数据至AnalyticDB MySQL。通过Quick BI可视化建立用户画像。方案...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用