构建数据仓库

方案优势:阿里巴巴数据最佳实践,高性能、低成本、Serverless服务,免运维、全托管模式,让企业的大数据研发人员更聚焦在业务数据的开发、生产、治理。产品组合:MaxCompute+Flink+DataWorks。场景说明 用户数据来源丰富,包括来自云端...

设计阶段

运行周期 如果数据研发的场景是在常见T+1离线计算场景,则应将不同调度任务按照实际业务需求,赋予小时、日、周、月和季度等不同的调度粒度。说明 程序必须支持重跑。如果SQL语句优化后,单次执行仍超过30分钟,建议拆表重新设计,建议每个...

实现开发生产等多套环境隔离

背景信息 很多企业用户在大数据研发流程中有创建并隔离多套环境的需求,如创建并完全隔离开发、测试、生产环境,即各环境的数据物理存储地址、任务运行集群、大数据作业脚本均隔离,并对操作人员有严格的权限管控,如仅运维团队可使用...

数据仓库研发规范概述

贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会降低研发效率,增加成本与风险。总而言之,数据资产管理实际上是对物的管理,而研发流程规范管理则是对人的...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

什么是Dataphin

数据模型提交发布后,Dataphin自动化地生成代码与调度任务,大大提升了数据研发效率。规范建模 编码研发 基于通用的代码编辑页面,灵活地进行个性化的数据编码研发,完成任务发布。编码研发 资源及函数管理 支持管理各种资源包(例如JAR、...

数据导入概览

使用DataWorks数据集成同步数据到GDB DataWorks 是阿里云上的一站式大数据智能云研发平台,其中数据集成服务支持导出数据到GDB,您也可以使用平台完成数据计算、筛选、转换等处理再同步到GDB。DataWorks的GDB数据源底层由GdbWriter插件提供...

透视分析:按研发链路

支持您按照研发链路(数据同步和数据开发)查看和分析工作空间内DataWorks离线同步任务和DataWorks调度任务运行情况及资源消耗详情。便于您了解当前花费较多的资源类别、识别运行失败的任务,合理调整消费结构,发现阻塞任务运行的问题并...

数据研发(登录数据库)

背景信息 OceanBase 使用 Web 版 ODC 开发者中心(OceanBase Developer Center,ODC)作为数据库开发平台,在 OceanBase 管理控制台首页通过 数据研发 按钮可直接进入 Web 版 ODC,或 下载并使用客户端版 ODC 进行数据库开发。操作步骤 ...

需求阶段

是否满足安全与合规要求:根据企业自身数据安全的要求,严格控制数据内部流向,划分研发过程中数据可流入的库、项目、表、字段等。对于流出外部的数据,更需要严格评估流出数据内容、流出目的地是否符合公司数据安全的要求。说明 此项评估...

建模空间

在 建模空间 页面的 模型空间配置 区域,可查看当前的 数据模型设计空间 和 数据研发工作空间 映射关系,单击 更改配置,可修改配置 数据研发工作空间。说明 进入 更改配置 操作页面后,您仅可以操作(新增或删除)您有 空间管理员 权限的...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

创建通用项目

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。Basic模式:完成项目的创建后,系统默认生成了Basic项目(开发和生产一体的项目)。Basic项目的数据生产过程稳定且便捷。如果您关注数据研发...

常见问题

1.售前咨询渠道 尊敬的“准”大数据专家服务用户您好:如果您准备购买阿里云大数据专家服务,但是遇到如服务范围、规格、服务选择等售前方面的问题,您可以通过钉钉与我们联系,您将“当面”获得阿里云大数据专家咨询专家的建议。...

概述

功能介绍 当前,Dataphin告警中心对接了数据研发(离线计算、实时计算)、资产质量和数据服务模块。当监控指标触发了您配置的告警规则时,告警中心就通过电话、短信、邮件、钉钉方式报警给报警信息接收人,您可以根据报警信息进行相应的...

告警中心概述

功能介绍 当前,Dataphin告警中心对接了数据研发(离线计算、实时计算)、资产质量和数据服务模块。当监控指标触发了您配置的告警规则时,告警中心就通过电话、短信、邮件、钉钉方式报警给报警信息接收人,您可以根据报警信息进行相应的...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

移动数据分析是什么?

移动数据分析(Mobile Analytics)是阿里云推出的一款移动App数据统计分析产品,提供通用的多维度用户行为分析,支持日志自主分析,助力移动开发者实现基于大数据技术的精细化运营、提升产品质量和体验、增强用户黏性。移动数据分析帮助用户...

应用场景

数据分析业务 云数据库 Memcache 版搭配大数据计算服务 MaxCompute。实现对大数据的分布式分析处理,适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版与 MaxCompute 间的同步,简化数据操作...

创建通用项目

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。Basic模式:完成项目的创建后,系统默认生成了Basic项目(开发和生产一体的项目)。Basic项目的数据生产过程稳定且便捷。如果您关注数据研发...

ECS实例说明

大数据型 使用本地SATA盘作存储数据,存储性价比高,是大数据量(TB级别的数据量)场景下的推荐机型。说明 Hadoop、Data Science、Dataflow和Druid类型的集群支持Core节点;Zookeeper和Kafka类型的集群不支持Core节点。本地SSD型 使用本地...

DataWorks快速入门指引

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为了便于新用户快速了解DataWorks的数据开发治理操作全流程,DataWorks为您提供了...

IoT数据自动化同步至云端解决方案

大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。IoT设备大量的数据通常以半结构化的形式存储。...

通过 ODC 连接 OceanBase 数据库

在左侧导航栏单击 数据研发,进入 ODC 首页。在 ODC 首页中,单击 全部连接>新建个人连接。在新建个人连接的弹窗页面,填写如下信息:连接实例:集群实例/租户实例,在下拉框中选择需要连接的集群实例和租户实例。数据库用户名:登录租户...

通过 ODC 连接 OceanBase 数据库

在左侧导航栏单击 数据研发,进入 ODC 首页。在 ODC 首页中,单击 全部连接>新建个人连接。在新建个人连接的弹窗页面,填写如下信息:连接实例:集群实例/租户实例,在下拉框中选择需要连接的集群实例和租户实例。数据库用户名:登录租户...

入门概述

​ 以下使用流程可帮助您快速了解和使用 Web 版 ODC:顺序 操作 说明 1 登录 Web 版 ODC 在 OceanBase 管理控制台页面的左侧导航栏中,单击 数据研发 按钮即可直接登录 Web 版的 ODC,后续对数据库的数据源配置以及保存工作区的 SQL 脚本等...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

DataWorks on EMR数据安全方案

大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

大数据安全治理的难点

存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,...

创建数据板块

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐 此模式。创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

创建数据板块

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐 此模式。创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据...

项目管理概述

若您需要以项目为单位,划分业务领域进行数据研发,您可以创建通用项目,从而能够高效的管理和协作。标签项目:主要用于对数据进行标签化的创建以及管理。若您需要以项目为单位,划分业务领域进行标签研发,您可以创建标签项目。项目管理...

客户案例

价值体现 从大数据平台上云整体“降本增效”的方案快速切入,迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(...

开发者中心介绍

可通过以下方式使用 ODC:在 OceanBase 管理控制台页面的左侧导航栏中,单击 数据研发 按钮即可直接登录 Web 版的 ODC;下载桌面版 ODC 连接云数据库 OceanBase 中的实例,以进行数据开发和管理操作。说明 本章节为阿里云配套部署的 Web 版...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据管理 数据库备份 DBS 云数据库 RDS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用