冷热分层

更多介绍请参见 结构化大数据分析平台设计、面向海量数据的极致成本优化-云HBase的一体化冷热分离 和 云上如何做冷热数据分离。冷热数据 数据按照实际访问的频率可以分为热数据、温数据和冷数据。其中冷数据数据量较,很少被访问,甚至...

DataWorks交流钉钉群

DataWorks作为阿里云大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系,同时提供优质高效的交流服务,本文为您介绍...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户...,赋能技术团队具备大数据平台建设、架构设计、AI算法建模以及运维保障能力...

发展历程

关键性里程碑 2009年9月,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10月,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8月,平台的单集群规模已达到5000台。2014年7月,平台开始对外提供服务,完全替换...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

通用数据开发

说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的数据,存储在业务系统所对应的数据库中,包括MySQL、Oracle和RDS等类型。数据收集与存储:您需要同步...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

基于MaxCompute进行大数据BI分析

通过MaxCompute、AnalyticDB MySQL强大的数据加工和分析能力,降低大数据平台建设的门槛,轻松解决了海量数据的计算问题。同时有效降低企业成本,并保障数据安全。与第三方开源生态无缝对接,在不侵入用户应用的情况下,传输日志至日志服务...

应用场景

阿里云开源大数据平台E-MapReduce(简称EMR)具有广泛的应用场景。本文为您介绍EMR的主要应用场景。数据湖场景 DataLake集群类型提供了数据湖分析场景所需的服务和相关湖格式,包括Hadoop、OSS-HDFS、Hive、Spark、Presto等。通过选择OSS-...

相关的云服务

访问控制RAM 通过访问控制RAM,可以为不同人员、云服务等指定身份并基于身份授予资源访问权限,从而控制对开源大数据平台E-MapReduce的访问。对象存储OSS-HDFS 对象存储OSS-HDFS服务用于存储用户数据。云监控 通过云监控(CloudMonitor)...

DataWorks on EMR数据安全方案

数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

附录:数据地图服务关联角色

权限说明:用于大数据开发治理平台 DataWorks的服务关联角色,DataWorks使用此角色来访问您在OSS中的资源,并进行统计分析。使用该权限的作用:获取带有 access_by=DW-OSS-MANAGE 标签的存储空间访问权限,包括开通/关闭存储空间清单、开通...

授权信息

本文为您介绍 开源大数据平台 E-MapReduce(EMR)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。开源大数据平台 E-MapReduce(EMR)的RAM代码(RamCode)为 emr,emr-apm-server,ecm,emr-serverless-spark,dls...

DataWorks模块使用说明

使用流程概览:参考文档:DataWorks数据建模 子模块:数据开发(DataStudio)功能说明:数据开发(DataStudio)是一站式大数据开发平台,支持在线开发MaxCompute、EMR、Hologres、CDP、ADB等多种大数据引擎的数据处理任务。它集成了强大的...

DataWorks On EMR使用说明

DataWorks提供DLF可视化权限申请、权限审批及权限审计等功能,可实现数据湖全托管的统一权限管理,当EMR已将DLF设置为元数据服务时,您可以在DataWorks安全中心进行数据权限申请与控制,详情请参见 DLF数据访问权限控制。二、功能模块权限...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

权限说明

数据湖构建(DLF)产品的权限体系主要分为RAM权限以及DLF数据权限控制两类,如果您要访问DLF的页面或数据,一般都需要通过这两层权限校验,才可以正确的访问到数据资源。RAM 权限:主要控制DLF所有OpenAPI的访问权限,决定RAM用户是否...

DataWorks快速入门指引

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为了便于新用户快速了解DataWorks的数据开发治理操作全流程,DataWorks为您提供了...

权限管理与规范化数据开发

虽然部分默认配置涉及数据权限管理(如 背景信息),但DataWorks仍提供了更为专业的 概述,帮助您快速构建平台的数据内容、个人隐私等相关的安全能力,实现更加精细化、场景化的数据权限及高危风险行为管控,满足企业面向高风险场景的各类...

什么是数据资源平台

阿里云数据资源平台数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据标准、数据建模、数据加工、质量评估、业务模型构建、资产管理、数据服务等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据...

概述

EMR数据开发于2022年2月21日停止功能更新,2023年9月30日停止全面支持。如果您在2022年2月21日21点前未使用过数据开发功能,推荐您通过EMR Workflow进行...您也可以迁移到大数据开发治理平台DataWorks,详情请参见 EMR数据开发停止更新公告。

什么是MaxCompute

MaxCompute还深度融合了阿里云如下产品:DataWorks 基于DataWorks实现一站式的数据同步、业务流程设计数据开发、管理和运维功能。人工智能平台PAI 基于机器学习平台的算法组件实现对MaxCompute数据进行模型训练等操作。实时数仓Hologres ...

权限概述

DataWorks成员角色或身份 MaxCompute角色 DataWorks开发环境/MaxCompute DEV引擎项目数据权限 DataWorks生产环境/MaxCompute PROD引擎项目数据权限 DataWorks平台权限特征 空间管理员 Role_Project_Admin MaxCompute引擎层面:当前项目下 ...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

EMR数据开发停止更新公告

作为一站式大数据开发治理平台,DataWorks沉淀阿里巴巴十多年大数据建设方法论,为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据湖开发治理能力,帮助客户提升数据的应用效率。迁移流程 阿里云DataWorks on EMR团队提供了完善...

产品优势

提供安全访问代理:安全访问代理复用了DMS内已有的安全规则、数据权限、敏感列配置等,可以实现在DMS平台外安全地访问数据库。更多信息,请参见 开启安全访问代理。有效保障数据库稳定性 稳定可控:通过无锁变更、变更前备份及变更异常自动...

基本概念

工作组内的数据通常为工作组内全部成员可见,研发工作台的数据权限以工作组为单元相互隔离。数据同步 数据源:是指数据库应用程序所使用的数据库或者数据库服务器,在数据资源平台的数据同步中可以将配置好的数据源端数据同步到目标端。...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

功能特性

审计日志 权限管理 权限管理 为确保MaxCompute项目数据的安全性,项目所有者或者具备授权权限的用户需要对项目内成员的权限进行合理管控,确保权限不会过也不会过小。权限管理 管理&运维 MaxCompute提供用户可视化运维、管理功能,方便...

我是企业用户

系统设置 权限设置 组织管理 通过平台的组织架构可以对用户进行分组管理,可以单击组织的编辑,修改组织名称以及选择是否默认组织,如果选中默认组织,所有没有指定具体属于哪个组织的用户都将属于该组织(平台中只能设置一个默认组织):...

文档修订记录

Check节点 2024.1.12 新增功能 最佳实践 新增DataWorks大数据安全治理实践新增指南,为您介绍数据安全治理的常见思路、DataWorks产品的安全能力,以及在DataWorks上基于“基础防护建设”、“数据安全防护措施”、“数据安全持续运营”三个...

创建安全规则

安全规则是通过一组领域专用语言DSL(Domain Specific Language)对数据库实现精细化管控的规则集合,您在使用DMS的查询、导出、变更等功能时,可以通过安全规则管控这些功能行为,从而在平台内制定和打造数据库的操作规范和研发流程。...

权限列表

支持查看 数据资源平台 各组件的功能权限和数据权限。本文介绍如何查看各组件的权限内容。前提条件 使用权限账号登录 数据资源平台。查看权限列表 登录 数据资源平台控制台。在页面右上角,单击 图标,选择 系统设置。在页面左侧导航栏,...

权限列表

支持查看 企业数据智能平台 各组件的功能权限和数据权限。本文介绍如何查看各组件的权限内容。前提条件 使用权限账号登录 企业数据智能平台。查看权限列表 登录企业数据智能平台。在页面右上角,单击 图标,选择 系统设置。在页面左侧导航...

新功能发布记录

资产类目 全面优化表详情 优化 在新版表详情中展示了表的技术元数据(所属库实例、表名、字段等)、业务元数据(表业务描述、表标签等)及管理元数据(表Owner、数据权限等),并提供表的部分快捷操作。您可以在表详情中,全面地了解并高效...

授权和回收数据板块权限

权限类型 默认授予某个逻辑表的查询数据权限,不支持修改。授权原因 填写授予数据板块权限的原因。单击 确定,完成数据板块权限的授权。回收数据板块权限 按照下图操作指引,进入 数据板块回收 对话框。在 数据板块回收 对话框,配置参数。...

授权和回收数据板块权限

权限类型 默认授予某个逻辑表的查询数据权限,不支持修改。授权原因 填写授予数据板块权限的原因。单击 确定,完成数据板块权限的授权。回收数据板块权限 按照下图操作指引,进入 数据板块回收 对话框。在 数据板块回收 对话框,配置参数。...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

2019年

数据模型架构规范、公共规范、ODS层设计规范、CDM公共维度层设计规范、CDM明细层设计规范、CDM汇总层设计规范、MaxCompute数据开发规范 2019-05-06 新增表设计指南。新指南 介绍表设计指南。表概述、表设计规范、表设计最佳实践、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用