授权信息

本文为您介绍 开源大数据平台 E-MapReduce(EMR)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。开源大数据平台 E-MapReduce(EMR)的RAM代码(RamCode)为 emr,emr-apm-server,ecm,emr-serverless-spark,dls...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

通用数据开发

说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的数据,存储在业务系统所对应的数据库中,包括MySQL、Oracle和RDS等类型。数据收集与存储:您需要同步...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

安全设置

操作 默认(权限模式均未开启)跨项目安全模式(开启)生产数据安全模式(开启)当前项目Dev环境的所有表操作 支持-当前项目Prod环境的所有表操作 支持-不支持 跨项目查询 支持-跨项目DDL 支持 不支持-说明-表示当前操作不受 跨项目安全...

安全设置

操作 默认(权限模式均未开启)跨项目安全模式(开启)生产数据安全模式(开启)当前项目Dev环境的所有表操作 支持-当前项目Prod环境的所有表操作 支持-不支持 跨项目查询 支持-跨项目DDL 支持 不支持-说明-表示当前操作不受 跨项目安全...

必读:简单模式和标准模式的区别

为方便不同安全管控要求的用户生产数据,DataWorks为您提供简单模式和标准模式两种工作空间模式。本文从简单模式工作空间与标准模式工作空间物理形态、对开发行为的影响等多个维度为您介绍两种模式工作空间的区别。背景信息 本文内容由以下...

DataWorks交流钉钉群

DataWorks作为阿里云大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系,同时提供优质高效的交流服务,本文为您介绍...

ClickHouse概述

开源大数据平台E-MapReduce(简称EMR)的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础...

创建并管理数据

您可以分别创建开发环境和生产环境的数据源,使测试与生产调度操作的数据源隔离,以保护您的生产数据安全。详情请参见 附录:数据源环境介绍。开发环境的数据源:可在数据同步节点中选择,并在开发环境运行,但无法提交到生产环境或在生产...

应用场景

阿里云开源大数据平台E-MapReduce(简称EMR)具有广泛的应用场景。本文为您介绍EMR的主要应用场景。数据湖场景 DataLake集群类型提供了数据湖分析场景所需的服务和相关湖格式,包括Hadoop、OSS-HDFS、Hive、Spark、Presto等。通过选择OSS-...

JindoFS实战演示

云上计算云下数据:HDFS缓存加速 云上计算云下数据:HDFS缓存加速 2021-06-29 随着云计算越来越成熟,带来弹性扩容、运维方便、节省成本等优点,越来越多企业开始将大数据平台搬到云上。云下的HDFS集群存在历史数据,其中可能包含敏感数据...

发布包总览概述

注意事项 为保证数据安全生产,避免对象引用关系错乱造成数据故障。在发布对象期间,系统需要进入维护状态,减少并发操作可能造成的问题,发布文件结束后,需要 系统管理员 或 超级管理员 手动停止维护状态,其他用户可正常使用系统。数据...

发布包总览概述

注意事项 为保证数据安全生产,避免对象引用关系错乱造成数据故障。在发布对象期间,系统需要进入维护状态,减少并发操作可能造成的问题,发布文件结束后,需要 系统管理员 或 超级管理员 手动停止维护状态,其他用户可正常使用系统。数据...

申请、续期和交还表权限

若关闭生产数据安全模式,则您加入目标项目,且您在项目中的角色包含项目 资产权限-新建 的权限点,即可在开发环境创建表,如何开启生产数据安全模式,请参见 安全设置。若开启跨项目安全模式,则仅可在任务所在的项目中创建表,不能跨项目...

申请、续期和交还表权限

若关闭生产数据安全模式,则您加入目标项目,且您在项目中的角色包含项目 资产权限-新建 的权限点,即可在开发环境创建表,如何开启生产数据安全模式,请参见 安全设置。若开启跨项目安全模式,则仅可在任务所在的项目中创建表,不能跨项目...

相关的云服务

本文为您介绍典型场景下,使用开源大数据平台E-MapReduce时通常会使用到的其他云服务。云服务名称 说明 云服务器ECS 使用云服务器ECS(Elastic Compute Service)作为集群的节点,每个ECS实例集群中的一个节点。专有网络VPC 专有网络VPC...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

什么是DataWorks

产品架构 DataWorks十多年沉淀数百项核心能力,通过 智能数据建模、全域数据集成、高效数据生产、主动数据治理、全面数据安全数据分析服务六全链路数据治理的能力,帮助企业治理内部不断上涨的“数据悬河”,释放企业的数据生产力。...

发展历程

关键性里程碑 2009年9月,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10月,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8月,平台的单集群规模已达到5000台。2014年7月,平台开始对外提供服务,完全替换...

E-MapReduce本地盘实例规模数据集测试

大数据基准测试用于公平、客观评测不同大数据产品/平台的功能和性能,对用户选择合适的大数据平台产品具有重要的参考价值,TPC-DS逐渐成为了业界公认的大数据系统测试基准。本文以阿里云E-MapReduce+D1本地盘方案模拟TPC-DS测试的演示方案...

受众与核心能力

总之,使用DataWorks,您不仅可以进行海量数据的离线加工分析,还能完成数据的汇聚集成、开发、生产调度与运维、离线与实时分析、数据质量治理与资产管理、安全审计、数据共享与服务、机器学习、应用搭建等覆盖大数据全生命周期的最佳实践...

快速体验

数据治理:大数据开发治理平台 DataWorks数据质量(必选)、大数据开发治理平台 DataWorks数据地图(必选)、大数据开发治理平台 DataWorks数据保护伞(必选),基础版DataWorks已包含。数据展示:智能分析套件Quick BI(必选),您可根据...

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户...,赋能技术团队具备大数据平台建设、架构设计、AI算法建模以及运维保障能力...

常见问题

数据水印的基础上,数据安全中心通过系统内置的异常事件检测,对运维高危操作、异常访问、拖库攻击、数据库注入、数据库外联、数据库高危操作等行为进行监控告警,覆盖传统数据库的基础上,还支持对象存储OSS、大数据平台MaxCompute以及...

应用场景

基因分析平台广泛用于基因数据从样本到报告的分析过程。典型应用场景包括基因数据分析、测序生产自动化和基因云平台开发等。...基因分析平台强大的计算引擎可以保证企业云平台安全可靠,稳定高性能,满足规模生产和应用要求。

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

平台安全诊断

DataWorks的平台安全诊断,为您提供了当前DataWorks工作空间与绑定的引擎在数据传输、存储、运算等过程中,与身份认证、访问权限控制、开发模式等功能相关的安全能力,以及诊断相关安全问题的最佳实践,帮助您及时发现平台的安全隐患,在...

EMR数据开发停止更新公告

作为一站式大数据开发治理平台,DataWorks沉淀阿里巴巴十多年大数据建设方法论,为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据湖开发治理能力,帮助客户提升数据的应用效率。迁移流程 阿里云DataWorks on EMR团队提供了完善...

文档更新动态(2023年)

新增说明 创建及管理跨平台迁移 管理中心-规范设置 安全模式(是否允许跨项目建表、是否允许开发写生产)支持按照项目配置。更新说明 安全设置 数据引入-离线集成-离线单条管道-组件库开发 离线集成任务运行日志支持展示可读性强,易于理解...

构建数据仓库

方案优势:阿里巴巴大数据最佳实践,高性能、低成本、Serverless服务,免运维、全托管模式,让企业的大数据研发人员更聚焦在业务数据的开发、生产、治理。产品组合:MaxCompute+Flink+DataWorks。场景说明 用户数据来源丰富,包括来自云端...

场景:工作空间模式升级(简单模式升级标准模式)

说明 升级时,平台将按照原简单模式工作空间(即生产数据源)生成配置相同的开发数据源,实现数据源开发与生产隔离。您可在升级后前往数据源配置界面查看,详情请参见 创建并管理数据源。升级后:开发数据源和生产数据源完全隔离,修改开发...

DataWorks快速入门指引

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为了便于新用户快速了解DataWorks的数据开发治理操作全流程,DataWorks为您提供了...

开通Dataphin

资产安全(选购)数据安全支持定义数据的业务分类和安全等级并构建数据识别规则,同时支持针对敏感数据设置脱敏规则,以保障您的数据资产安全性。支持选购的规格为 标准版;如果您暂时不需要开通该功能,可选 暂不选择。资源治理(选购)...

DataWorks On CDP/CDH使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心、数据保护伞、审批中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全...

产品概述

产品描述 Dataphin是集产品、技术、方法论于一体的智能大数据平台建设引擎,为您提供数据引入、规范定义、建模研发、资产管理、数据服务等全链路智能数据建设及治理服务。功能 描述 Dataphin全托管 全托管又称公共云多租户模式,只需购买...

DataWorks On MaxCompute使用说明

数据访问行为说明 MaxCompute支持跨项目查询表,因此,在数据开发(DataStudio)界面可通过指定项目名称的方式,跨项目查询DataWorks工作空间中的生产数据。跨项目访问表的方式及各界面执行所使用的账号说明,请见下表。说明 不同环境创建...

数据治理中心概述

数据治理中心可自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,提供...

离线同步数据质量排查

DataWorks标准项目分为开发数据源、生产数据源,在开发环境运行任务使用开发数据源,在生产环境运行任务使用生产数据源,再对数据数量和内容比对时,需要确认下使用的数据源环境,避免开发、生产查询不一致。在实际生产业务当中,在线数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库审计 数字证书管理服务(原SSL证书) 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用