EMR Workbench

阿里云EMR Workbench是一个综合性的大数据分析和开发环境,作为阿里云E-MapReduce的一部分,它提供了EMR Notebook和EMR Workflow两个核心功能。通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作...

SQL查询

工作空间已配置数据源:DataWorks的数据源分为引擎绑定时默认创建的引擎数据源和在数据源配置界面创建的自建数据源,若要操作非引擎数据源,请确保已创建数据源,详情请参见 创建并管理数据源。已拥有某数据源在数据分析模块的查询权限:...

DataWorks On MaxCompute使用说明

DataWorks基于 云原生大数据计算服务MaxCompute 轻松构建离线数仓分析系统。MaxCompute可通过DataWorks提供的可视化方式配置任务工作流、周期性调度执行任务及元数据管理,保障数据生产及管理的高效稳定。本文为您介绍在DataWorks上开发...

配置MaxCompute输出

大数据计算服务MaxCompute(原名ODPS)为您提供完善的数据导入方案,能够快速解决海量数据的计算问题。前提条件 配置MaxCompute输出节点前,您需要先配置好相应的输入或转换数据源,详情请参见 实时同步能力说明。背景信息 写入数据不支持...

Doris概述

统一数仓构建:一个平台满足统一的数据仓库建设需求,简化繁琐的大数据软件栈。基于Doris构建的统一数仓,替换了原来由Spark、Hive、Kudu、Hbase、Phoenix组成的旧架构,架构大大简化。数据湖联邦查询:通过外表的方式联邦分析位于Hive、...

通过向导模式配置离线同步任务

数据集成提供向导式的开发引导,您无需编写任何代码,通过在界面勾选数据来源与去向,并结合DataWorks调度参数,实现将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍向导模式配置离线同步任务的常规配置,各...

权限管理与规范化数据开发

其中生产环境的MaxCompute访问身份即调度访问身份,是开发任务发布到生产环境进行周期性调度运行时所使用的身份,通常情况下为保证调度任务顺利进行,比起开发者自己的身份来,调度访问身份往往拥有较大数据范围读写权限。生产环境...

场景:切换调度时区

分类 说明 修改后影响的工作空间范围 调度时区是 地域级别,修改的调度时区在本地域 所有工作空间 中生效。修改操作不可逆 调度时区修改后不可更改,请您谨慎操作。重要 若已在使用DataWorks的阿里云用户想要切换调度时区,需要注意该操作...

调优集群性能

如下图所示,某个表分布不均,存储节点0上的Shard_0和Shard_1中数据量较,而在存储节点1上的Shard_2和Shard_3中数据量较小,那么当您查询这个表时,较概率会出现存储节点0需要处理的数据多,存储节点1上需要处理的数据少的情况,...

离线同步任务运维

数据质量监控 数据集成部分目标端数据源支持配置产出表的数据质量监控,您可以进入数据质量规则页面,对数据同步写入的目标表配置数据质量校验规则。对于配置了数据质量监控规则的表,当表关联的调度节点运行(执行节点代码逻辑)完成后...

安全设置与其他

使用限制 启用页面查询内容脱敏 启用页面查询内容脱敏是对DataWorks工作空间范围生效,如果您需要所有工作空间在查询数据时对敏感信息均脱敏展示,则需对所有工作空间逐一开启该功能。说明 例如,工作空间A设置了脱敏展示,工作空间B未设置...

创建并使用MaxCompute表

进入数据开发(DataStudio)登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。新建MaxCompute表 您可在DataWorks表管理目录中新建,也可在具体业务流程下,针对该业务...

创建并使用MaxCompute表

进入数据开发(DataStudio)登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。新建MaxCompute表 您可在DataWorks表管理目录中新建,也可在具体业务流程下,针对该业务...

通过脚本模式配置离线同步任务

当您需要实现更精细化的配置管理时,您可以使用脚本模式配置离线同步任务,通过编写数据同步的JSON脚本并结合DataWorks调度参数使用,将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍脚本模式配置离线同步任务...

MaxCompute表数据

绑定MaxCompute引擎至DataWoks工作空间后,您可以直接在数据地图进行MaxCompute表的相关操作。包括数据检索、数据预览、查看元数据详情、查看数据血缘关系、分类分组管理数据表等操作。本文为您介绍如何在数据地图查看和管理MaxCompute表。...

概述

事实上,鉴于数据库研究在数据发现、数据管理、版本控制、数据清理和数据集成方面积累的专业知识,PolarDB for AI 可以为数据驱动的智能应用提供一站式的数据(包括:数据、特征和模型)服务来解决这种割裂状态,大大减少数据驱动的智能...

MaxCompute数据

说明 标准模式的工作空间支持数据源隔离功能,您可以分别添加并隔离开发环境和生产环境的数据源,以保护您的数据安全。详情请参见 数据源开发和生产环境隔离。您可在数据源配置页面,查看数据源使用的MaxCompute项目名称,确认数据最终读取...

StarRocks

步骤二:开发StarRocks任务(可选)选择StarRocks数据源 如果您的工作空间创建了多个StarRocks数据源,则需先在StarRocks节点编辑页面选择合适的数据源。如果仅创建了一个StarRocks数据源,则默认使用该数据源进行开发操作。说明 StarRocks...

MySQL节点

您可以通过创建MySQL节点,直接使用SQL语句对目标MySQL数据源进行数据开发。本文为您介绍如何创建并使用MySQL节点。前提条件 MySQL节点仅支持使用独享调度资源组,独享调度资源组的使用请参考文档:新增和使用独享调度资源组。已通过连接串...

编辑数据

数据源添加完成之后,您可以根据大屏展示的需要,编辑数据源的内容。推荐在画布编辑页面编辑数据源。除了可以编辑数据源,还可以在该页面完成 数据映射、添加过滤器 和设定数据 自动更新 时间。操作步骤 登录 DataV控制台。参考 使用模板...

MySQL数据

MySQL数据源为您提供读取和写入MySQL的双向通道,本文为您介绍DataWorks的MySQL数据同步的能力支持情况。支持的MySQL版本 离线读写:支持MySQL 5.5.x、MySQL 5.6.x、MySQL 5.7.x、MySQL 8.0.x,兼容 Amazon RDS for MySQL、Azure MySQL。离...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

MariaDB数据

MariaDB数据源为您提供读取和写入MariaDB的双向通道,本文为您介绍DataWorks的MariaDB数据同步能力支持情况。支持的MariaDB版本 离线读写 支持MariaDB 5.5.x、MariaDB 10.0.x、MariaDB 10.1.x、MariaDB 10.2.x、MariaDB 10.3.x版本,且离线...

数据开发:开发者

说明 目前DataWorks的节点分为数据同步类型节点与计算类型节点两类,实际开发过程中,您通常需要先通过离线同步任务将业务数据库中的数据同步至数仓中,再通过DataWorks计算节点对数仓中的表数据进行清洗加工。创建节点。您可通过如下两...

规划工作空间

本文介绍DataWorks适用于不同场景的工作空间规划方案。工作空间权限模型 DataWorks各主要模块针对工作空间的权限隔离设定有所不同:功能模块 权限模型 工作空间管理 不同的工作空间的是 完全隔离 的。不同的工作空间可以有不同的管理员、...

面临的业务挑战

越来越多的企业大数据分析已不再局限于传统的T+1场景,对数据的实时性分析和处理要求提出了更高要求。传统的批处理模式往往有数小时甚至数天的延迟,不能满足T+0的业务需要,用户要求在秒级,甚至毫秒级完成对海量数据分析。系统极复杂 ...

采集数据

由于平台已提供用于本教程所需测试数据及数据源,所以您需要在您的工作空间将该平台提供的数据源信息添加至您的工作空间,即可在您的工作空间访问平台提供的测试数据。本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操...

简介

HBase Ganos是什么 HBase Ganos是阿里云推出的一款包含管理 空间几何数据、时空轨迹、专题栅格、遥感影像的时空大数据引擎系统。系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等,...

采集数据

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。章节目标 将MySQL存储的用户基本信息及OSS存储的网站访问日志数据,通过数据集成服务同步至...

我的看板

数据来源 在工作台中创建并发布的数据看板内容,会同步在此处展示,若数据看板仅编辑完成,但是未发布,则在此处不展示。如需编辑某一看板内容,请单击页面右上角的 前往可视化工作台,编辑并发布对应数据看板后,刷新当前页面即可。操作...

范围选择器功能介绍

选择数据格式 在选中地图中的区域范围后,可自定义选择所需的范围数据格式内容,可选数据格式内容包括如下几种:JSON API:单击链接右侧的 图标,即可复制JSON数据的API链接。JEOJEON API:单击链接右侧的 图标,即可复制JEOJEON数据的API...

范围选择器功能介绍

选择数据格式 在选中地图中的区域范围后,可自定义选择所需的范围数据格式内容,可选数据格式内容包括如下几种:JSON API:单击链接右侧的 图标,即可复制JSON数据的API链接。GeoJSON API:单击链接右侧的 图标,即可复制GeoJSON数据的API...

产品简介

服务内容 服务大类 服务类型 服务内容 大数据专家咨询服务 大数据技术架构方案咨询 为客户提供构建和优化大数据体系的技术架构方案咨询服务,覆盖离线/实时数仓体系建设管理、数仓建模管理,数据开发管理,数据安全管理、数据质量管理、...

数据保护伞概述

数据保护伞是一款数据安全管理产品,为您提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等多种功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文为您介绍数据保护伞的使用流程、使用限制等内容。使用流程...

亿海蓝-航运大数据的可视化案例

——亿海蓝CTO 客户简介 亿海蓝是中国的航运大数据公司,做为中国最大的AIS数据服务运营商,发展目标是通过大数据技术推动全球航运物流与互联网的融合,加速航运产业转型升级。亿海蓝目前已为全球上百万行业用户提供数据服务,客户涵盖港口...

授权信息

本文为您介绍 开源大数据平台 E-MapReduce(EMR)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。开源大数据平台 E-MapReduce(EMR)的RAM代码(RamCode)为 emr,emr-apm-server,ecm,emr-serverless-spark,dls...

DataWorks V3.0

发布版本:DataWorks V3.0 发布时间:2019年12月18日 发布范围:全球所有已开通DataWorks的地域 发布内容:DataWorks V2.0仅支持MaxCompute计算引擎,DataWorks V3.0全新升级了多引擎架构,在MaxCompute的基础上,新增开源大数据引擎E-...

产品架构

数据订阅的工作原理 数据订阅支持实时拉取RDS实例的增量日志,用户可以通过DTS提供的SDK数据订阅服务端来订阅增量日志,同时可以根据业务需求,实现数据定制化消费。DTS服务端的日志拉取模块主要实现从数据源抓取原始数据,通过解析、过滤...

整体架构

AnalyticDB MySQL版 是基于数据库大数据一体化的理念和趋势,在工程上深度打磨出的云原生数据仓库。技术架构 AnalyticDB MySQL版 采用云原生架构,计算存储分离、冷热数据分离,支持高吞吐实时写入和数据强一致,兼顾高并发查询和大吞吐批...

概述

AnalyticDB PostgreSQL版 向量分析可以通过AI算法提取非结构化数据的特征,并利用特征向量作为非结构化数据的唯一标识,帮您快速且低成本地实现对非结构化数据检索和对结构化数据关联分析。向量数据库简介 在现实世界中,绝多数的数据都...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用