MaxCompute作业概述

数据开发作业实践:使用MaxCompute分析IP来源最佳实践、PyODPS节点实现结巴中文分词 等。数据类型 MaxCompute数据开发支持三个数据类型版本:1.0数据类型版本、MaxCompute 2.0推出了兼容开源主流产品的 2.0数据类型版本 和 Hive兼容数据...

创建并使用PAI Studio节点

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。在 数据开发 页面,鼠标悬停至 图标,单击 新建节点>算法>PAI Studio。在 新建节点 对话框中,输入...

基于模型生成ETL代码

维度表、明细表、汇总表等模型表发布后,DataWorks智能数据建模的模型开发功能支持快速生成代码框架,帮助您提高后续数据开发效率。本文为您介绍如何通过模型开发功能生成代码框架。前提条件 模型表已发布,操作详情请参见 发布模型至引擎...

表管理

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。在左侧导航栏单击 表管理。新建、查找及编辑目标表 新建表及导入表数据 在表管理页面,您可单击 及 ...

功能发布记录(2024年)

2024.2.6 所有地域 所有DataWorks用户 系统配置 2024-01 功能名称 功能描述 发布时间 发布地域 使用客户 相关文档 数据开发与数据分析的查询结果支持脱敏展示 数据保护伞支持对E-MapReduce表数据进行分类分级、敏感数据识别、数据脱敏展示...

ClickHouse SQL

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。右键单击目标业务流程,选择 新建节点>ClickHouse>ClickHouse SQL。在 新建节点 对话框中输入节点 ...

数据服务

背景信息 数据服务提供了数据中台建设过程中的数据服务化能力,面向数据开发者提供覆盖各个加工阶段统一体验的、便捷的数据查询转服务、服务管理、服务运维能力;面向数据资产管理者提供服务的统计分析、服务用量统计分析,实现数据中台...

对接使用CDH与CDP

以下简称 CDH)与CDP(Cloudera Data Platform,以下简称CDP)集群对接的能力,在保留CDH集群或CDP集群作为存储和计算引擎的前提下,您可以使用DataWorks的任务开发、调度、数据地图(元数据管理)和数据质量等一系列的数据开发和治理功能...

运维阶段

背景信息 数据开发人员主要需要处理以下事项:程序异常处理、性能优化。调度异常处理。数据质量监控规则异常分析、规则优化。数据异常的核查。运维阶段的流程包括分析影响、制定与实施方案和验证实施方案。操作步骤 分析影响。运维人员或...

概述

DataWorks为您提供了多个实验教程,帮助您从前期的环境准备、数据采集,到后期的数据开发、结果展示,端到端了解DataWorks使用的全流程,更加熟悉产品的核心功能。DataWorks目前提供的产品教程如下:简单开发应用教程 简单用户画像分析...

为工作空间添加空间成员

创建简单的周期调度任务,请参见 数据开发:开发者。执行完整示例教程,请参见 实际开发场景示例。本文主要以使用正式开发环境为例,为您介绍开发前如何添加及管理DataWorks工作空间成员。操作步骤 进入 工作空间 管理页面。登录 DataWorks...

下载建模工具(DDM)

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。单击左上方的 图标,选择 全部产品>数据建模>DATABLAU。单击页面右上方的 下载DDM。说明 如果单击...

数仓开发任务流

说明 若您使用的是极简模式的控制台,请单击控制台左上角的 图标,选择 全部功能>集成与开发(DTS)>数据开发>数仓开发。在 项目空间 区域,单击目标项目空间名称。可选:新建业务场景。在项目空间的左侧导航栏中,选择>业务场景。在 新建...

Data Lake Analytics节点

如果您需要修改在 数据开发 页面测试时使用的任务执行资源,请单击工具栏中的 图标,选择相应的独享调度资源组。说明 因为访问专有网络环境的数据源需要使用独享调度资源组执行任务,所以此处必须选择测试连通性成功的独享调度资源组。单击...

创建手动任务

您可以在DataWorks的数据开发(DataStudio)模块创建手动任务,并在生产环境的运维中心管理手动任务。本文为您介绍如何创建手动任务,并将手动任务发布到生产环境。使用说明 若任务不需要发布生产环境操作生产环境引擎,您可选择 新建临时...

按应用关联

说明 需在数据开发模块创建场景节点,且该场景节点被场景引用。单节点 对应数据开发模块,节点模式下已上线的节点任务。指标 对应数据标准模块中的创建的指标。数据标准 对应数据标准模块中的数据元、数据字典、命名标准、质量函数。数据源...

行业模型模版

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。单击左上方的 图标,选择 全部产品>数据建模>维度建模。在顶部菜单栏单击 行业模型模版,进入行业模型模版页面。该页面...

建模空间

模型设计师设置好 数据模型设计空间 与 数据研发工作空间 的关系后,模型设计师在进行模型(汇总表、维度表、明细表、应用表)发布时,可以选择将模型物化到被关联的某一个研发空间,后续数据开发工程师即可在对应的工作空间进行数据开发...

上传数据

上传数据操作入口 您可以在数据开发的头部菜单栏、业务流程下的表分组或表管理页面中进行上传数据的操作,入口如下所示。在 数据开发 页面的头部菜单栏中。在 数据开发 页面业务流程下的表分组中。标准模式下,在 表管理 页面中,对开发表...

GetFile

该参数与 DataWorks控制台 中,EMR Spark Streaming和EMR Streaming SQL数据开发任务,编辑页面右侧导航栏的“配置>时间属性>启动方式“对应。InputParameters Array of InputContextParameter 节点上下文输入参数。该参数与 DataWorks控制...

使用节点组

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。在左侧业务流程目录下,双击目标业务流程,进入该业务流程的编辑面板。新建节点组。生成节点组。您可根据业务需求,...

独享资源组

切换生产调度运行时任务使用的调度资源组:在数据开发界面通过发布流程切换生产任务执行时使用的调度资源组。在数据开发界面打开节点 调度配置 界面,在 资源属性 区域选择任务调度运行时需要使用的资源组。并提交发布。详情请参见 配置...

操作审计

节点代码恢复:数据开发回收站可以还原近期删除的节点,但注意节点还原后节点ID是新生成的。使用详情可参考文档:回收站 MaxCompute表数据恢复:提供数据备份与恢复功能,系统会自动备份数据的历史版本(例如被删除或修改前的数据)并保留...

准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

离线数仓构建流程概述

步骤五:规范建模 数据开发 基于 规范定义 明确好的统计指标口径和 规范建模 部分定义好的模型完成规范建模数据开发。包括维度逻辑表、事实逻辑表、原子指标、业务限定、派生指标。步骤一:开发维度逻辑表 步骤二:开发事实逻辑表 步骤三:...

离线数仓构建流程概述

步骤五:规范建模 数据开发 基于 规范定义 明确好的统计指标口径和 规范建模 部分定义好的模型完成规范建模数据开发。包括维度逻辑表、事实逻辑表、原子指标、业务限定、派生指标。步骤一:开发维度逻辑表 步骤二:开发事实逻辑表 步骤三:...

模型管理

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。单击左上方的 图标,选择 全部产品>数据建模>维度建模。在 维度建模 页面单击 图标,进入 模型列表。查看模型列表及...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

下线任务

通过生产环境运维中心的 周期任务 界面下线的任务,在开发环境将默认回到编辑状态,不会进入回收站,您可在数据开发(DataStudio)界面搜索节点名称查找该节点。任务下线流程 周期调度任务的下线流程如下。步骤一:删除开发环境任务 在数据...

数据治理中心概述

基于合理利用资源的目的:DataWorks提供消费和任务运行情况、MaxCompute表的数量及存储情况、资源使用概况及明细,助力数据开发者及管理者查看和分析工作空间的整体资源情况,为合理使用整体资源做辅助判断。详情请参见 透视分析:按资源...

数据开发概述

数据开发包括编码研发和规范建模。编码研发用于构建计算任务,例如创建SQL代码任务、Shell任务、Python任务、MR任务和Spark任务;规范建模用于构建逻辑化的数据模型。前提条件 若需进行实时开发,需已购买实时研发增值服务。详情请参见 ...

数据保护伞概述

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。单击左上方的 图标,选择 全部产品>数据治理>数据保护伞,单击 立即体验,进入数据保护伞。说明 若...

绑定交互式分析实例

进入DataWorks工作间之后,单击左上角的 图标,选择 全部产品>数据开发与运维>HoloStudio,进入HoloStudio开发界面。进入HoloStudio后,在 PG管理 单击 刷新,即可看到已成功绑定DB,之后您可以开始使用HoloStudio开发。选择已有工作空间...

使用MaxCompute独享Tunnel进行数据同步

离线同步任务使用独享传输资源 单表离线同步任务使用独享传输资源 进入数据开发界面,打开或新建离线同步任务节点,在MaxCompute数据源的 Tunnel资源组 属性中,选择独享传输资源组。Tunnel资源组 默认值为公共传输资源组。如果您没有可用...

数据开发概述

数据开发包括编码研发和规范建模。编码研发用于构建计算任务,例如创建SQL代码任务、Shell任务、Python任务、MR任务和Spark任务;规范建模用于构建逻辑化的数据模型。前提条件 若需进行实时开发,需已购买实时研发增值服务并且当前租户已...

发布任务

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。发布任务。检查通过的文件变更操作可在 任务发布>创建发布包 界面将操作发布至生产环境,有以下两种发布方式可选:单个...

发布模型至引擎

模型创建成功后,您需将维度表、明细表、汇总表、应用表通过发布操作物化...后续步骤 模型发布至目标引擎后,您可进入DataWorks的数据开发页面,基于该汇总表进行相关的数据开发操作。数据开发的功能介绍,详情请参见 数据开发界面功能介绍。

加工数据

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。在 数据开发 页面,展开目标业务流程。右键单击 MaxCompute,选择 新建表。在 新建表 对话框中,输入表名称,单击 新建...

DataWorks OpenAPI概述

DataWorks为您提供了涵盖租户、元数据、数据开发、运维中心、数据集成等多个功能模块的OpenAPI接口,不同API的QPS限制、每日调用次数上限和支持使用的DataWorks服务版本存在差异。您可参考本文了解各OpenAPI支持的DataWorks版本及地域、...

数据

说明 若您使用的是极简模式的控制台,请单击控制台左上角的 图标,选择 全部功能>集成与开发(DTS)>数据开发>任务编排。在页面下方 任务流 区域单击目标任务流名称,进入目标任务流编辑页面。单击页面右上角的 前往运维。在 发布列表 页签...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云原生大数据计算服务 MaxCompute 数据库备份 DBS 云数据库 RDS 云原生数据湖分析 (文档停止维护) 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用