准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

上传数据

上传数据操作入口 您可以在数据开发的头部菜单栏、业务流程下的表分组或表管理页面中进行上传数据的操作,入口如下所示。在 数据开发 页面的头部菜单栏中。在 数据开发 页面业务流程下的表分组中。标准模式下,在 表管理 页面中,对开发表...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

模型管理

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。单击左上方的 图标,选择 全部产品>数据建模>维度建模。在 维度建模 页面单击 图标,进入 模型列表。查看模型列表及...

下线任务

通过生产环境运维中心的 周期任务 界面下线的任务,在开发环境将默认回到编辑状态,不会进入回收站,您可在数据开发(DataStudio)界面搜索节点名称查找该节点。任务下线流程 周期调度任务的下线流程如下。步骤一:删除开发环境任务 在数据...

创建业务流程

完成创建后,您可以利用数据开发功能,对工作空间的数据进行深入分析和计算。前提条件 开始本操作前,请确保您已经在工作空间中准备好业务数据表 bank_data 和其中的数据,以及结果表 result_table。详情请参见 建表并上传数据。背景信息 ...

创建MaxCompute数据

数据源创建完成后,您可根据需要执行如下操作:计算任务开发与调度:DataWorks的数据开发与运维中心模块,为您提供MaxCompute任务的开发与调度能力,若您需要基于该MaxCompute数据源进行MaxCompute任务开发,或周期性调度MaxCompute相关...

OceanBase 数据库支持版本

MySQL 模式 基于 MySQL 模式进行应用开发文档是为应用程序开发人员准备的 OceanBase 数据文档的入门文档,解释了 OceanBase 数据开发背后的基本概念。展示并示例如何使用 OceanBase 的 MySQL 租户。普通租户(MySQL 模式)本文档为...

发布任务

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。发布任务。检查通过的文件变更操作可在 任务发布>创建发布包 界面将操作发布至生产环境,有以下两种发布方式可选:单个...

全景视角

数据生产视角:在数据开发场景下,建议您使用数据生产视角,关注查看数据开发过程中表、开发任务、数据服务、数据质量等方面的情况。详情请参见:数据生产视角。说明 您当前登录的账号需要拥有 AliyunDataWorksFullAccess 权限,才能使用 ...

系统配置

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。单击左上方的 图标,选择 全部产品>数据治理>数据保护伞,单击 立即体验,进入数据保护伞。说明 若...

删除数据开发项目

调用 DeleteFlowProject 接口删除数据开发项目。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String ...

数据开发常见问题

本文为您介绍数据开发相关的常见问题。任务开发常见问题 引擎基于DataWorks操作的常见问题 表相关 如何可视化新建表?为什么EMR通过DataWorks可视化建表失败报错:call emr exception?如何对生产表添加字段?如何将本地数据上传到...

创建并使用PAI Designer

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。右键单击目标业务流程,选择 新建节点>算法>PAI Designer。在 新建节点 对话框中输入节点 名称,并选择 路径,单击 ...

加工数据

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。在 数据开发 页面,展开目标业务流程。右键单击 MaxCompute,选择 新建表。在 新建表 对话框中,输入表名称,单击 新建...

客户案例

价值体现 基于飞天数据平台产品,快狗打车不仅机器成本节约30%以上,数据开发效率提升100%。从Java Storm迁移到Flink SQL使实时计算开发周期大大减少,维护更加容易,数据一致性得到更好地保障,提升了业务监控大屏的准确性和实时性,...

绑定交互式分析实例

进入DataWorks工作间之后,单击左上角的 图标,选择 全部产品>数据开发与运维>HoloStudio,进入HoloStudio开发界面。进入HoloStudio后,在 PG管理 单击 刷新,即可看到已成功绑定DB,之后您可以开始使用HoloStudio开发。选择已有工作空间...

修改数据开发项目

调用 ModifyFlowProject 接口,修改数据开发项目。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String...

透视分析:按研发链路

支持您按照研发链路(数据同步和数据开发)查看和分析工作空间内DataWorks离线同步任务和DataWorks调度任务运行情况及资源消耗详情。便于您了解当前花费较多的资源类别、识别运行失败的任务,合理调整消费结构,发现阻塞任务运行的问题并...

数据模型概述

DDM目前支持逻辑模型和物理模型建模,其中物理模型又分为关系型数据模型和非关系型数据模型,支持的大数据引擎为MaxCompute、Hive。说明 Hadoop的MR调优参数属于底层,DDM是数据建模工具,支持设置表、字段等物理属性。

Databricks Runtime版本说明

Databricks数据洞察的内核引擎是Databricks Runtime,Databricks Runtime包括Apache Spark,并在此基础上进行了大量的功能和性能优化,可以显著提高大数据分析的可用性、性能和安全性。Databricks Runtime版本与Databricks官方保持一致,...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

批量操作

操作步骤 登录DataWorks控制台,进入 数据开发 页面后,在顶部的快捷操作按钮中单击 批量操作 按钮,即可打开批量操作页面。批量修改。在 批量操作 页面中,您可以在顶部页签中选择对 节点、资源 或者 函数 进行批量处理。您可以在页签中的...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

应用场景

Databricks数据洞察(简称DDI)的核心引擎是Databricks Runtime和Databricks Delta ...实时数仓 利用Databricks Delta Lake的ACID事务特性,可以构建云上大数据的实时数仓。icmsDocProps={'productMethod':'created','language':'zh-CN',};

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

大数据AI公共数据集分析

教程简介 阿里云DataWorks基于多种数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。本教程通过DataWorks,联合云原生数据计算服务MaxCompute,使用数据AI公共数据集(淘宝、飞猪、阿里音乐、...

引用SQL组件

您可通过创建数据开发(DataStudio)的SQL组件节点使用组件,基于组件快速新建数据处理节点,提高开发效率。本文为您介绍如何引用组件。前提条件 已准备所需使用的组件,详情请参见 定义SQL组件。已创建SQL组件节点,详情请参见 创建并管理...

一键MaxCompute数据同步节点

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。创建 业务流程。如果您已有 业务流程,则可以忽略该步骤。鼠标悬停至 图标,选择 新建业务流程。在 新建业务流程 ...

应用开发概览

本文介绍了 OceanBase 数据库应用开发常用的文档链接。规划数据库对象 二级目录 文档名称 规划数据对象 创建数据库 创建表 创建索引 数据写入 二级目录 文档名称 数据写入 插入数据 更新数据 删除数据 替换数据 数据读取 二级目录 文档名称...

DsgStopSensIdentify

您可登录 DataWorks控制台,进入数据开发(DataStudio)页面,单击右上方当前登录用户名称,选择菜单>用户信息,获取租户ID。JobId Long 否 1000001 数据保护伞的识别任务ID。可通过调用 DsgRunSensIdentify 接口获取。返回数据 名称 类型 ...

任务调试流程

调试运行单个任务 数据开发概述,在左侧导航栏的数据开发或手动业务流程模块,双击业务流程目录下的目标节点,进入该节点的编辑页面。调试运行任务。在节点编辑页面,使用节点工具栏中的运行或高级运行调试代码逻辑,也可通过快捷运行调试...

设置全局Spark参数

您可参考 Spark官方文档 自定义全局Spark参数,并配置全局Spark参数的优先级是否高于指定模块内(数据开发、数据分析、运维中心)的SPARK参数。本文为您介绍如何设置全局Spark参数。背景信息 Apache Spark是用于进行规模数据分析的引擎。...

生成数据API

如果没有开通Hologres,也可以使用 数据开发 的MySQL数据源来测试。操作步骤 由于数据服务生成的API需发布至网关统一管理。若您未开通API网关,请 免费开通;若您已开通,请跳过此步骤。新建业务流程。业务名称:retail_e_commerce_2。API...

数据集成审批策略

背景信息 支持管理员按 源端、目的端 数据源的组合来定义需要被审批的数据集成任务,包括:在数据集成或数据开发页面保存任务等操作。例如,管理员定义了 mysql_1 数据源作为源端、odps_1 数据源作为目的端的数据集成任务审批策略,则开发...

调度周期:月调度

配置示例 配置路径 您需要进入数据开发节点的编辑页面,单击右侧导航栏的 调度配置,在 调度配置>时间属性 区域配置节点的调度周期。场景示例 配置详情 目标任务配置在每月最后一天运行,则每月最后一天生成的实例会正常调度执行,而其它...

一键上传本地文件

进入 数据开发 页面,鼠标悬停至顶部菜单栏的 图标。单击 一键本地上传文件。在 一键本地文件上传 对话框中,配置各项参数。参数 描述 目标库 Hologres的数据库名称。目标schema 当前数据库的Schema名称。如果您没有新建Schema,则只能选择...

一键同步MaxCompute数据

进入 数据开发 页面,鼠标悬停至顶部菜单栏的 图标。单击 一键MaxCompute数据同步。在 新建节点 对话框中,输入 节点名称,并选择 目标文件夹 和 数据库。单击 提交。在编辑节点页面,配置各项参数。参数 描述 外部表来源 已有外部表:表示...

Hologres开发:周期性调度

并单击上方新建Hologres开发,输入作业逻辑,单击保存-前往DataWorks调度,示例SQL如下:在HoloStudio中,单击左侧导航栏的 图标,进入数据开发页面。鼠标悬停至 图标,单击 Hologres开发。配置 新建节点 对话框的 节点名称、目标文件夹 及...

为什么会空跑

场景四:实例属性为空跑 检查数据开发调度配置界面该节点时间属性是否设置为 空跑调度,该实例状态为 实例属性为空跑。场景五:临时工作流中未被选择的实例 当补数据时,假设C节点依赖B节点,B节点依赖A节点,如果补数据选择补AC节点,则该...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用