快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

大数据安全治理的难点

存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,...

概述

说明 关于AUTO模式数据库与DRDS模式数据库的介绍,请参见 AUTO模式数据库与DRDS模式数据库。原理 在 PolarDB-X 中,如果创建表时通过 AUTO_INCREMENT 指定了自增列,为了保证自增列的全局唯一性,则自动为该表创建并关联一个Sequence对象,...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

云产品集成

您可以使用 DMS 录入云数据库 OceanBase 的数据,通过 DMS 的全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能,帮助企业高效、安全地挖掘数据价值,助力企业数字化转型。什么是数据管理DMS 支持的数据库...

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行...

实验介绍

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集,...

周期任务补数据

如果主键或来源表未发生变更,您可以选择全表补数据模式或指定字段补数据模式:全表:适用于数据表的所有字段都需要补数据的场景。说明 不包括注册上挂字段。指定字段:适用于需要自定义补数据的字段的场景,受到如下约束:有变更字段:...

周期任务补数据

如果主键或来源表未发生变更,您可以选择全表补数据模式或指定字段补数据模式:全表:适用于数据表的所有字段都需要补数据的场景。说明 不包括注册上挂字段。指定字段:适用于需要自定义补数据的字段的场景,受到如下约束:有变更字段:...

进入组件分析模式

进入分析模式数据面板 BI分析子组件类:单击资产面板中的 BI分析 模块,单击或拖拽模块列表中支持分析模式的子组件,通过添加这些子组件可以快捷创建包含特定种类子组件的分析模式地图组件。图 4.添加特定子组件 图 5.进入子组件分析模式 ...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

Delta Lake概述

Delta Lake以数据为中心,围绕数据流走向(数据从流入数据湖、数据组织管理和数据查询到流出数据湖)推出了一系列功能特性,协助您搭配第三方上下游工具,搭建快捷、易用和安全的数据湖。背景信息 通常的数据湖方案是选取大数据存储引擎...

装饰条

BI分析数据配置面板中的详细操作说明,请参见 BI分析模式数据面板功能介绍。配置字段说明 字段 说明 图片路径 装饰条的图片路径,数据面板中可以不配置 img 字段内容,可从配置面板中的 装饰条 配置项获取。超链接地址 装饰条的URL超链接...

CREATE DATABASE

DEFAULT_SINGLE(版本要求:PolarDB-X 5.4.17-16921956及以上)指定AUTO模式数据库是否使用单表自动打散至各个DN节点的分布策略,该选项仅对AUTO模式数据库有效,对DRDS模式数据库无效。参数取值如下:当DEFAULT_SINGLE='on' 时,AUTO模式...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

iframe

BI分析数据配置面板中的详细操作说明,请参见 BI分析模式数据面板功能介绍。url链接:配置组件所显示页面的链接,与 链接 配置项功能相同。如果同时配置,优先使用数据中的 url链接 字段内容。说明 当组件是以分析模式添加后,您可以单击...

萤石云播放器

BI分析数据配置面板中的详细操作说明,请参见 BI分析模式数据面板功能介绍。视频流地址:视频流地址,与配置面板中的 视频流地址 配置项功能相同。若两者都进行了配置,则优先使用数据面板中的配置。说明 当组件是以分析模式添加后,您可以...

迁移

例如,若您源库为 PolarDB-X 1.0 实例中的数据库,名称为“test1”,目标库为 PolarDB-X 2.0中的AUTO模式数据库,名称为“test2”,则需在 PolarDB-X 2.0实例中创建DRDS模式数据库作为中继数据库,名称为“test2_drdstoauto”。创建的目标...

RTMP视频流播放器

BI分析数据配置面板中的详细操作说明,请参见 BI分析模式数据面板功能介绍。配置字段说明 字段 说明 视频流地址 视频流地址,与 视频流地址 配置项功能相同。如果同时配置,则以 source 字段中的内容为准。视频流类型 视频流类型,与 视频...

创建数据库

本文介绍如何在 PolarDB-X 实例...模式 可选择 AUTO模式 或 DRDS模式,两种模式的详细介绍请参见 AUTO模式数据库与DRDS模式数据库。备注说明 备注该数据库的相关信息,便于后续数据库管理。该参数为非必填项,最多支持256个字符。单击 确定。

创建数据板块

创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据研发效率,研发人员职能边界模糊,计算存储预算有限制,推荐 此模式。创建Basic模式数据板块,请...

图层配置项说明

数据图元三维图标图层数据面板示例 配置空间构建数据源 如果您在创建三维城市项目时,使用了 空间构建数据 模式,并且项目内包含各种适用业务展示图层效果的空间数据内容。在场景编辑器内配置图层的数据面板时,您还可以使用 空间构建数据...

创建数据板块

创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据研发效率,研发人员职能边界模糊,计算存储预算有限制,推荐 此模式。创建Basic模式数据板块,请...

数据分析概述

功能概述 SQL查询 SQL查询是使用标准的SQL语句,来查询和分析存储在MaxCompute中的大数据,详情请参见 SQL查询。您可以通过编写SQL语句,对有查询权限的数据源进行快速的数据查询与分析操作,详情请参见 功能概览。DataWorks SQL查询提供了...

执行SQL基本操作

创建、查看和删除表 说明 以下示例以DRDS模式数据库为例说明,DRDS模式数据库介绍请参见 AUTO模式数据库与DRDS模式数据库。创建表。创建单表:CREATE TABLE single_tbl(id int,name varchar(30),primary key(id));创建一个对目标列(如ID列...

文档更新动态(2023年)

更新说明 创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成配置优化 新增Apache Doris数据源的离线集成。...

接入其他自建或其他云厂商数据库实例

三种不同接入方式的功能对比 功能 直连接入 集中模式数据库网关 主机模式数据库网关(推荐)数据库监控指标 支持 支持 支持 实时性能 支持 支持 支持 实时会话 支持 支持 支持 空间分析 支持 支持 支持 慢请求分析 支持 支持 支持 主机监控...

图层配置项说明

数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...

图层配置项说明

数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...

图层配置项说明

数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...

计费逻辑说明

资源费用明细:数据服务API调用 数据质量 数据质量可对任务产出的表数据进行数据质量监控,DataWorks将根据数据质量规则实例数量计费。资源费用明细:数据质量 OpenAPI DataWorks提供OpenAPI,您可基于OpenAPI实现业务定制化开发,...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

功能优势

特点及场景 模式 数据召回率 数据量 QPS 小数据量(写入数据较少)、高QPS、精度无损。典型应用场景:人脸门禁考勤 违禁图片库 黑名单库 无损 100%百万级别 单节点100 QPS,利用维度表实现线性扩展。中等规模数据量、高QPS、有较少精度损失...

JindoFS介绍和使用

JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS的访问;提供块存储模式(Block),以充分利用OSS的海量存储能力和优化文件系统元数据的操作。JindoFS纯客户端模式(SDK...

数据类型版本说明

开启/关闭hive兼容模式数据类型版本。setproject odps.sql.hive.compatible=true/false;修改建议如下:项目当前使用2.0数据类型版本,如果发现必须使用的组件不支持2.0数据类型。您可以使用如下方式解决与不支持2.0数据类型组件的对接问题...

SQL窗口介绍

安全协同模式数据库默认返回行数为200行,系统规定查询返回行数上限为3000行。若需要调整查询返回的行数,可由管理员在 安全与规范>安全规则>SQL窗口 的 基础配置项 中修改。说明 若您需要查询更多数据,且不受安全规则限制,可将数据导出...

功能简介

数据探索面向行业客户和业务人员,提供工具内容一体化的业务模型构建平台,实现低代码、可视化构建全场景专家模型,重塑大数据服务创新模式。将业务数据沉淀为智能数据或智能算子,通过可视化的拖拉拽和简单的图形化条件设定进行模型编排,...

索引诊断

注意事项 索引诊断功能同时支持 AUTO模式数据库与DRDS模式数据库。语法 INSPECT[FULL]INDEX[FROM table_name][MODE={STATIC|DYNAMIC|MIXED}]参数说明 MODE:诊断模式,支持3种诊断模式,不设置MODE参数时,默认为STATIC模式。STATIC:用于...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云原生大数据计算服务 MaxCompute 数据库备份 DBS 云数据库 RDS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用