大数据三个模块-大数据三个模块文档介绍内容-阿里云

离线数仓构建流程概述

步骤三：引入数据规范定义基于Dataphin数据研发模块，明确统计指标口径并完成配置开发，相关的定义包括业务对象、业务活动、原子指标、业务限定和派生指标。步骤四：规范定义规范建模基于规范定义部分定义好的概念以及Dataphin的规范...

离线数仓构建流程概述

步骤三：引入数据规范定义基于Dataphin数据研发模块，明确统计指标口径并完成配置开发，相关的定义包括业务对象、业务活动、原子指标、业务限定和派生指标。步骤四：规范定义规范建模基于规范定义部分定义好的概念以及Dataphin的规范...

功能简介

数据同步为用户提供批量、实时多源异构数据的便捷同步或接入能力，系统提供完善的数据接入配置、任务运行监控等功能，有效保障数据接入的稳定性和可控性，满足各类平台、数据源及应用系统间的数据汇聚需求。通过数据同步的自定义同步任务...

后续指引

介绍：数据迁移实践：数据迁移最佳实践常见问题：数据上传下载常见问题大规模数据迁移 MaxCompute提供MMA（MaxCompute Migration Assist）迁移工具支撑大规模数据迁移。开发与分析数据类型 MaxCompute支持三种数据类型版本，为您介绍各...

数据同步

数据同步提供批量、实时多源异构数据的便捷同步或接入能力，系统提供完善的数据接入配置、任务运行监控等功能，有效保障数据接入的稳定性和可控性，满足各类平台、数据源及应用系统间的数据汇聚需求。同时支持对存储在基于ArcGIS、超图等...

功能简介

数据同步为用户提供批量、实时多源异构数据的便捷同步或接入能力，系统提供完善的数据接入配置、任务运行监控等功能，有效保障数据接入的稳定性和可控性，满足各类平台、数据源及应用系统间的数据汇聚需求。同时支持对存储在基于ArcGIS、...

冷热分层

背景信息在海量大数据场景下，随着业务和数据量的不断增长，性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案，推出了数据流入、数据组织管理、数据查询和数据流出等特性，同时提供了数据的ACID和CRUD操作...

通过日志服务导入至数仓版

创建投递任务您可以通过日志服务数据处理模块中的导出功能，将Logstore中采集到的日志投递到 AnalyticDB MySQL 数仓版（3.0）。登录日志服务控制台。在Project列表区域，单击目标Project。在日志存储>日志库页签中，依次展开目标...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理与服务平台，提供企业级数据资产构建能力和一致性使用体验，助力客户快速构建数据智能平台，实现数据资源统一管理，挖掘潜在规律，优化业务决策，让大数据真正的驱动客户业务。...

查看敏感数据识别结果

仅支持在结构化数据、半结构化数据、非结构化数据或 大数据 分类下分别选择一个或多个数据类型，不支持跨分类同时选择多个数据类型。如果您未选中任意数据类型，数据安全中心默认展示所有数据类型下的敏感数据识别结果。数据模板：在 ...

数据迁移

本文为您介绍数据迁移的最佳实践，包含将其他业务平台的业务数据或日志数据迁移至MaxCompute，或将MaxCompute的数据迁移至其它业务平台。背景信息传统关系型数据库不适合处理海量数据，如果您的数据存放在传统的关系型数据库且数据量庞大...

数据扫描和识别

支持扫描的数据源类型如下：结构化数据：RDS、PolarDB、PolarDB-X、MongoDB、OceanBase、自建数据库非结构化数据：OSS 大数据：TableStore、MaxCompute、ADB-MYSQL、ADB-PG 数据源授权完成后需要多长时间完成扫描？DSC 完成数据源授权后，...

图层配置项说明

数据图元组件、栅格瓦片、地形瓦片、三维瓦片和其他：在这五个类型图层数据面板中，数据配置和普通图表组件一致，可配置静态数据源、API数据源和空间构建数据源内容，还可将图层数据接口作为区块数据接口，在可视化应用中配置更丰富的...

图层配置项说明

数据图元组件、栅格瓦片、地形瓦片、三维瓦片和其他：在这五个类型图层数据面板中，数据配置和普通图表组件一致，可配置静态数据源、API数据源和空间构建数据源内容，还可将图层数据接口作为区块数据接口，在可视化应用中配置更丰富的...

外部表概述

但这两种方法都有不足之处：第一种方法需要在MaxCompute系统外部做一次中转，如果OSS数据量太大，还需要考虑如何并发来加速，无法充分利用MaxCompute的大规模计算能力。第二种方法通常需要申请UDF网络访问权限，还需要开发者自己控制作业...

配置数据质量监控

本文为您介绍如何通过数据质量实现表数据监控。前提条件在进行本实验前，请确保已完成采集数据和加工数据。已通过数据集成将存储于...后续操作数据加工完成后，您可通过数据分析模块对数据进行可视化展示，详情请参见数据可视化展现。

数据源管理概述

功能介绍多数据源类型接入：Dataphin内置丰富的数据源类型，支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息，请参见 Dataphin支持的数据源。自定义数据源类型：在内置的...

数据源管理概述

功能介绍多数据源类型接入：Dataphin内置丰富的数据源类型，支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息，请参见 Dataphin支持的数据源。自定义数据源类型：在内置的...

配置数据质量监控

本文为您介绍如何通过数据质量实现表数据监控。前提条件在进行本实验前，请确保已完成采集数据和加工数据。已通过数据集成将存储于...后续操作数据加工完成后，您可通过数据分析模块对数据进行可视化展示，详情请参见数据可视化展现。

DataWorks OpenAPI概述

DataWorks为您提供了涵盖租户、元数据、数据开发、运维中心、数据集成等多个功能模块的OpenAPI接口，不同API的QPS限制、每日调用次数上限和支持使用的DataWorks服务版本存在差异。您可参考本文了解各OpenAPI支持的DataWorks版本及地域、...

数据库分组

若您需要在SQL变更或结构设计中快速载入多个数据库，可以创建一个数据库分组，将多个数据库环境、引擎类型相同的数据库绑定成为一个分组。本文介绍如何创建数据库分组。背景信息当您的业务部署在多个地域，且存在多个数据库时，您每次做...

数据迁移与同步FAQ

对比项 DTS数据迁移 DTS数据同步适用场景主要用于迁移数据上云，例如将本地数据库、ECS上的自建数据库或第三方云数据库迁移至阿里云Redis实例。主要用于两个Redis数据库之间的数据实时同步，例如从实例A同步至实例B。可用于异地多活、...

数据质量入门

数据质量帮助您及时感知源端数据的变更与ETL（Extract Transformation Load）中产生的脏数据，自动拦截问题任务，阻断脏数据向下游蔓延。避免任务产出问题数据，影响正常使用和业务决策。本文示例配置表数据质量监控规则，保障产出的表数据...

管理数据源权限

您可以在数据源管理页面，分享数据源权限给相应的工作空间，并进入被分享的工作空间查看该数据源。本文为您介绍如何管理数据源权限及查看分享的数据源。背景信息通常数据源会承载数据的具体地址、账户和密码等敏感信息，但普通开发人员仅...

规格说明

模块功能基础版分析地图项目数量 3个地图数量 1个数据源数量 10个数据集数量 1个自定义参数数量 10个图层数量 20个地图书签数量 10个数据库数据源支持 PolarDB PostgreSQL RDS PostgreSQL 连接配额 3个 SQL分析支持数据空间 ...

新建数据元

数据元管理通过分析业务流程，抽象关键业务对象和业务对象属性，并把关键业务对象新建为数据元，并配置数据元的类型、长度、质量校验函数和引用数据字典，为模型标准化设计及数据治理过程中的质量监控提供规则依据。本文介绍如何新建数据元...

新建数据元

数据元管理通过分析业务流程，抽象关键业务对象和业务对象属性，并把关键业务对象新建为数据元，并配置数据元的类型、长度、质量校验函数和引用数据字典，为模型标准化设计及数据治理过程中的质量监控提供规则依据。本文介绍如何新建数据元...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎，为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起，DataWorks不断沉淀阿里巴巴大数据建设方法论，支撑数据中台建设，同时与...

全局级模块权限控制

DataWorks预设部分角色权限，例如，控制某用户是否有全局模块数据地图的类目管理权限管控。当DataWorks的预设角色不能满足您的需求时，您还可以通过创建自定义租户角色，控制某个租户角色是否有某个全局级模块的管理或访问权限。例如，控制...

数据源开发和生产环境隔离

背景信息同一个名称的数据源存在开发环境和生产环境两套配置，在配置数据源时，您可基于标准模式工作空间对应底层两个数据库或数据仓库的背景，针对不同环境设置不同的数据源信息。在同步任务执行过程中，可由执行环境控制离线同步任务所...

业务视角管理：数据专辑

数据专辑功能帮助您按照业务视角，进行数据表的分类、分级组织和管理。您可以将指定表等加入目标专辑中进行收纳，实现快速、便捷地检索和定位。本文为您介绍如何创建并使用数据专辑，及数据专辑的管理等操作。使用限制仅支持DataWorks专业...

创建反向实例

背景信息 DTS支持为正常运行的同步实例一键创建反向增量同步实例，在业务写入数据库由原同步实例的源库切换为目标库时，帮助您将数据库切换后的增量业务数据同步至原业务写入数据库，常应用于数据库容灾场景下的数据回传。前提条件原实例...

如何构建自定义模块

数据模型构建自定义模块数据模型的详细操作请参见新建数据模型。逻辑流构建自定义模块逻辑模型的详细操作请参见编排逻辑流。页面构建自定义模块页面模型的详细操作请参见页面布局。步骤三、发布自定义模块自定义模块构建完成后，您...

Trino概述

支持丰富的数据源：Hive Cassandra Kafka MongoDB MySQL PostgreSQL SQL Server Redis Redshift 本地文件支持高级数据结构，具体如下：数组和Map数据 JSON数据 GIS数据颜色数据功能扩展能力强，提供了多种扩展机制：扩展数据连接器 ...

数据地图概述

数据地图是在元数据基础上提供的企业数据目录管理模块，涵盖全局数据检索、元数据详情查看、数据预览、数据血缘和数据类目管理等功能。数据地图可以帮助您更好地查找、理解和使用数据。元数据采集与接入 MaxCompute数据如果您使用了...

功能简介

洞察是一款自助式数据挖掘分析型，面向业务管理者、运营、业务分析师等人员提供低使用门槛的智能、自动化、全面、精准的数据诊断和分析能力，智能发现数据规律或异常，实现从数据到知识的提取，辅助业务决策。几乎每个业务每天都存在业务...

概览

概览界面分为供应商基础信息、数据看板、常用功能、待办事项等四个模块。供应商基础信息供应商基础信息模块左侧展示供应商名称与阿里云UID；单击右侧更多信息，跳转至配置>账户信息>基础信息界面。数据看板数据看板模块包含 ...

概览

概览界面分为供应商基础信息、数据看板、常用功能、待办事项等四个模块。渠道商基础信息渠道商基础信息模块左侧展示渠道商名称与阿里云UID；单击右侧更多信息，跳转至配置>账户信息>基础信息界面。数据看板数据看板模块包含 ...

入门概述

本模块将指引您快速完成一个完整的数据开发和运维操作。说明如果您是第一次使用DataWorks，请确认已经根据准备工作模块的操作，准备好账号和工作空间角色等内容后，登录DataWorks控制台，单击相应工作空间后的进入数据开发，即可进行...

DataWorks模块使用说明

使用流程概览：参考文档：DataWorks数据建模子模块：数据开发（DataStudio）功能说明：数据开发（DataStudio）是一站式大数据开发平台，支持在线开发MaxCompute、EMR、Hologres、CDP、ADB等多种大数据引擎的数据处理任务。它集成了强大的...

大数据 三个模块

新品推荐

大数据三个模块