离线数仓构建流程概述

步骤:引入数据 规范定义 基于Dataphin数据研发模块,明确统计指标口径并完成配置开发,相关的定义包括业务对象、业务活动、原子指标、业务限定和派生指标。步骤四:规范定义 规范建模 基于规范定义部分定义好的概念以及Dataphin的规范...

离线数仓构建流程概述

步骤:引入数据 规范定义 基于Dataphin数据研发模块,明确统计指标口径并完成配置开发,相关的定义包括业务对象、业务活动、原子指标、业务限定和派生指标。步骤四:规范定义 规范建模 基于规范定义部分定义好的概念以及Dataphin的规范...

功能简介

数据同步为用户提供批量、实时多源异构数据的便捷同步或接入能力,系统提供完善的数据接入配置、任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台、数据源及应用系统间的数据汇聚需求。通过数据同步的自定义同步任务...

后续指引

介绍:数据迁移 实践:数据迁移最佳实践 常见问题:数据上传下载常见问题 规模数据迁移 MaxCompute提供MMA(MaxCompute Migration Assist)迁移工具支撑规模数据迁移。开发与分析 数据类型 MaxCompute支持数据类型版本,为您介绍各...

数据同步

数据同步提供批量、实时多源异构数据的便捷同步或接入能力,系统提供完善的数据接入配置、任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台、数据源及应用系统间的数据汇聚需求。同时支持对存储在基于ArcGIS、超图等...

功能简介

数据同步为用户提供批量、实时多源异构数据的便捷同步或接入能力,系统提供完善的数据接入配置、任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台、数据源及应用系统间的数据汇聚需求。同时支持对存储在基于ArcGIS、...

冷热分层

背景信息 在海量大数据场景下,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

通过日志服务导入至数仓版

创建投递任务 您可以通过日志服务数据处理模块中的导出功能,将Logstore中采集到的日志投递到 AnalyticDB MySQL 数仓版(3.0)。登录 日志服务控制台。在Project列表区域,单击目标Project。在 日志存储>日志库 页签中,依次展开目标...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

查看敏感数据识别结果

仅支持在 结构化数据、半结构化数据、非结构化数据大数据 分类下分别选择一个或多个数据类型,不支持跨分类同时选择多个数据类型。如果您未选中任意数据类型,数据安全中心默认展示所有数据类型下的敏感数据识别结果。数据模板:在 ...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

数据扫描和识别

支持扫描的数据源类型如下:结构化数据:RDS、PolarDB、PolarDB-X、MongoDB、OceanBase、自建数据库 非结构化数据:OSS 大数据:TableStore、MaxCompute、ADB-MYSQL、ADB-PG 数据源授权完成后需要多长时间完成扫描?DSC 完成数据源授权后,...

图层配置项说明

数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...

图层配置项说明

数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...

外部表概述

但这两种方法都有不足之处:第一种方法需要在MaxCompute系统外部做一次中转,如果OSS数据量太,还需要考虑如何并发来加速,无法充分利用MaxCompute的规模计算能力。第二种方法通常需要申请UDF网络访问权限,还需要开发者自己控制作业...

配置数据质量监控

本文为您介绍如何通过数据质量实现表数据监控。前提条件 在进行本实验前,请确保已完成 采集数据 和 加工数据。已通过数据集成将存储于...后续操作 数据加工完成后,您可通过数据分析模块数据进行可视化展示,详情请参见 数据可视化展现。

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

配置数据质量监控

本文为您介绍如何通过数据质量实现表数据监控。前提条件 在进行本实验前,请确保已完成 采集数据 和 加工数据。已通过数据集成将存储于...后续操作 数据加工完成后,您可通过数据分析模块数据进行可视化展示,详情请参见 数据可视化展现。

DataWorks OpenAPI概述

DataWorks为您提供了涵盖租户、元数据、数据开发、运维中心、数据集成等多功能模块的OpenAPI接口,不同API的QPS限制、每日调用次数上限和支持使用的DataWorks服务版本存在差异。您可参考本文了解各OpenAPI支持的DataWorks版本及地域、...

数据库分组

若您需要在SQL变更或结构设计中快速载入多个数据库,可以创建一个数据库分组,将多个数据库环境、引擎类型相同的数据库绑定成为一个分组。本文介绍如何创建数据库分组。背景信息 当您的业务部署在多地域,且存在多个数据库时,您每次做...

数据迁移与同步FAQ

对比项 DTS数据迁移 DTS数据同步 适用场景 主要用于迁移数据上云,例如将本地数据库、ECS上的自建数据库或第方云数据库迁移至阿里云Redis实例。主要用于两Redis数据库之间的数据实时同步,例如从实例A同步至实例B。可用于异地多活、...

数据质量入门

数据质量帮助您及时感知源端数据的变更与ETL(Extract Transformation Load)中产生的脏数据,自动拦截问题任务,阻断脏数据向下游蔓延。避免任务产出问题数据,影响正常使用和业务决策。本文示例配置表数据质量监控规则,保障产出的表数据...

管理数据源权限

您可以在数据源管理页面,分享数据源权限给相应的工作空间,并进入被分享的工作空间查看该数据源。本文为您介绍如何管理数据源权限及查看分享的数据源。背景信息 通常数据源会承载数据的具体地址、账户和密码等敏感信息,但普通开发人员仅...

规格说明

模块 功能 基础版 分析地图 项目数量 3个 地图数量 1 数据源数量 10 数据集数量 1 自定义参数数量 10 图层数量 20 地图书签数量 10 数据数据源支持 PolarDB PostgreSQL RDS PostgreSQL 连接配额 3个 SQL分析 支持 数据空间 ...

新建数据

数据元管理通过分析业务流程,抽象关键业务对象和业务对象属性,并把关键业务对象新建为数据元,并配置数据元的类型、长度、质量校验函数和引用数据字典,为模型标准化设计及数据治理过程中的质量监控提供规则依据。本文介绍如何新建数据元...

新建数据

数据元管理通过分析业务流程,抽象关键业务对象和业务对象属性,并把关键业务对象新建为数据元,并配置数据元的类型、长度、质量校验函数和引用数据字典,为模型标准化设计及数据治理过程中的质量监控提供规则依据。本文介绍如何新建数据元...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

全局级模块权限控制

DataWorks预设部分角色权限,例如,控制某用户是否有全局模块数据地图的类目管理权限管控。当DataWorks的预设角色不能满足您的需求时,您还可以通过创建自定义租户角色,控制某个租户角色是否有某个全局级模块的管理或访问权限。例如,控制...

数据源开发和生产环境隔离

背景信息 同一个名称的数据源存在开发环境和生产环境两套配置,在配置数据源时,您可基于标准模式工作空间对应底层两个数据库或数据仓库的背景,针对不同环境设置不同的数据源信息。在同步任务执行过程中,可由执行环境控制离线同步任务所...

业务视角管理:数据专辑

数据专辑功能帮助您按照业务视角,进行数据表的分类、分级组织和管理。您可以将指定表等加入目标专辑中进行收纳,实现快速、便捷地检索和定位。本文为您介绍如何创建并使用数据专辑,及数据专辑的管理等操作。使用限制 仅支持DataWorks专业...

创建反向实例

背景信息 DTS支持为正常运行的同步实例一键创建反向增量同步实例,在业务写入数据库由原同步实例的源库切换为目标库时,帮助您将数据库切换后的增量业务数据同步至原业务写入数据库,常应用于数据库容灾场景下的数据回传。前提条件 原实例...

如何构建自定义模块

数据模型 构建自定义模块数据模型的详细操作请参见 新建数据模型。逻辑流 构建自定义模块逻辑模型的详细操作请参见 编排逻辑流。页面 构建自定义模块页面模型的详细操作请参见 页面布局。步骤、发布自定义模块 自定义模块构建完成后,您...

Trino概述

支持丰富的数据源:Hive Cassandra Kafka MongoDB MySQL PostgreSQL SQL Server Redis Redshift 本地文件 支持高级数据结构,具体如下:数组和Map数据 JSON数据 GIS数据 颜色数据 功能扩展能力强,提供了多种扩展机制:扩展数据连接器 ...

数据地图概述

数据地图是在元数据基础上提供的企业数据目录管理模块,涵盖全局数据检索、元数据详情查看、数据预览、数据血缘和数据类目管理等功能。数据地图可以帮助您更好地查找、理解和使用数据。元数据采集与接入 MaxCompute数据 如果您使用了...

功能简介

洞察是一款自助式数据挖掘分析型,面向业务管理者、运营、业务分析师等人员提供低使用门槛的智能、自动化、全面、精准的数据诊断和分析能力,智能发现数据规律或异常,实现从数据到知识的提取,辅助业务决策。几乎每业务每天都存在业务...

概览

概览界面分为 供应商基础信息、数据看板、常用功能、待办事项 等四个模块。供应商基础信息 供应商基础信息模块左侧展示 供应商名称 与 阿里云UID;单击右侧 更多信息,跳转至 配置>账户信息>基础信息 界面。数据看板 数据看板 模块包含 ...

概览

概览界面分为 供应商基础信息、数据看板、常用功能、待办事项 等四个模块。渠道商基础信息 渠道商基础信息模块左侧展示 渠道商名称 与 阿里云UID;单击右侧 更多信息,跳转至 配置>账户信息>基础信息 界面。数据看板 数据看板 模块包含 ...

入门概述

模块将指引您快速完成一个完整的数据开发和运维操作。说明 如果您是第一次使用DataWorks,请确认已经根据 准备工作 模块的操作,准备好账号和工作空间角色等内容后,登录DataWorks控制台,单击相应工作空间后的 进入数据开发,即可进行...

DataWorks模块使用说明

使用流程概览:参考文档:DataWorks数据建模 子模块数据开发(DataStudio)功能说明:数据开发(DataStudio)是一站式数据开发平台,支持在线开发MaxCompute、EMR、Hologres、CDP、ADB等多种数据引擎的数据处理任务。它集成了强大的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 数据传输服务 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用