产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

DataWorks on EMR数据安全方案

大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

服务支持

DataV-Board 数据看板 DataV-TwinFabric 孪生仿真 DataV-Atlas 可视分析地图 DataV-Card 可视分析创作间 常见问题 DataV-Board 数据看板 配置项常见问题 组件使用常见问题 账号配置常见问题 视频流接入常见问题 数据源配置常见问题 ...

数据质量教程概述

数据质量数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

数据质量教程概述

数据质量数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

产品优势

数据安全中心DSC(Data Security Center)可扫描和识别海量数据,帮您实时获取数据的安全状态。本文介绍 数据安全中心 的产品优势。合规性 使用数据安全中心产品,可以帮助企业满足等保2.0对“云计算环境下安全审计”及“个人信息保护”的...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

质量评估

质量评估通过用户自定义质量检查计划,根据用户设置的数据质量规则执行面向不同计算资源的质量检查任务,通过数据质量监控报告展现系统整体数据质量概览及多维度细分数据质量情况。质量评估通过完整性、准确性、一致性、唯一性、时效性、...

相关的云服务

DataWorks作为阿里云一站式大数据开发与治理平台,通常会与计算引擎产品联合使用,此外使用DataWorks进行数据集成时通常联合进行数据传输的数据源产品一起使用。本文为您介绍典型场景下,使用DataWorks时通常会使用到的其他云产品。计算...

获取数据

数据是可视化的原材料,本文档为您介绍获取春节期间全国的空气质量数据的方法。您可以从空气检测官网上,自行获取全国空气质量历史数据。本示例中,采用了2017年1月1日至2017年2月2日,全国1497个监测点的数据

时空引擎版本发布记录

修复由于栅格数据带有 NAN 和 INF 等数据,在导入和统计值会出错的问题。4.3 新特性 ST_PixelAsPolygon:将栅格像素转换为Polygon对象。ST_PixelAsPolygons:将栅格像素转换为Polygon对象集合。ST_PixelAsPoint:将栅格像素转换为基于点...

2020年

修复用默认参数构建矢量金字塔点数据后,顶级瓦片数据量过问题。2020年9月 内核小版本(V1.1.4)类别 名称 描述 相关文档 新增 GROUP_ID函数 新增GROUP_ID()函数。GROUP_ID 分区表 支持在分区表上并发创建索引CREATE INDEX ...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级网格分解成高层级...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版(兼容Oracle)时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级...

功能简介

质量评估即根据用户设置的数据质量规则执行面向不同计算资源的质量检查任务,包括运行质量检查计划和场景画布两种途径;通过数据质量监控报告,查看系统整体数据质量概览及多维度细分数据质量情况。质量评估通过完整性、准确性、一致性、...

功能简介

质量评估即根据用户设置的数据质量规则执行面向不同计算资源的质量检查任务,包括运行质量检查计划和场景画布两种途径;通过数据质量监控报告,查看系统整体数据质量概览及多维度细分数据质量情况。质量评估通过完整性、准确性、一致性、...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

数据模型概述

DDM目前支持逻辑模型和物理模型建模,其中物理模型又分为关系型数据模型和非关系型数据模型,支持的大数据引擎为MaxCompute、Hive。说明 Hadoop的MR调优参数属于底层,DDM是数据建模工具,支持设置表、字段等物理属性。

管理数据质量待发布对象

导入的发布包文件中存在数据质量的变更对象时,将在待发布数据质量页面为您展示,您可在待发布数据质量页面对数据质量对象进行管理和发布。待发布 数据质量 对象入口 请参见 发布包总览入口,进入发布包 总览 管理页面。单击 数据质量 页签...

管理数据质量待发布对象

导入的发布包文件中存在数据质量的变更对象时,将在待发布数据质量页面为您展示,您可在待发布数据质量页面对数据质量对象进行管理和发布。待发布 数据质量 对象入口 请参见 发布包总览入口,进入发布包 总览 管理页面。单击 数据质量 页签...

技术发展趋势

规模爆炸性增长 随着8K、5G、IoT、大数据、AI等系列技术的发展,数据量迎来了爆发式增长。IDC在《Data Age 2025》的报告中预测,从2018年到2025年,全球数据将从33ZB急速增长到175ZB,比2016年产生的数据量增加了十倍。这表明注重数据价值...

云产品集成

您可以使用 DMS 录入云数据库 OceanBase 的数据,通过 DMS 的全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能,帮助企业高效、安全地挖掘数据价值,助力企业数字化转型。什么是数据管理DMS 支持的数据库...

源为PolarDB-X的功能规范和约束说明

数据质量风险声明 一些变更或切流操作可能会导致源库和目标库结构不一致等数据质量问题,具体示例如下:当源实例主备之间存在数据延迟时,新写入主库的数据未能及时更新至备库。此时,如源实例进行主备切换,DTS会使用源实例的备库作为源...

源为PolarDB-X的功能规范和约束说明

数据质量风险声明 一些变更或切流操作可能会导致源库和目标库结构不一致等数据质量问题,具体示例如下:当源实例主备之间存在数据延迟时,新写入主库的数据未能及时更新至备库。此时,如源实例进行主备切换,DTS会使用源实例的备库作为源...

数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

数据集成支持的数据

离线集成支持的数据数据源 读取 写入 大数据存储型数据源 MaxCompute 支持 支持 Hologres 支持 支持 IMPALA 支持 支持 TDH Inceptor 支持 支持 StarRocks 支持 不支持 Hudi 支持 支持 Doris 支持 不支持 GreenPlum 支持 支持 TDengine ...

消息模板

Dataphin支持配置租户级别的告警消息模板,您可根据不同的模块查看并编辑告警消息模板的内容,包括离线计算、实时计算、基线监控、数据质量数据服务。本文为您介绍如何查看及修改消息模板。使用限制 支持超级管理员和系统管理员编辑消息...

账单数据订阅及查询分析

您可在用户中心订阅不同类型的账单数据,例如,计费项明细账单、计费项账单按天汇总等。订阅成功后,账单数据将会定时同步至MaxCompute,您...相关文档 大数据分析工具的常见问题和解决方法,详情请参见 大数据分析工具的常见问题和解决方法。

增量导出发布包

支持 规划、数据架构、研发、标签架构、标签、数据标准、数据质量数据安全 对象类型。规划:包括公共定义、数据板块、计算源、项目、数据源。数据架构:包括主题域、业务对象、业务活动。研发:包括离线管道、事实逻辑表、维度逻辑表、...

增量导出发布包

支持 规划、数据架构、研发、标签架构、标签、数据标准、数据质量数据安全 对象类型。规划:包括公共定义、数据板块、计算源、项目、数据源。数据架构:包括主题域、业务对象、业务活动。研发:包括离线管道、事实逻辑表、维度逻辑表、...

消息模板

Dataphin支持配置租户级别的告警消息模板,您可根据不同的模块查看并编辑告警消息模板的内容,包括离线计算、实时计算、实时集成、基线监控、数据质量数据服务。本文为您介绍如何查看及修改消息模板。背景信息 Dataphin中阿里云短信服务...

2020年

2020年10月 修复用默认参数构建矢量金字塔点数据后,顶级瓦片数据量过问题。2020年10月 V1.1.4 内核小版本 类别 名称 描述 相关文档 发布时间 新增 ali_decoding插件 支持ali_decoding插件,用于数据库间增量同步DML语句。无 2020年9月...

EMR+DLF数据湖解决方案

通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持数据湖的多种管理如数据生命周期,湖格式自动优化,存储分析等。同时支持多源数据入湖以及一站式数据探索的能力。本文为您介绍EMR+DLF数据湖方案...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

数据质量风险监控

数据质量风险监控主要针对数据的准确性、一致性和完整性。本教程使用DataWorks数据质量(DQC)功能,完成数仓各层次的数据质量监控。前提条件 首先您需要完成教程 搭建互联网在线运营分析平台,并保证您的DataWorks工作空间创建区域为华东2...

对接使用CDH与CDP

数据质量规则配置 在DataWorks上使用CDH引擎时,可使用DataWorks的数据质量服务进行数据查、对比、质量监控、SQL扫描和智能报警等功能,数据质量服务的详细操作可参见 数据质量概述。数据地图配置 在DataWorks上使用CDH引擎时,可使用...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库备份 DBS 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用