什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

大数据安全治理的难点

这些链路都是数据机密性受损的直接渠道,数据流转安全策略定义不清楚或未定义、底层链路未禁用、API安全防护缺失、人员行为未做风控 都会导致数据安全事件发生。例如,非法出境(出域)、脱库、泄露等。交付 数据系统负责每日产出用于...

受众与核心能力

产品定位 DataWorks致力于为数据开发者、数据分析师、数据资产管理者,打造一个具备开放自主开发与全栈数据研发能力的一站式、标准化、可视化、透明化的智能大数据全生命周期云研发平台。DataWorks赋予用户仅通过单一平台,即可实现数据...

网络连通解决方案

添加数据源时需要根据数据源所在网络环境,通过对应的网络解决方案,实现Dataphin与数据源的网络连通。本文为您介绍数据源在不同网络环境中与Dataphin的网络连通方案。网络连通方案 根据数据源所在的网络环境,在下图中选择对应的网络连通...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

产品概述

产品描述 Dataphin是集产品、技术、方法论于一体的智能大数据平台建设引擎,为您提供数据引入、规范定义、建模研发、资产管理、数据服务等全链路智能数据建设及治理服务。功能 描述 Dataphin全托管 全托管又称公共云多租户模式,只需购买...

PolarDB-X适用场景

数据集中存储 场景描述 该场景也称“数据大集中”或“数据归集”,属于企业数据架构中的ODS层,具有承担各垂直业务数据源的数据汇总功能。高并发写入、容量存储、多维度查询、低成本流出是该场景的主要诉求。产品能力 PolarDB-X 可根据...

ListDoctorHDFSDirectories-批量获取HDFS目录分析结果

数据的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据数据量大小。冷数据的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据数据量大小。极冷数据的是 90 日以内...

数据分析整体趋势

大数据数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...

数据源中心

HIVE/IMPALA数据源 参数 是否必选参数 说明 数据源 数据源类型。数据源名称 是 输入数据源的名称。描述 否 输入数据源的描述。IP主机名 是 输入连接HIVE/IMPALA的IP地址。端口 是 HIVE/IMPALA 数据源类型对应的端口为10000。用户名 是 ...

数据格式描述文件

本文介绍索引数据描述文件(Ingestion Spec文件)。Ingestion Spec(数据格式描述)是Druid对要索引数据的格式以及如何索引该数据格式的一个统一描述,它是一个JSON文件,一般由三部分组成。{"dataSchema":{.},"ioConfig":{.},...

数据倾斜诊断

AnalyticDB PostgreSQL版 提供的智能诊断数据倾斜功能,可以每小时定期自动诊断数据库内的所有表,并生成相应的诊断信息表,供您检测库内所有表的倾斜情况。注意事项 智能诊断数据倾斜功能仅支持存储弹性模式实例,且内核版本须满足以下...

ListDoctorHiveTables-批量获取Hive表分析结果

数据的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据数据量大小。冷数据的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据数的据量大小。极冷数据的是 90 日以内...

GetDoctorHDFSCluster-获取HDFS分析结果

数据的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。4062349775577 Unit string 指标单位。MB Description string 指标描述。Size of the warm data size ...

AlterDatabase

调用AlterDatabase接口修改数据库的信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是 ...

登录临时实例

您可以创建临时实例(即将实例数据恢复到该临时实例),然后登录到临时实例中确认数据是否正确,最后再将临时实例的数据恢复到目标RDS实例。本文介绍如何登录临时实例。前提条件 RDS实例需满足以下条件:版本:RDS SQL Server 2008 R2 ...

GetDoctorHiveTable-获取Hive表分析结果

数据的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。217715 Unit string 指标单位。MB Description string 指标描述。Size of the cold data size FreezeDataSize ...

GetDoctorHiveDatabase-获取Hive库信息

文件指的是 1 GB 以上大小的文件。Name string 指标名称。largeFileCount Value long 指标值。1000 Unit string 指标单位。Description string 指标描述。Number of large files MediumFileCount object 中文件个数。中文件指的是 128 ...

GetDoctorHDFSDirectory-获取HDFS特定目录分析结果

数据的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。4062349775577 Unit string 指标单位。MB Description string 指标描述。Size of the warm data size ...

质量规则模板类型

实时元表模板类型 模板详情分类 描述 一致性 实时离线对比 当实时数据与离线数据使用相同的统计逻辑时,用于数据的最终值差异的校验。如果差异较,可能存在较大数据质量的问题需要进行确认和修复。实时多链路对比 高可用场景下,需要构建...

质量规则模板类型

实时元表模板类型 模板详情分类 描述 一致性 实时离线对比 当实时数据与离线数据使用相同的统计逻辑时,用于数据的最终值差异的校验。如果差异较,可能存在较大数据质量的问题需要进行确认和修复。实时多链路对比 高可用场景下,需要构建...

ListDoctorHiveDatabases-批量获取 Hive 库信息

数据的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of cold files FreezeDataSize object 极...

GetDoctorHiveCluster-获取 Hive 集群信息

数据的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of cold files FreezeDataSize object 极...

错误代码

ERROR 7022:Physical database connection pool is full,database name:x 问题描述数据访问代理连接后端数据库的连接池已满。排查方法:查看是否有耗时 SQL 影响连接池。如果耗时 SQL 是合理的,则应该是连接池本身设置不合理导致,需在...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。更多信息,请参见 Apache Hudi官网。权限说明 仅支持 超级管理员、数据源管理员、...

概述

随着业务的快速发展,企业数据呈几何倍增长,数据量庞大、复杂、各类数据间标准不一致,往往会出现数据难以管理的现象。DataWorks智能数据建模服务,将无序、杂乱、繁琐、庞大且难以管理的数据,进行结构化有序的管理。使企业中的数据产生...

数据建模:智能数据建模

智能数据建模是阿里云DataWorks自主研发的智能数据建模产品,沉淀了阿里巴巴十多年来数仓建模方法论的最佳实践,包含数仓规划、数据标准、维度建模及数据指标四大模块,帮助企业在搭建数据中台、数据集市建设过程中提升建模及逆向建模的...

历史版本常见问题

版本范围 5.4.1-*5.4.12-16444832(不包含)查询分片缺失及查询数据正确问题 现象描述 在小于等于负整数的范围查询场景中,当分库分表列的类型是整数时,对于类似id的范围查询,分库分表路由结果会有概率出现个别分表缺失,导致数据扫描...

Power BI连接

说明 若连接失败请确认数据库连接信息是否正确,检查数据库白名单是否添加Power BI所在服务器IP地址,确认无误后重新登录。配置项 描述 服务器 AnalyticDB PostgreSQL版实例的外网连接地址和端口号。示例值:gp-bp152460513z*o-master.gpdb...

通过RAM角色授权模式配置数据

背景信息 数据源是数据同步任务的基础,同时关系着企业云上数据的安全性。DataWorks支持您使用更高安全系数的 RAM角色授权模式 配置并访问OSS、AnalyticDB for MySQL 2.0、LogHub、Tablestore和Hologres等部分数据源,以提升云上数据的安全...

DataHub数据

DataHub数据源作为数据中枢,为您提供读取和写入DataHub数据库的双向通道,能够快速解决海量数据的计算问题。本文为您介绍DataWorks的DataHub数据同步的能力支持情况。支持的版本 DataHub Reader通过DataHub的Java SDK读取DataHub中的数据...

数据治理

数据地图 为什么数据地图数据总览页存储量和存储趋势图相差较数据地图血缘展示延迟问题 数据地图新建表搜不到 当前表业务逻辑变更如何通知下游?哪些类型的Hive表支持在数据地图中预览?数据保护伞 数据保护伞为什么有时候查询脱敏有...

2023年

本文介绍2023年 云原生数据仓库AnalyticDB PostgreSQL版 存储弹性模式的内核功能发布记录。您可以在 云原生数据仓库AnalyticDB PostgreSQL版 控制台将实例升级至最新发布的小版本。升级小版本的具体操作,请参见 版本升级。2023年12月(V7....

UploadSession

调用 openRecordWriter 方法,生成RecordWriter实例,其中参数blockId用于标识此次上传的数据,也描述数据在整个表中的位置,取值范围为[0,20000],当数据上传失败,可以根据blockId重新上传。查看上传:请求方式:同步。调用 getStatus ...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV中调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...

SQL结果集导出

数据管理DMS 支持导出SQL结果集,您可以在DMS中按需编写查询的SQL语句,提取并导出相关数据。前提条件 数据库类型如下:数据库类型 关系型数据库:MySQL:RDS MySQL、PolarDB MySQL版、MyBase MySQL、PolarDB分布式版、其他来源MySQL SQL ...

2021年

2021年12月 内核小版本(V1.1.19)类别 名称 描述 相关文档 新增 sql mapping PolarDB PostgreSQL版(兼容Oracle)支持SQL映射功能,将错误的SQL映射为正确的SQL,从而避免由于错误SQL引起的问题。polar_sql_mapping PX支持并行Update 跨机...

DataWorks On MaxCompute使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用