从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。产品架构 DataWorks十多年...
数据处理后,需要将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。本文以倾斜数据处理后为例,介绍如何添加处理后数据到数据管理。前提条件 已新建数据处理任务,具体操作,请参见 新建数据处理任务。操作...
背景信息 数据服务提供了数据中台建设过程中的数据服务化能力,面向数据开发者提供覆盖各个加工阶段统一体验的、便捷的数据查询转服务、服务管理、服务运维能力;面向数据资产管理者提供服务的统计分析、服务用量统计分析,实现数据中台...
数据处理 支持倾斜数据处理能力,可以将OSGD格式数据转化为S3M数据,再将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。支持对数据处理任务进行管理。支持查看数据处理任务详情,包括任务的基本信息、处理的...
数据处理 支持倾斜数据处理能力,可以将OSGB格式数据转化为S3M数据,再将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。支持对数据处理任务进行管理。支持查看数据处理任务详情,包括任务的基本信息、处理的...
这两种ID都可以在阿里云控制台中获取。通过 RDS控制台 获取 VPC ID 和 实例ID。图 1.获取数据库实例ID 图 2.获取VPC ID 如果您的数据库安装在VPC内的ECS上,则需要配置该ECS的 VPC ID 和 实例ID。图 3.获取ECS的实例ID 图 4.获取ECS的VPC ...
构建数据中台,行业领域模型快速沉淀 场景:快速构建数据仓库,有效治理数据质量,实现政企客户各部门数据的业务协同和共享。痛点:以政务服务为例,政务服务部门众多,业务系统复杂、流程长,数据来源多且更新频率高;数据口径标准、数据...
数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...
数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...
数据服务(OneService)是基于Dataphin建设数据中台的最后一步。数据服务作为统一的数据服务出口,实现了数据的统一市场化管理,有效地降低数据开放门槛的同时,保障了数据开放的安全。前提条件 已购买 数据服务 增值服务,开通Dataphin ...
对原生产数据库的高兼容性,帮助客户实现业务平滑迁移到PolarDB国产数据库,用户的使用习惯基本不变,数据库平台非常方便的对接用户内部各类系统和监控告警平台。DTS迁移工具同时提供数据回写原生产库,确保支持回切并同步至流处理平台进行...
什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...
开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...
支持扫描的数据源类型如下:结构化数据:RDS、PolarDB、PolarDB-X、MongoDB、OceanBase、自建数据库 非结构化数据:OSS 大数据:TableStore、MaxCompute、ADB-MYSQL、ADB-PG 数据源授权完成后需要多长时间完成扫描?DSC 完成数据源授权后,...
在大屏中调用数据服务API 进入DataV控制台中的 我的可视化 页面,单击 新建可视化。选择一个模板,单击 创建,本文以 智能工厂 模板为例。模板中的组件自带了静态数据,下文将以把模板中间的基本折线图改为调用上文创建好的查询成交金额...
背景信息 云原生数据库 PolarDB 分布式版(简称 PolarDB-X)是由阿里巴巴自主研发的云原生分布式数据库,为您提供高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库服务。详情请参见 什么是云原生数据库 PolarDB 分布式版。前提条件...
支持的数据库部署位置(接入方式)阿里云实例 有公网IP的自建数据库 通过数据库网关DG接入的自建数据库 通过云企业网CEN接入的自建数据库 ECS上的自建数据库 通过专线/VPN网关/智能接入网关接入的自建数据库 阿里云实例 通过数据库网关DG接...
数据服务中的API分组的作用是什么,与API网关中的分组有什么关联?如何合理设置API分组?最多可以创建多少个API分组?什么情况下要开启API返回结果分页功能?生成API是否支持POST请求?生成API是否支持HTTPS协议?为什么数据服务无法连接...
在控制台删除数据库后,为什么仍能看到这个数据库?删除数据库的操作是在后台异步执行的,如果数据库较大,删除可能需要一定的时间。如果经过较长时间仍未删除成功,可能是因为存在MDL锁导致删除操作被阻塞或删除失败,排查方法请参考 查看...
Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...
数据集成:支持常见数据源的实时、离线数据集成,数据集成过程中支持灵活自定义数据的处理逻辑,帮助解决企业数据孤岛的痛点。简单易用:提供覆盖数据全生命周期的数据流转及处理能力。通过提供图形化、向导式的开发模式,智能预警及自主...
使用指引 如果您是第一次使用数据库网关,您可以参考下述步骤开始使用:准备工作 新建数据库网关 添加数据库 为什么选择数据库网关 数据库网关提供安全可靠、低成本的数据库接入服务,通过数据库网关您可以安全且低成本地将第三方云或本地...
背景信息 MaxCompute即阿里云大数据计算服务,适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化...
背景信息 MaxCompute即阿里云大数据计算服务,适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化...
支持存储扩容,可以在控制台中进行扩容。存储空间满了,数据是否可以备份?审计数据可以通过控制台进行备份,备份的数据存储在对象存储OSS中。存储空间已经清空,为何控制台还是显示存储空间满?SLS清除数据任务一般会有1至2小时的延迟,...
在一些数据同步场景,脏数据的出现会导致任务同步效率下降,以关系数据库写出为例,默认是执行batch批量写出模式,在遇到脏数据时会退化为单条写出模式(以找出batch批次数据具体哪一条是脏数据,保障正常数据正常写出),但单条写出效率会...
本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...
冷数据文件的格式是什么?目前支持CSV、IBD 和ORC格式。如何判断当前表或分区是否归档成功?归档完成后,您可以通过以下两种方式来查看表或分区是否归档成功:执行 SHOW CREATE TABLE table_name;命令查看表结构信息,以此来确认表或者分区...
数据安全中心DSC根据为不同行业预先定义的敏感数据关键字段,扫描MaxCompute、OSS、阿里云数据库服务(RDS、PolarDB-X、PolarDB、OceanBase、表格存储等)和自建数据库中的数据,通过敏感数据规则,判断和打标敏感数据,为数据安全审计、...
说明 如果服务器与数据库审计系统之间的网络无法连通,则一个数据库审计实例只能对一台服务器中的数据库进行审计。示例三,您在阿里云账号A下有5台服务器,阿里云账号B下也有5台服务器。您只需连通每台服务器与数据库审计系统之间的网络,...
数据库没有数据Owner时如何处理 数据变更 SQLConsole页面执行SQL语句超时中断解决方案 DMS控制台中执行数据变更任务时提示“Duplicate column name 'XXXXX'”使用新版DMS控制台进行变更时提示“Duplicate entry:XXXX”数据库返回“Row size...
数据管理DMS 的资产大盘功能支持T+1离线汇总当前 DMS 租户下的所有实例、数据库、表数据,并图形化展示数据资产的引擎、环境、地域、来源、类目的分布占比及数量趋势。本文介绍如何使用DMS的资产大盘。注意事项 DMS 资产大盘的 表分布占比 ...
通过创建ClickHouse数据源能够实现Dataphin读取ClickHouse的业务数据或向ClickHouse写入数据。本文为您介绍如何创建ClickHouse数据源。背景信息 如果您使用的是数据库ClickHouse,引入ClickHouse的业务数据至Dataphin中或将Dataphin数据...
本文介绍如何使用数据传输服务DTS(Data Transmission Service),将MongoDB Atlas数据库增量迁移至阿里云。DTS支持全量数据迁移和增量数据迁移,同时选择这两种迁移类型可以实现在不停服的情况下,平滑地完成MongoDB Atlas数据库的迁移。...
新建Hologres数据源用于实现Dataphin能够读取Hologres的业务数据,及能够向Hologres写入数据。在引入Hologres的业务数据至Dataphin和将Dataphin的数据写入至Hologres的场景中,您需要先创建Hologres数据源。本文为您介绍如何新建Hologres...
本文介绍如何使用数据传输服务DTS(Data Transmission Service),将MongoDB Atlas数据库增量迁移至阿里云。DTS支持全量数据迁移和增量数据迁移,同时选择这两种迁移类型可以实现在不停服的情况下,平滑地完成MongoDB Atlas数据库的迁移。...
概述 名词解释 访问数据分析功能 管理数据集 仪表盘 08月 功能名称 变更类型 功能描述 相关文档 极简模式 新增 极简模式的控制台界面简洁、易上手、操作空间大,可以随时查找目标数据库实例,无需反复切换到控制台首页标签页。极简模式控制...
说明 若数据传输控制台自动跳转至数据管理DMS控制台,您可以在右下角的 中单击,返回至旧版数据传输控制台。在左侧导航栏,单击 数据迁移。在 迁移任务列表 页面顶部,选择目标MongoDB实例所属地域。单击右上角的 创建迁移任务。配置迁移...
说明 若数据传输控制台自动跳转至数据管理DMS控制台,您可以在右下角的 中单击,返回至旧版数据传输控制台。在左侧导航栏,单击 数据迁移。在 迁移任务列表 页面顶部,选择迁移的目标集群所属地域。单击页面右上角的 创建迁移任务。配置...
说明 若数据传输控制台自动跳转至数据管理DMS控制台,您可以在右下角的 中单击,返回至旧版数据传输控制台。在左侧导航栏,单击 数据迁移。在 迁移任务列表 页面顶部,选择目标MongoDB实例所属地域。单击右上角的 创建迁移任务。配置迁移...