集成与开发概览

功能简介 数据集成与开发功能模块支持多种计算、存储引擎,支持结构化、半结构化、非结构化数据的实时集成、离线集成、开发、服务,能够满足企业各类数据加工、集成、开发、服务需求。您可以通过流批一体的数据集成对在线数据进行入仓、...

文档修订记录

DataWorks数据安全治理路线 2023年12月更新记录 时间 特性 类别 描述 产品文档 2023.12.29 新增功能 数据开发 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发...

导入MongoDB数据

背景信息 有关大数据开发治理平台DataWorks,具体请参见 什么是DataWorks。注意事项 将MongoDB的离线数据迁移至Lindorm宽表时,需要将MongoDB嵌套的JSON数据展开成水平结构,并且不涉及数据的变换。说明 如果迁移过程中需要对某些数据进行...

规划工作空间

通常来说,开发环境的数据读、写权限为各工作空间的“开发”角色共享,而生产环境的数据权限为生产账号独有 数据质量 各工作空间之间的数据质量是 完全隔离 的。仅对应工作空间的“开发”、“运维”或“管理员”角色具备配置数据质量规则的...

数据开发与运维中心:数据加工

功能概述 DataWorks的数据开发的亮点功能如下。DataStudio支持MaxCompute、EMR、CDH、Hologres、AnalyticDB、Clickhouse等多种计算引擎,支持在统一的平台上进行各类引擎任务的开发、测试、发布和运维等操作。DataStudio支持智能编辑器、...

DBS沙箱功能概览

典型应用场景 基于线数据开发测试(Dev或Ops):测试和预发布需要基于线上存量数据验证,但又必须保护线数据不被污染。DBS沙箱功能可以快速提供历史全量数据副本,同时满足快速测试迭代和数据可靠性保障需求。在线应急容灾:基于DBS...

我是安全管理员

线集成 离线集成是一种低代码的数据开发工具,可以组合各类任务节点,形成数据流,通过周期调度运行达到数据加工、数据同步的目的。数据可视化 数据可视化功能可让您更容易通过数据去洞察业务,辅助进行业务决策。比如分析趋势、增长对比...

我是DBA

线集成 离线集成是一种低代码的数据开发工具,可以组合各类任务节点,形成数据流,通过周期调度运行达到数据加工、数据同步的目的。数据可视化 数据可视化功能可让您更容易通过数据去洞察业务,辅助进行业务决策。比如分析趋势、增长对比...

我是管理员

线集成 离线集成是一种低代码的数据开发工具,可以组合各类任务节点,形成数据流,通过周期调度运行达到数据加工、数据同步的目的。数据可视化 数据可视化功能可让您更容易通过数据去洞察业务,辅助进行业务决策。比如分析趋势、增长对比...

数据加工过程卡点校验

您可以通过培训等方式,将离线数据的诉求、离线数据的加工过程、数据产品的应用方式告知在线业务开发人员,使其了解数据的重要性、价值及风险。确保在线开发人员在完成业务目标时,也要考虑数据的目标,做到业务端和数据端一致。离线系统卡...

功能特性

配置管理 数据保护 敏感数据管理 DMS的敏感数据保护能力能根据所选的敏感数据扫描模板、敏感数据识别模型以及脱敏算法对数据进行脱敏处理,以避免敏感数据滥用,有效保护企业的敏感数据资产,防止数据泄露造成企业经营资金损失或罚款。...

数据安全治理的难点

您需要了解哪些资产需要被保护、资产存在的风险、企业/组织是否合规、如何处理内放攻防、如何落地安全运营等关键问题,才能有效落地数据安全治理。同时,大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点,存在诸多安全治理...

新功能发布记录

什么是数据管理DMS 02月 功能名称 变更类型 功能描述 相关文档 数据库迁移 新增 通过产品化解决方案的封装,实现数据库迁移、校验和清理的闭环操作。同时支持库名称修改、迁移前预校验、迁移后数据一致性校验及来源数据库的清理,保证数据...

离线同步常见问题

文档概述 问题分类 相关文档 离线同步任务运维常见问题 为什么数据源测试连通性成功,但是离线同步任务执行失败?如何切换数据集成任务执行资源组?脏数据如何排查和定位?如何查看脏数据?如果离线同步传输数据时,脏数据超出限制,是否...

产品优势

更多信息,请参见 什么是数据库网关。提供数据库平滑迁移工具:DMS提供了DTS数据迁移工具,覆盖数据库迁移的全生命周期。更多信息,请参见 DTS。数据库管理:可进行数据库实例信息的查看、录入、编辑,对实例、库、表、数据列、行级进行...

产品简介

DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储与计算的数据引擎产品。基于DLA无服务器化(Serverless)数据湖分析服务与内置的Spark计算引擎,DLA Ganos打通了阿里云各个存储系统,如...

通过DataWorks导入数据

数据同步任务开发 新增数据源 在进行数据同步任务开发时,您需要在DataWorks上分别创建MySQL和SelectDB数据源。创建MySQL数据源,详情请参见 MySQL数据源。创建SelectDB数据源,详情请参见 创建并管理数据源。SelectDB数据源的部分配置参数...

FTP数据

不写"nullFormat"这个参数,等同于“未配置”,代表来源是什么数据就直接按照什么数据写入目标端,不做任何转换。否 无 markDoneFileName 标档文件名,数据同步前检查标档文件。如果标档文件不存在,等待一段时间重新检查标档文件,如果...

新功能发布记录

2021-02-07 什么是解决方案 组件开发服务 功能名称 功能描述 发布时间 相关文档 组件开发 重要通知:组件开发功能暂停新用户申请开通白名单权限。2021-02-04 组件开发 2021年01月 移动可视化开发 功能名称 功能描述 发布时间 相关文档 图表...

客户案例

易用性:广告业务是一种典型的线上分析型业务(OLAP),需要在庞大的买家数据和广告数据中分析两者的关联关系,然后精准的分析出广告主的广告投放效果。因此,报表平台中存在着较多的多维度的数据关联查询,以及大数据的分组汇总查询,同时...

小程序分析简介

mPaaS 小程序分析是面向小程序开发者、运营者提供的数据分析组件。该组件提供支付宝、微信、mPaaS 小程序平台数据统计能力,支持对三大平台的小程序进行全面的数据分析,统计分析数据可视化展现,一目了然,协助产品运营决策,驱动产品体验...

交通

目前,由公司投资建设并已投入运营的轨道交通线路有 17 条线,包括中国内地首条全自动驾驶线路(10 号线)和世界首条商用的磁悬浮线路,线路总长 673 公里(含磁浮线 29 公里)、共 395 座车站,路网规模位居世界第一。项目背景 上海地铁...

MySQL数据

MySQL数据源为您提供读取和写入MySQL的双向通道,本文为您介绍DataWorks的MySQL数据同步的能力支持情况。支持的MySQL版本 离线读写:支持MySQL 5.5.x、MySQL 5.6.x、MySQL 5.7.x、MySQL 8.0.x,兼容 Amazon RDS for MySQL、Azure MySQL。离...

东软案例

阿里云Lindorm数据库让数字时代运维“灵动”起来,本文以东软集团有限公司为例,该集团归属于运营商、政务、汽车、医疗等行业。业务/技术亮点 移动端到云端业务全链路海量运维大数据存储。指标、日志等多源异构监控数据融合分析。99.99%...

功能更新动态(2023年)

创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成 新增Apache Doris数据源的离线集成。整库迁移任务支持...

公告

2024年04月16日-Dataphin新版本发布 Dataphin于2024年04月16日发布V3.14版本,本次升级相较于历史版本:新增Python三方包全局管理功能,一次安装多次引用,提升Python任务开发效率。支持页面水印设置功能,支持自定义页面水印内容及设置...

文档更新动态(2023年)

更新说明 创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成配置优化 新增Apache Doris数据源的离线集成。...

数据分析:即时快速分析

数据分析基于“人人都是数据分析师”的产品目标,旨在为更多非专业数据开发人员,如数据分析、产品、运营等工作人员提供更加简洁高效的取数、数工具,提升大家日常取数分析效率。功能概述 数据分析支持基于个人视角的数据上传、公共数据...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

概述

数据开发 核心功能如下:文件夹 用于存放并管理数据库中的数据开发节点。详情请参见 文件夹。Hologres开发 用于周期性调度作业。详情请参见 Hologres开发:周期性调度。一键MaxCompute表结构同步 支持使用可视化方式批量创建外部表,加速...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

产品概述

具有丰富的数据可视化编辑能力、专业的地理信息可视化展示能力和灵活开发的部署方式等特点,详情请参见 什么是DataV数据可视化。DataV-TwinFabric 孪生仿真 DataV-TwinFabric孪生仿真平台是阿里云为数字孪生领域提供的一站式开发平台,旨在...

创建Hologres数据

数据源创建完成后,您可根据需要执行如下操作:计算任务开发与调度:DataWorks的数据开发与运维中心模块,为您提供Hologres任务的开发与调度能力,若您需要基于该Hologres数据源进行Hologres任务开发,或周期性调度Hologres相关任务,需先...

用户价值

数据运营更高效:遵循应用先行、以用带存、由存而通、因通促用的理念,实现城市数据运营,驱动客户业务创新。用户角色 功能 能力 详述 数据生产方 数据开发 设计数据模型 开发数据加工逻辑 设计标准、稳定的数据模型:通过数据标准和数据...

数据下载

在DataWorks的数据开发(DataStudio)、数据分析、安全中心模块下载的CSV、XLSX格式文件数据将同步保存至数据下载功能。通过该功能,您可将所需历史下载文件重新下载至本地使用,也可追溯历史下载记录的操作详情。前提条件 已通过如下模块...

用户授权与管理

角色规划 使用数据建模并应用至数据开发的过程中,通常需要进行定义标准、数据建模、数据开发、部署运维等任务,下图为您示例不同流程中操作人员的角色以及所需的角色权限。建议您参考下图进行用户角色及权限规划。开通权限 建议您参考 ...

入仓解决方案

数仓开发的项目空间由入仓解决方案和业务场景两部分组成。入仓解决方案可添加和运行多个实时同步任务、实时迁移任务,实现全量或近实时增量迁移和集成数据,用于满足项目空间内业务场景的数据迁移和集成需求。根据所需的同步效率、同步数据...

DataWorks V3.0

MaxCompute:大数据计算服务MaxCompute(原ODPS)是一种快速、完全托管的EB级大数据计算引擎,是大规模离线数据仓库的核心引擎。MaxCompute是DataWorks最早支持,且最成熟完备的计算引擎,目前已基本覆盖MaxCompute的所有功能。详情请参见 ...

HoloStudio一键迁移至DataStudio

数据开发迁移 我们会将HoloStudio数据开发中的目录及其文件按照默认迁移策略一同迁移至DataStudio(数据开发调度业务流程中,调度业务流程详情请参见 创建业务流程。迁移策略:HoloStudio数据开发中已设置调度的任务不用迁移,未设置...

技术架构选型

数据模型设计之前,您需要首先完成技术架构的选型。本教程中使用阿里云大数据产品MaxCompute配合...MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks则包括数据开发数据质量、数据安全、数据管理等在内的一系列功能。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据传输服务 数据库备份 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用