配置DataHub输出组件

配置DataHub输出组件,可以将外部数据库中读取数据写入到DataHub,或从大数据平台对接的存储系统中将数据复制推送至DataHub,进行数据整合和再加工。本文为您介绍如何配置DataHub输出组件。前提条件 已创建DataHub数据源。具体操作,请参见...

数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

DataWorks快速入门指引

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为了便于新用户快速了解DataWorks的数据开发治理操作全流程,DataWorks为您提供了...

DataWorks On Hologres使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

DataWorks On MaxCompute使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

基本概念

数据资产:数据资源平台中存在大量的数据表、标签、API等各类数据资产,数据管理者通过数据汇聚、数据治理、数据分析后,需要对整个平台数据进行统一管控,了解平台的核心数据资产,提供对应的数据资产管理规范。统一服务 应用:是调用API...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

数据仓库研发规范概述

大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会...

DataWorks数据服务对接DataV最佳实践

现在通过DataWorks为您提供的 数据集成>数据开发>数据服务 的全链路数据研发平台,结合MaxCompute即可快速搭建企业数仓。DataWorks数据服务提供了快速将数据表生成API的功能,通过可视化的向导模式操作,无需代码便可快速生成API,然后通过...

功能概述

当您的数据库中有数据需要被保护时,可以使用RDS MySQL全密态数据库功能,该功能提供的加密解决方案能够在遵守数据保护法规的前提下保障您的数据安全,使被保护数据免受未授权访问。本文介绍全密态数据库的概念、应用场景和安全分级。什么...

高效数据治理实施指南

以某公司数据平台团队的数据治理负责人为例,其负责本团队的数据成本管理工作,同时也是DataWorks所有数仓工作空间的管理员,日常需要进行整个数据团队的运维管理工作和成本管理工作,对数据治理相关工作进行确定和推进。目前在年初阶段,...

产品概述

以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触到用户的明文数据,避免云端数据发生泄漏,且能够防止研发运维窃取数据、无惧数据库账号泄露...

产品概述

以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触到用户的明文数据,避免云端数据发生泄漏,且能够防止研发运维窃取数据、无惧数据库账号泄露...

产品概述

以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触到用户的明文数据,避免云端数据发生泄漏,且能够防止研发运维窃取数据、无惧数据库账号泄露...

公告

新增分析平台功能模块,分析平台是一个面向个人视角,快速便捷的数据平台。本期支持Notebook任务,支持您以笔记本的形式编写SQL代码与Markdown文本相结合的富媒体内容。资产目录新增专题广场,实现资产分类管理;资产列表升级,优化搜索及...

DataWorks V2.0

数据服务(新增)数据服务 提供了快速将数据表生成数据API的能力,支持您将现有的API快速注册到数据服务平台以统一管理和发布。同时,数据服务已与API网关(API Gateway)打通,支持将API服务一键发布至API网关。数据服务与API网关一道为您...

公共节点

Hive Hive节点通过类SQL语句协助读写、管理存储在分布式存储系统上的大数据集的数据仓库,完成海量日志数据的分析和开发工作,具体操作,请参见 新建Hive类型的公共节点。Hologres Hologres节点运行于Hologres云计算资源之上,您可使用标准...

产品优势

数据管理DMS是一款支撑数据全生命周期的一站式数据管理平台,本文介绍数据管理DMS的产品优势。实现全域数据资产管理 支持全域数据资产:关系型数据库:MySQL、SQL Server、PostgreSQL、PolarDB MySQL版、PolarDB PostgreSQL版(兼容Oracle...

开通Dataphin

在阿里云官网,鼠标悬停至 产品 后,再将鼠标悬停至左侧导航栏的 大数据计算 上,单击 数据开发与服务 列下的 智能数据建设与治理Dataphin。在Dataphin产品详情页,单击 特惠购买,进入Dataphin购买页面。在购买页面,选择 地域、版本、...

数据治理中心概述

数据治理中心可自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,提供...

文档修订记录

Check节点 2024.1.12 新增功能 最佳实践 新增DataWorks大数据安全治理实践新增指南,为您介绍数据安全治理的常见思路、DataWorks产品的安全能力,以及在DataWorks上基于“基础防护建设”、“数据安全防护措施”、“数据安全持续运营”三个...

产品架构

本文向您介绍应用研发平台EMAS产品的总体架构和功能特性。架构图 EMAS产品的总体架构如下所示。功能特性 EMAS提供移动推送、移动热修复、移动测试等多个子产品,各产品的功能说明如下。云构建 云构建服务支持通过流水线进行多端应用的编译...

功能更新动态(2022年之前)

华北2(北京)、华东1(杭州)计费说明 2021年08月24日 华南1(深圳)2021年08月26日 华东2(上海)系统将依据您选择的数据处理单元规格分配不同的默认调度资源,选购的规格越高,分配的调度资源越多,可以支持的任务并发数越研发效率...

功能使用常见问题

大数据计算服务(Open Data Processing Service,简称ODPS)由阿里云自主研发,提供针对TB/PB级数据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。阿里巴巴的数据业务都运行在ODPS上。ODPS的产品详情页:...

什么是自动驾驶开发平台

数据管理提供自动驾驶采集数据在云上数据预处理、预标注、管理、检索、重组、回放、输出到仿真或训练系统中的能力:非结构化数据处理针对非结构化数据处理提供DAG调度和并行计算能力,构建自动调度的10倍加速的自动驾驶数据工作流 多模态...

客户案例

价值体现 从大数据平台上云整体“降本增效”的方案快速切入,迁移到数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(...

文档更新动态(2022年之前)

新功能 网络连通解决方案 2021年08月24日 数据服务:支持数据服务模块的数据查询加速、支持的数据源类型和版本拓展 为了满足对数据查询速度有要求的业务场景,Dataphin支持为项目添加加速计算源,且完成Dataphin数据源开发后,您可以手动...

设计阶段

设计工作包含数据探查和系分设计两部分:数据探查旨在了解来源数据数据形态,例如数据质量、数据分布等。结合业务场景,帮助分析和判断需求实现的可行性以及找出潜在的数据问题和风险。系分设计则包括表设计、Mapping设计和调度设计等最...

文档更新动态(2023年)

更新说明 创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成配置优化 新增Apache Doris数据源的离线集成。...

SDK Utils包依赖注意事项

该解决方案适用的移动云产品包括:移动推送 HTTPDNS 移动热修复 移动用户反馈 移动数据分析 1.什么是 Utils SDK?Utils为阿里云移动研发平台各产品SDK的公共依赖包,包含基础功能和公共功能模块的实现。Utils SDK 接口为各产品SDK调用,...

产品计费

包年包月:通过包年包月,您可以提前预留资源,同时享受更的价格优惠,帮您更程度节省支出。按量付费:通过使用量直接计算费用,在免费阈值及预付费额度用完后,使用按量付费抵扣。这是产品开通后默认的计费模式。服务价格 服务 后付费...

功能更新动态(2023年)

创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成 新增Apache Doris数据源的离线集成。整库迁移任务支持...

IoT数据自动化同步至云端解决方案

物联网的体系结构包括设备、网络、平台、分析、应用和安全,其中分析部分的主要内容为大数据分析。大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

需求分析

本实验提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。业务背景 为了更好的制定企业经营策略,现需要从用户网站行为中获取网站用户群体基本画像数据,例如,用户群体地理属性、社会属性等,...

产品优势

数据库MongoDB版(ApsaraDB for MongoDB)是阿里云基于飞天分布式系统和高可靠存储引擎研发的完全兼容MongoDB协议,并支持多节点高可用架构、弹性扩容、容灾、备份恢复、性能优化等功能的文档数据库服务。灵活的部署架构 云数据库MongoDB...

产品简介

数据专家服务 数据专家服务(Bigdata Expert Service)是由阿里云数据专家基于阿里云多年数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户...,赋能技术团队具备大数据平台建设、架构设计、AI算法建模以及运维保障能力...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 数据管理 云数据库 RDS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用