应用场景

数据分析业务 云数据库 Memcache 版搭配大数据计算服务 MaxCompute。实现对大数据的分布式分析处理,适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版与 MaxCompute 间的同步,简化数据操作...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

大数据安全治理的难点

存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

基本概念

本文介绍 云原生多模数据库 Lindorm 帮助文档中的相关名词和术语的解释。A 安全组 安全组是一种虚拟防火墙,用于控制安全组中的ECS实例的出入流量。在Lindorm实例的白名单中添加安全组后,该安全组中的ECS实例就可以访问Lindorm实例。更多...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

东软案例

如下图所示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,幅度提升了政府、企业数字系统性能和在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。图 1.阿里云Lindorm数据库驱动的IT运维...

数据归档至DBS内置OSS

本文介绍如何将数据归档至DBS内置OSS中。前提条件 支持如下类型的源数据库:MySQL类型:RDS MySQL、PolarDB MySQL版。PolarDB PostgreSQL版。PolarDB分布式版。说明 MySQL数据库账号必须具有REPLICATION CLIENT权限。您的系统角色需要...

基本介绍

背景信息 云数据库HBase增强版是由 云原生多模数据库Lindorm宽表引擎 提供的、完全兼容HBase的云上托管数据库,从2011年开始云数据库HBase增强版正式承载阿里内部业务的海量数据实时存储需求,支撑服务了淘宝、支付宝、菜鸟、优酷、高德等...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

概述

DataWorks的安全中心作为云上大数据体系的安全门户,致力于向您提供面向数据安全生命周期全过程的安全能力,同时在符合安全规范要求的前提下,提供各类安全诊断的最佳实践。其核心功能如下:数据权限管理 安全中心为您提供精细化的数据权限...

应用场景

数据审计 智能解析数据库及大数据的通信流量,细粒度审计数据访问行为,通过对数据源全量行为的审计溯源、危险攻击的实时告警、风险语句的智能预警,为您最敏感的数据库资产做好最安全的监控保障。个人信息合规 可精准区分和保护个人数据,...

Delta Lake概述

Delta Lake以数据为中心,围绕数据流走向(数据从流入数据湖、数据组织管理和数据查询到流出数据湖)推出了一系列功能特性,协助您搭配第三方上下游工具,搭建快捷、易用和安全的数据湖。背景信息 通常的数据湖方案是选取大数据存储引擎...

Amazon S3数据

Simple Storage Service(简称S3)是一种专为从任意位置存储和检索任意数量的数据而构建的对象存储,DataWorks数据集成支持使用Amazon S3 Reader插件从S3数据库读取数据,本文为您介绍DataWorks的Amazon S3数据读取能力。支持的Amazon S3...

阶段一:基础防护建设

例如:《金融数据安全分级指南 JR/T 0197-2020》《网络安全标准实践指南——网络数据分类分级指引》《信息安全技术个人信息安全规范 GB/T 35273—2020》《信息技术大数据数据分类指南 GB/T 38667-2020》《基础电信企业数据分类分级方法 YD/...

客户案例

视频介绍 社交媒体行业:欢聚时代规模数据湖建设 客户简介 欢聚时代成立于2005年,是全球领先的社交媒体企业,旗下运营多款社交娱乐产品,包括即时通讯、电商业务等。目前基于Hadoop+HDFS开源架构进行离线(HDFS+Spark)、实时计算...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

什么是数据资源平台

阿里云数据资源平台是数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据标准、数据建模、数据加工、质量评估、业务模型构建、资产管理、数据服务等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

产品概述

产品描述 Dataphin是集产品、技术、方法论于一体的智能大数据平台建设引擎,为您提供数据引入、规范定义、建模研发、资产管理、数据服务等全链路智能数据建设及治理服务。功能 描述 Dataphin全托管 全托管又称公共云多租户模式,只需购买...

LTS(原BDS)服务介绍

在线离线业务分离 通过LTS,将在线业务数据实时同步到HDFS或者OSS等存储,结合Spark、MR等大数据组件进行数据分析,从而不影响在线业务的查询。主备容灾 通过LTS在主备集群之间实现实时数据的双向同步,当主集群出现问题,可以切换到备集群...

LTS(原BDS)服务介绍

在线离线业务分离 通过LTS,将在线业务数据实时同步到HDFS或者OSS等存储,结合Spark、MR等大数据组件进行数据分析,从而不影响在线业务的查询。主备容灾 通过LTS在主备集群之间实现实时数据的双向同步,当主集群出现问题,可以切换到备集群...

数据同步方案概览

本文将介绍数据同步功能支持的数据库、同步类型和同步拓扑。收费策略 DTS数据同步涉及收费。费用详情,请参见 计费概述。同步类型说明 同步类型 说明 库表结构同步 DTS将源库中待同步对象的结构定义信息(例如表、视图、触发器、存储过程等...

快速体验

本文将通过MaxCompute引擎在SQL查询中对公共数据集进行查询和分析,介绍数据分析的基本使用。权限说明 已拥有数据分析权限,查看角色权限列表请参见:数据分析预设角色权限列表。角色授权,授权操作请参见:添加空间成员并管理成员角色权限...

数据迁移操作指导

本文介绍数据迁移功能的使用流程,帮助您快速掌握创建、监控、管理数据迁移任务的操作。背景知识 迁移方案概览 介绍数据迁移功能支持的数据库、数据库版本和迁移类型。异构数据库间的数据类型映射关系 由于不同的数据库支持的数据类型不...

数据同步操作指导

本文介绍数据同步功能的具体使用流程,帮助您快速掌握创建、监控、管理数据同步任务的操作。背景知识 同步方案概览 介绍数据同步功能支持的数据库、同步初始化类型和同步拓扑,以及配置步骤。结构初始化涉及的数据类型映射关系 由于不同的...

数据订阅操作指导

本文介绍数据订阅功能的具体使用流程,帮助您快速掌握创建、监控、管理数据订阅通道及消费数据的操作。背景知识 订阅方案概览 介绍数据订阅功能支持的数据库和支持订阅的数据类型。功能特性 详情请参见 数据订阅(新版)。数据订阅使用流程...

入门概述

本文介绍数据资源平台入门概述。快速使用说明 准备工作:在使用数据资源平台前,需要完成的准备工作,具体操作,请参见 创建阿里云账号 和 购买及登录数据资源平台。配置租户角色:在系统设置模块中为本账号配置租户角色,具体操作,请参见...

数据质量管理流程

本文为您介绍数据质量管理概念、数据管理流程。数据质量管理是通过划分数据资产等级和分析元数据的应用链路,对不同资产等级的数据采取相对应的质量管理方式。数据质量管理流程图如下。数据管理流程说明如下:分析业务场景,根据应用的影响...

数据保护规则简介

本文介绍数据保护规则格式及说明。规则格式及说明 {"version":20230830,"rules":[{"name":"rule1","enabled":true,"meta":{"databases":["test"],"tables":["test"],"columns":["a","b"]} }],"users":{"restrictedAccess":["appuser","test...

数据源管理

本文介绍数据源的一般操作,包括新建、搜索、重命名、编辑和删除等操作。新建数据源 具体操作请参见 添加数据源。搜索数据源 登录 DataV控制台。在 功能导航 模块单击 数据源,进入数据源管理页面。在数据源卡片页右上角可以做以下操作。...

应用场景

本文为您介绍数据资源平台的应用场景。构建数据中台,行业领域模型快速沉淀 场景:快速构建数据仓库,有效治理数据质量,实现政企客户各部门数据的业务协同和共享。痛点:以政务服务为例,政务服务部门众多,业务系统复杂、流程长,数据...

数据集管理

本文介绍数据集的一般操作,包括新建、搜索、重命名、编辑和删除等操作。新建数据集 具体操作请参见 添加适配数据集。搜索数据集 登录 DataV控制台。在 功能导航 模块单击 数据集,进入数据集管理页面。在数据集卡片页右上角可以做以下操作...

数据质量入门

本文示例配置表数据质量监控规则,保障产出的表数据符合预期,为您介绍数据质量的基本使用。前提条件 根据 数据开发:开发者 文档创建 result_table 节点,及节点产出的 result_table 表。说明 本文均以 result_table 表来演示数据质量的...

数据资产等级定义

本文为您介绍数据资产等级的定义,以及如何定义生产链路上的相关数据的资产等级。数据资产等级定义 根据数据质量不满足完整性、准确性、一致性、及时性时,对业务的影响程度划分数据的资产等级。通常,划分为5个性质的等级:毁灭性质:数据...

数据质量教程概述

本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 要保证业务数据质量,首先您需要明确数据的消费...

数据仓库需求模板

本文将为您介绍数据仓库需求模板、常规需求申请单和迭代需求申请单。填写说明:*为必填项目,其它可以选择性进行填写。指标逻辑可以引用指标和术语(或指标库)中的定义。如果数据范围、更新频率、时间窗口、数据提供形式和表头信息不一致...

流程管控

涉及的功能模块 运行前校验 提交前校验 发布前校验 流程管控能力引导介绍 数据治理中心 DataWorks的数据治理中心为您内置了多个检查项,您可以根据业务需要选择开启对应的检查项,开启后,后续在涉及到对应操作时即会触发DataWorks的内置...

功能特性

数据同步拓扑介绍 数据过滤处理与映射 WHERE条件过滤 在配置同步或迁移任务对象时,您可以通过设置过滤条件,将源数据库中满足您需求的数据同步或迁移到目标数据库。设置过滤条件 数据类型映射 在进行异构数据库之间的数据同步或迁移时,会...

数据服务概述

功能介绍 数据服务支持基于业务数据源的物理表或Dataphin生成的逻辑表 创建服务项目分组 和 开发Dataphin数据源并加速数据查询,以满足不同场景的业务诉求。后续应用就可以 调用API 和 调用Dataphin数据源。同时数据服务支持 运维监控API,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 云原生大数据计算服务 MaxCompute 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用