快速入门

操作步骤 第一步:进入阿里云官网,打开 大数据专家服务 产品详情。第二步:点击大数据专家服务产品详情页中的“咨询购买”接入钉群与专家服务同学沟通场景需求。第三步:经过双方线下评估确认通过后,阿里云技术专家将 向用户推送购买入口...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

配置数据库审计实例

支持对数据库实例进行以下操作:配置网络白名单 打开数据库审计实例网络右侧的开关,开启公网,然后单击 配置白名单,配置可以通过公网访问数据库审计实例的IP地址。警告 为数据库实例开关公网期间,有其他配置发生变更,无法审计。升级...

升级数据库版本

本文介绍云数据库MongoDB支持升级的数据版本以及如何升级数据版本。注意事项 升级分片集群实例的数据版本时,实例的协议类型需为 MongoDB协议。升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在大屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极大地提高数据的可读性。应用场景 电商...

数据源管理

添加数据 单击页面左下角的 添加数据打开数据库选择窗口。在 已有数据集 页签中,选择需要添加的数据库下的空间表后,单击 添加到项目。说明 您也可以在 SQL查询 页签,通过自定义SQL语句查询所需数据。在数据源页签下查看已添加的数据。...

整库离线同步至Elasticsearch

您可以根据实际网络情况及数据量大小进行合理配置,减少不必要的网络开销。增量同步 仅当 方案选择 配置为 只增量一次性同步、周期性增量同步 或 全量一次性同步后周期增量 时,需要配置该参数。说明 您可以使用调度参数来指定同步源表及...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

冷热分层

背景信息 在海量大数据场景下,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

权限设置

操作步骤 开启权限 打开 数据构建控制台 依次打开菜单:数据权限-权限设置 在数据目录(Catalog)的右侧,如数据目录处于关闭状态,点击“开启”操作,将会提示确认开启弹出框,确认后,完成权限开启。关闭权限 打开 数据构建控制台 依次...

DLF+EMR之统一权限最佳实践

DLF 数据权限:DLF所提供的数据湖的数据权限体系,支持配置数据库、数据表、数据列、函数四种维度细粒度权限控制。详见 数据权限概述。业务场景说明 某公司有一个EMR集群,期望Hive/Spark/Presto/Impala引擎可以通过统一的数据权限,控制...

应用场景

应用场景 1.实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接...大数据实时化 数仓是大数据的基础,实时化的数仓能够让BI、报表、推荐(用户标签产出)等多种业务收益,大数据系统总体向实时化迈进。

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

数据重排

在MaxCompute的使用过程中,如果已经积累了大量数据占用了大量存储资源,且已经通过削减数据存储生命周期和删除非必要数据等方式进行了治理,在您的存储预算有限,计算资源还有冗余的情况下,可以考虑使用数据重排方式对存储空间进行优化。...

发展历程

关键性里程碑 2009年9月,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10月,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8月,平台的单集群规模已达到5000台。2014年7月,平台开始对外提供服务,完全替换...

概述

DataWorks(数据工场,原大数据开发套件)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供 数据集成、数据开发、数据地图、数据质量 和 数据服务 等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘...

TableTunnel

同一Session中,使用同一Block ID多次打开RecordWriter的行为会导致数据覆盖,最后一个调用 close()的RecordWriter上传的数据会被保留。该特性可用于Block的上传失败重传。TableTunnel的UploadSession中:如果没有指定 boolean overwrite ...

大数据安全治理的难点

同时,大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点,存在诸多安全治理难点。数据安全治理的关键问题 数据安全治理能否清楚、准确地回答如下问题,将从侧面反映安全治理项目是否能有效地落地。哪些资产需要被保护?您有...

取消授权

本文档主要为您说明如何取消...打开 数据授权控制台,并以数据湖管理员身份或已有授权权限的用户身份登录,并打开数据授权页面,如下图所示:2.搜索您想要取消的授权信息。3.点击您要取消的授权信息后的“取消授权”按钮,完成取消授权操作。

角色管理

打开 数据湖构建控制台,并打开数据权限管理-角色菜单。2.打开角色列表信息页面。系统内置角色:admin(数据湖管理员):拥有数据湖构建中,所有的数据权限及授权权限。super_administrator(超级管理员):拥有数据湖构建中,所有的数据...

配置订阅任务(新控制台)

消费网络类型 网络类型 数据订阅实例的 网络类型 固定为 专有网络,您需要选择具体的 专有网络 和 虚拟交换机。更多信息请参见 专有网络。说明 任务创建成功后,消费网络类型 不可更改。若您的数据订阅客户端部署在专有网络上,则建议选择...

用户管理

打开 数据湖构建控制台,并打开数据权限管理-用户菜单。2.打开用户列表信息页面。说明 此处管理的用户为添加到数据湖构建中的用户,目前仅支持添加RAM用户到数据湖构建。如需对RAM用户管理,请前往 RAM用户控制台 查看用户详情 1.点击用户...

创建RDS MySQL数据订阅任务

消费网络类型 网络类型 数据订阅实例的 网络类型 固定为 专有网络,您需要选择具体的 专有网络 和 虚拟交换机。更多信息请参见 专有网络。说明 任务创建成功后,消费网络类型 不可更改。若您的数据订阅客户端部署在专有网络上,则建议选择...

数据集成支持的数据

离线集成支持的数据源 数据源 读取 写入 大数据存储型数据源 MaxCompute 支持 支持 Hive 支持 支持 Hologres 支持 支持 IMPALA 支持 支持 TDH Inceptor 支持 支持 Kudu 支持 支持 StarRocks 支持 支持 Hudi 支持 支持 Doris 支持 支持 ...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

查看敏感数据识别结果

仅支持在 结构化数据、半结构化数据、非结构化数据 或 大数据 分类下分别选择一个或多个数据类型,不支持跨分类同时选择多个数据类型。如果您未选中任意数据类型,数据安全中心默认展示所有数据类型下的敏感数据识别结果。数据模板:在 ...

Location托管

Location托管可以将数据湖OSS中的存储数据托管到数据湖构建(DLF)中进行管理和分析,在托管Location后将可以为你提供 存储概览,生命周期管理介绍,数据表-数据概况(如数据访问频次,数据最后更新时间等),以及存储权限(规划中)等数据...

添加ClickHouse数据

但是由于VPC网络实现机制的原因,有时控制台显示的实例ID并不是DataV数据源配置VPC网络需要的实例ID。因此您需要通过数据库产品的OpenAPI获取DataV需要的VPC实例ID,通常为数据库实例详情中的 VPCCloudInstanceId 或 VPCInstanceId,具体...

管理模型

查看模型 右键单击模型树上的一个模型,选择 打开数据视图,即可快速打开该模型,模型设计区会展示当前模型某主题域的ER图。保存模型 DDM模型文件的扩展名有两种,一种是.ddm格式(XML文件),另一种是.ddmx格式(二进制文件)。模型保存...

账单数据订阅及查询分析

您可在用户中心订阅不同类型的账单数据,例如,计费项明细账单、计费项账单按天汇总等。订阅成功后,账单数据将会定时同步至MaxCompute,您...相关文档 大数据分析工具的常见问题和解决方法,详情请参见 大数据分析工具的常见问题和解决方法。

创建GreenPlum数据

背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析型数据仓库以及商业智能工作负载而设计。更多详情,请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、...

添加ClickHouse数据

网络 数据源可选的网络类型。说明 当前仅支持外网访问。域名 连接数据库的地址。重要 该地址是DataV服务器能够通过公网或阿里云部分Region内网访问您数据库的域名或IP地址。端口 数据库设置的端口。用户名 登录数据库的用户名。密码 登录...

API概览

UpgradeDBInstanceEngineVersion 升级RDS MySQL数据版本 该接口用于升级RDS MySQL的数据版本。UpgradeDBInstanceKernelVersion 升级RDS实例内核小版本 该接口用于升级RDS实例的内核小版本。UpgradeDBInstanceMajorVersionPrecheck ...

Delta Lake概述

背景信息 通常的数据湖方案是选取大数据存储引擎构建数据湖(例如,阿里云对象存储OSS产品或云下HDFS),然后将产生的各种类型数据存储在该存储引擎中。在使用数据时,通过Spark或Presto对接数据分析引擎并进行数据解析。但该套方案存在...

新增授权

打开 数据授权控制台,并以数据湖管理员身份或已有授权权限的用户身份登录。2.单击左侧菜单:数据权限-数据授权。3.单击“新增授权”按钮,打开新增授权页面。指定授权主体 主体类型:可以选择RAM用户/角色或DLF角色。RAM用户/角色:可以...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

开启数据盘加密

加密数据盘后,数据盘上的动态数据传输以及静态数据都会被加密。如果您的业务存在安全合规要求,则可以使用该功能。您无需自建和维护密钥管理基础设施,就能保护数据的隐私性和自主性,为业务数据提供安全边界。背景信息 数据盘加密的详细...

通用数据开发

说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的数据,存储在业务系统所对应的数据库中,包括MySQL、Oracle和RDS等类型。数据收集与存储:您需要同步...

审计经典网络数据库实例

如果需要审计经典网络数据库实例,您需要先通过ClassicLink功能实现经典网络的ECS与VPC中的数据库审计系统互通,并在经典网络的ECS上部署Agent程序。前提条件 VPC中启用ClassicLink时,需要满足限定条件,具体请参见ClassicLink概述的 使用...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 数据传输服务 云原生大数据计算服务 MaxCompute 云数据库 RDS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用