参数 描述 大数据计算服务地域 被投递数据的MaxCompute项目所在地域。说明 操作审计会将审计日志投递至MaxCompute指定地域下的actiontrail_<阿里云账号ID>项目中。因为同一阿里云账号下MaxCompute项目名称唯一,若账号下已有actiontrail_...
实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...
本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行大规模数据计算,详情请...
云数据库HBase是低成本、高扩展、云智能的大数据NoSQL,兼容标准HBase访问协议,提供低成本存储、高扩展吞吐、智能数据处理等核心能力,是为淘宝推荐、花呗风控、广告投放、监控大屏、菜鸟物流轨迹、支付宝账单、手淘消息等众多阿里巴巴...
云数据库MongoDB版支持单节点、副本集和分片集群三种部署架构,具备安全审计、时间点备份等多项企业能力。在互联网、物联网、游戏、金融等...大数据应用:使用云数据库MongoDB作为大数据的云存储系统,随时进行数据提取分析,掌握行业动态。
典型的数据源包括:MySQL/SQL Server/PostgreSQL/Oracle等OLTP业务数据库,业务App产生的日志数据,在OSS/Hadoop上的归档数据,以及来自Kafka/Flink等系统的流式数据。在库中对ODS层数据进行加工,形成CDM(Common Data Model)和ADS...
DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...
关键性里程碑 2009年9月,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10月,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8月,平台的单集群规模已达到5000台。2014年7月,平台开始对外提供服务,完全替换...
数据湖集群 大数据组件安装目录 组件安装在/opt/apps/xxx 目录下,例如:HDFS:/opt/apps/HDFS/hdfs-current Hive:/opt/apps/HIVE/hive-current Hudi:/opt/apps/HUDI/hudi-current YARN:/opt/apps/YARN/yarn-current Presto:/opt/apps/...
云原生多模数据库 Lindorm 和关系型数据库同时使用时可以满足低存储成本,方便运维,弹性伸缩等需求,本文介绍其方案架构和优势。重要 2023年3月10日后购买的LTS 不再支持低成本RDS历史库场景,2023年3月10日前购买的LTS仍支持该场景。背景...
在移动互联网高度发达的今天,每天都会有大量的业务数据产生,随着时间的积累和业务的发展数据量急剧增长,同时历史数据的访问频率随着时间的推移却越来越低。这些数据全部存储在关系型数据库中会带来了一系列的问题。重要 2023年3月10日后...
在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...
在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...
数据表被项目引用,其中存在已发布项目:系统会提示用户有哪些已发布的项目引用了当前表,并提示用户不能直接删除,需要关闭项目的发布状态或删除项目对当前表的引用后才能删除。在删除弹窗中单击 确定,删除数据表。后续操作 新建项目
归档为CSV格式的数据的数据量可能会比归档为ORC格式的数据的数据量更大。为什么归档后的冷数据及文件在主账号下面的OSS上看不到?PolarDB 的冷数据存储在系统默认的OSS上,不在客户的OSS里,所以客户无法看到。目前只支持在PolarDB控制台上...
步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...
租户隔离 Dataphin支持租户的概念,不同租户之间的数据、任务、成员、权限是完全隔离的,只能通过跨租户发布进行数据和任务的流通。常见的情况有以下两种:两套独立部署的,物理隔离的Dataphin。如两家完全不同的企业之间的Dataphin,或者...
租户隔离 Dataphin支持租户的概念,不同租户之间的数据、任务、成员、权限是完全隔离的,只能通过跨租户发布进行数据和任务的流通。常见的情况有以下两种:两套独立部署的,物理隔离的Dataphin。如两家完全不同的企业之间的Dataphin,或者...
本文介绍数据树的管理功能。...新建项目并添加 在数据树中选择需要添加的数据表,单击右下角的 新建项目并添加,等待系统自动创建项目并将当前已选中的数据添加至新创建的项目中。也可以单击 清空选择,去勾选已选中的数据表。
本文档为您介绍DataV支持的所有数据源,帮助您选择合适的数据源进行大屏项目的开发。进入 DataV控制台,单击 我的数据,可以对接入的数据源进行统一管理。DataV支持以下数据源的接入。数据源类型 数据源 说明 数据库类 说明 如果您在其它...
迁移 RDS PostgreSQL 实例的数据至 OceanBase 数据库 Oracle 租户 同步 RDS PostgreSQL 实例的数据至 OceanBase 数据库 Oracle 租户 数据库至数据库的数据同步项目新增支持匹配规则能力,可以助力用户在数据同步项目中通过简单的配置通配符...
随着项目的不断演进,人员的权限也会更新迭代,您需要及时审视人员权限合理性,提升项目数据安全。本文为您介绍权限查询要点,并提供调整建议供参考。背景信息 在项目创建初期,为了提升业务处理效率,通常在用户和权限管理上相对宽松。...
本文为您介绍如何通过跨项目数据访问实现不同Region的MaxCompute项目数据迁移,包括两种使用场景:同云账号内不同Region的项目数据迁移;不同云账号间不同Region的项目数据迁移。使用限制 此方案只支持在中国内地地域间实现不同地域间的...
说明 如果在 选择空间数据项目 对话框内,没有任何已创建的空间数据项目,您可以单击对话框右上角的 前往空间构建平台创建项目,进入空间构建平台自定义创建项目数据,详情请参见 创建项目。进入某个空间数据项目 添加图层 对话框,可以在 ...
该地域项目的存储、下载后付费账单归属的 产品明细 将从 大数据计算服务MaxCompute(包月)变成 大数据计算服务MaxCompute(按量付费),同时对应的用量明细选择的计量规格变成 大数据计算服务MaxCompute(按量付费)。当您使用的包年包月...
本文为您介绍如何在DataV中调用DataWorks的数据服务API,并将数据返回结果展示在DataV可视化应用中。前提条件 在开始本案例前,您需要首先完成 准备工作,并已经 生成了数据服务API。背景信息 警告 您必须使用HTTP协议进入DataV控制台,...
Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤 在Dataphin首页,单击顶部菜单栏 分析,进入 分析 平台。按照下图操作指引,进入 新建SQL查询 对话框。在 ...
Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤 在Dataphin首页,单击顶部菜单栏 分析,进入 分析 平台。按照下图操作指引,进入 新建SQL查询 对话框。在 ...
概述 电商网站的销售数据通过大数据进行分析后,可以在大屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极大地提高数据的可读性。应用场景 电商...
该地域项目的存储、下载后付费账单归属的 产品明细 将从 大数据计算服务MaxCompute(包月)变成 大数据计算服务MaxCompute(按量付费),同时对应的用量明细选择的计量规格变成 大数据计算服务MaxCompute(按量付费)。当您使用的包年包月...
大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。IoT设备大量的数据通常以半结构化的形式存储。...
在实际业务处理过程中,用户可能会同时具备多个项目的访问权限,此时会存在数据在项目间流转的安全问题。MaxCompute提供了数据保护机制,支持对数据流出行为进行控制,为项目数据的安全性提供保障。本文为您介绍MaxCompute的数据保护机制...
在大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...
DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...
MaxCompute提供项目数据保护机制,为数据安全提供保障。本文为您介绍常用安全操作命令。安全操作常用命令如下。详细安全相关操作请参见 安全参数列表。类型 功能 角色 操作入口 开启项目数据保护 开启项目的数据保护机制。项目Owner或授予...
通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...
大数据与数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...
数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有多种不同的定义方法,给后期进行数据汇集和整合带来障碍。因此,数据处理的前奏就是数据标准化,数据标准作为一个统一的数据共识,在标准...
数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...
数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...