技术架构选型

本教程中使用阿里大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构如下所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

技术架构选型

本教程中使用阿里大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构如下所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

技术架构选型

本教程中使用阿里大数据产品Dataphin配合MaxCompute,完成整体的数据建模和研发流程。完整的技术架构如下所示。其中,Dataphin的数据集成及同步负责完成源业务系统数据引入。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

通用数据开发

说明 上中,虚线框内的开发流程均可基于阿里大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的数据,存储在业务系统所对应的数据库中,包括MySQL、Oracle和RDS等类型。数据收集与存储:您需要同步...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

DataWorks交流钉钉群

DataWorks作为阿里大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系,同时提供优质高效的交流服务,本文为您介绍...

常见问题

1.售前咨询渠道 尊敬的“准”大数据专家服务用户您好:如果您准备购买阿里大数据专家服务,但是遇到如服务范围、规格、服务选择等售前方面的问题,您可以通过钉钉与我们联系,您将“当面”获得阿里大数据专家咨询专家的建议。...

产品架构

EMR自研能力 为让开源大数据组件和服务更好的运行在阿里云技术设施上,EMR自研了如下组件:数据应用平台,提供交互式开发、作业提交、作业调试和工作流一站式数据开发体验,详情请参见 EMR Studio概述。Shuffle Service是EMR在优化计算引擎...

E-MapReduce本地盘实例规模数据集测试

本文介绍如何使用阿里云E-MapReduce搭建本地盘机型集群节点,并进行大数据基准性能测试。应用范围 需要使用阿里云E-MapReduce+本地盘进行大数据业务前进行性能测试的用户。需要将线下自建大数据集群迁移到阿里云云上E-MapReduce+本地盘进行...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

功能概览

1.4 生态融合 系出飞天,与阿里大数据系统深度整合,无缝对接MaxCompute、实时计算、交互式分析等产品,打通整个大数据体系。2.产品功能 2.1 数据接入 提供多种SDK、API和Flume、Logstash等第三方插件,让您高效便捷的把数据接入到数据...

基于Delta lake的一站式数据湖构建与分析实战

数据湖作为一个集中化的数据存储仓库,支持的数据类型具有多样性,包括结构化、半结构化以及非结构化的数据数据来源上包含数据数据、binglog 增量数据、日志数据以及已有数仓上的存量数据等。数据湖能够将这些不同来源、不同格式的数据...

将云消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能,将 云消息队列 Kafka 版 集群上的数据迁移至阿里大数据计算服务MaxCompute,方便您对离线数据进行分析加工。前提条件 在开始本教程前,确保您在同一地域中已完成以下操作:云消息队列 Kafka 版 ...

什么是EMR Serverless Milvus

阿里云上下游产品集成 与阿里云存储、大数据产品集成对接,方便产品间数据调用,为AI应用场景的数据工程提供最大程度的便利。产品计费 公测期间您可以免费试用Milvus,免费试用结束后,实例将开始收费。相关文档 快速创建Milvus实例 ...

什么是EMR on ACK

您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。形态对比 阿里云EMR提供on ECS和on ACK两种方式,以...

什么是DataWorks

DataWorks发展之路 阿里巴巴集团内发展历程 从2009年产品立项开始,DataWorks与阿里巴巴业务共同发展,结合MaxCompute、Hologres等大数据计算引擎的能力,跨越多个技术阶段,支撑阿里巴巴数据中台与数据治理建设。目前阿里巴巴集团内...

数据导入概览

阿里云对象存储OSS导入数据图数据库GDB实例 图数据库GDB服务端集成有数据导入模块,可以获取您提供的.csv格式的OSS数据文件,并将其解析为中的点数据和边数据,然后将点数据和边数据导入至图数据库GDB实例。步骤 步骤说明 ① 将需要...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

东软案例

如下所示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,幅度提升了政府、企业数字系统性能和在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。 1.阿里云Lindorm数据库驱动的IT运维...

OSS/OSS-HDFS概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括 JindoFS 存储系统(原JindoFS Block模式)...

DataWorks on EMR数据安全方案

大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

产品动态

2022年 功能名称 功能概述 发布时间 相关文档 GDB AutoML 阿里图数据库自动机器学习(Graph Database Auto Machine Learning,简称GDB AutoML)是一个面向企业和个人开发者的机器学习集成开发环境,实现将机器学习应用于现实问题的端到端...

快速入门

MySQL快速入门 SQL Server快速入门 PostgreSQL快速入门 MariaDB快速入门 数据库引擎 以下是对四种数据库引擎的介绍:云数据库RDS MySQL MySQL是全球受欢迎的开源数据一,作为开源软件组合LAMP(Linux+Apache+MySQL+Perl/PHP/Python)中...

什么是云原生内存数据库Tair

云原生内存数据库Tair 是阿里云国产自研的云原生内存数据库。在完全兼容Redis的基础上,提供了丰富的数据模型和企业级能力来帮助客户构建实时在线场景。同时,Tair与新型存储介质——持久内存的高效结合,相比内存型,成本降低30%以上,并...

通过DMS连接StarRocks实例

数据管理DMS(Data Management)是一款支撑数据全生命周期的一站式数据管理平台。您只需在DMS控制台录入StarRocks实例的相关信息,即可轻松实现通过图形化的Web界面对StarRocks实例的高效管控与深度运维,极提升数据管理体验及操作效率。...

最佳实践概览

场景 文档链接 Elasticsearch迁移 迁移方案选取指南 阿里云Elasticsearch间数据迁移 通过reindex迁移数据 基于reindex实现低版本多type数据迁移 自建Elasticsearch数据迁移 通过OSS将自建Elasticsearch数据迁移至阿里云 通过阿里云Logstash...

基本介绍

目前,云原生多模数据库Lindorm是阿里集团最基础存储设施一,在多年的阿里巴巴双十一全球狂欢节上提供优秀的大数据在线存储能力,支撑了数百PB规模的存储和其每秒数亿次的峰值访问、每日数十万亿次的海量吞吐。相比HBase开源版,云数据库...

MongoDB 4.2

第三方云数据库迁移至阿里数据库MongoDB:使用MongoDB工具将MongoDB Atlas数据库迁移至阿里数据库MongoDB 使用DTS将MongoDB Atlas数据库迁移至阿里数据库MongoDB 使用DTS将华为云文档数据库迁移至阿里数据库MongoDB 使用MongoDB...

什么是阿里云Cloudera CDP

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造的阿里云上的大数据平台。Cloudera CDP企业数据云平台 Cloudera企业数据云是社区版CDH的全新商业化升级产品,是阿里云和Cloudera联合打造阿里云上的...

阿里云云通信短信服务安全白皮书V1.0

【声明】本安全白皮书著作权归阿里巴巴云计算(北京)有限公司所有(以下简称阿里云云通信),未经阿里云云通信事先书面许可,任何主体不得以任何形式复制、修改、传播全部或部分内容。本白皮书仅供参考,对于本文档中的信息,阿里云云通信...

SmartData常见问题

JindoFS是阿里云开源大数据E-MapReduce产品提供的一套Hadoop文件系统,主要对Hadoop和Spark大数据生态系统使用阿里云OSS提供多层次的封装支持和优化。基础功能提供适配OSS和支持访问,您可以直接使用JindoFS SDK;标准功能针对OSS提供分布...

JindoData版本说明

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。本文为您介绍JindoData各版本支持的功能。背景信息 JindoData是原阿里云EMR SmartData组件...

Serverless Presto概述

Presto开发的初衷就是为了解决使用Hive来进行在线分析速度太慢的问题,因此它采用全内存流水线化的执行引擎,相较于其它引擎会把中间数据落盘的执行方式,Presto在执行速度上有很的优势,特别适合用来做Adhoc查询、BI分析、轻量级ETL等...

服务等级协议

本文介绍了阿里云向客户提供的阿里图数据库GDB的服务可用性等级指标及赔偿方案。本产品最新版服务等级协议,请在阿里云服务等级协议汇总页查找获取。获取地址请参见 阿里云服务等级协议汇总页。说明 本服务等级协议仅适用于高可用版的GDB...

快速入门

同时您也可以参见数据迁移系列文档,将第三方Elasticsearch、云数据库和大数据云产品数据迁移至阿里云Elasticsearch。背景信息 在阿里云Elastic Stack产品生态下,Elasticsearch作为实时分布式搜索和分析引擎,Logstash采集、转换、优化和...

阿里云电子政务云事件

截至文档发布时间,阿里云电子政务云共计上线82款产品,覆盖计算、存储、网络等基础设施产品,以及中间件、大数据、安全等产品,满足您多样化的业务场景需求。2020年至今 2020年至今阿里云电子政务云的事件如下所示。2018年至2019年 ...

Tair(Redis企业版)简介

阿里数据库Redis企业版(又称阿里云Tair),是基于阿里集团内部使用的Tair产品研发的云上托管企业级内存数据库,从2009年开始正式承载阿里集团业务,历经天猫双十一、优酷春晚、菜鸟、高德等业务场景的磨练,是一款真正的企业级内存数据...

PolarDB-X历史

前言 2009年,阿里巴巴在进行年度收支核算时,发现业务对数据存取资源的需求呈指数级扩张,并与业务指标增长之间产生鸿沟。此时的阿里巴巴清晰的意识到,如果不通过技术创新平衡成本和增长需求,必将对未来发展产生影响。于是"去IOE"的说法...

配置ClickHouse输出组件

同步其他数据源的数据至ClickHouse数据源的场景中,完成源数据的信息配置后,需要配置ClickHouse输出组件写入数据的目标数据源。本文为您介绍如何配置ClickHouse输出组件。前提条件 在开始执行操作前,请确认您已完成ClickHouse数据源及...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 数据传输服务 云数据库 RDS 数据管理 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用