基于Delta lake的一站式数据湖构建与分析实战

数据湖计算与分析 相比于数据仓库,数据湖以更开放的方式对接多种不同的计算引擎,如传统开源大数据计算引擎Hive、Spark、Presto、Flink等,同时也支持云厂商自研的数据引擎,如阿里云MaxCompute、Hologres等。在数据湖存储与计算引擎...

支持的云服务

MaxCompute和DataWorks提供完善的ETL、数据分析、数据地图、数据治理和数据仓库管理能力,并支持SQL、MapReduce、Graph等多种经典的分布式计算模型,能够更快速地解决用户海量数据计算问题,有效降低企业成本,保障数据安全。更多DataWorks...

服务商指南概述

本文介绍了您在使用计算巢的不同阶段,需要进行的入驻准备、部署服务、交付运营等操作。作为服务商,计算巢控制...交付服务 运营服务 将服务部署并上线计算巢后,您可以按需选择阿里云提供的多种运营服务,助力服务的售卖和推广。运营服务概述

基本介绍

目前,云原生多模数据库Lindorm是阿里集团最基础存储设施之一,在多年的阿里巴巴双十一全球狂欢节上提供优秀的大数据在线存储能力,支撑了数百PB规模的存储和其每秒数亿次的峰值访问、每日数十万亿次的海量吞吐。相比HBase开源版,云数据库...

长周期指标的计算优化方案

本文为您介绍如何对长周期指标的计算进行优化。实验背景 电子商务公司在电商数据仓库和商业分析场景中,经常需要计算最近N天...计算老买家数量时,判断最近一次购买时间是否在30天之内,从而最大程度上的数据关系对去重,减少计算输入数据量。

输入节点

运行配置 运行配置用于设置输入节点的云计算资源和源数据表,关键参数说明如下:参数 说明 云计算资源类型 节点的数据源类型,可值包括 MaxCompute、AnalyticDB for RDS、AnalyticDB MySQL、Table Store、DataHub Service、Phoenix、...

输入节点

运行配置 运行配置用于设置输入节点的云计算资源和源数据表,关键参数说明如下:参数 说明 云计算资源类型 节点的数据源类型,可值包括 MaxCompute、AnalyticDB for RDS、AnalyticDB MySQL、Table Store、DataHub Service、Phoenix、...

数据源白名单配置

产品名称 操作说明 云原生大数据计算服务MaxCompute 设置白名单 实时数仓Hologres IP白名单 云数据库ClickHouse 设置白名单 消息队列Kafka版 配置白名单 云原生分布式数据库PolarDB-X 设置白名单 云原生分布式数据库PolarDB-X(2.0)设置白...

新建 OceanBase 数据

新建数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 OceanBase 数据源。操作步骤 登录 OceanBase 管理控制台。在左侧导航栏,单击 数据传输>数据源管理。在 数据源列表 页面,单击右上角的 新建数据源。在 ...

应用场景

本文将以部门场景和技术领域场景为例,为您介绍实时计算Flink版的大数据是实时化场景。说明 更多场景案例请参见 阿里云实时计算Flink版产品案例和解决方案汇总。背景信息 作为流式计算引擎,Flink可以广泛应用于实时数据处理领域,例如ECS...

本地邮件数据迁移Outlook+IMAP

本文旨在对某些企业原邮箱数据只保存在本地的用户,通过Outlook客户端配置IMAP模式反传本地邮件数据阿里邮箱的操作说明。顺序:步骤:说明 1、部分版本的Outlook已不支持同时配置多个相同地址的账号,即便服务器地址不一致。可以通过给...

关于我们

阿里云隐私计算产品是源于阿里集团内部数据安全流通的最新解决方案和实践,所以她的提出是基于解决实际的数据安全问题和大数据场景需要,这就决定了她的基因里面就是贴身于实际产业应用。目前团队中拥有全职博士4名,研究型密码学博士实习...

E

返回 e 的值。此函数为MaxCompute 2.0扩展函数。命令格式 double e()返回值说明 返回DOUBLE类型。使用示例-返回2.718281828459045。select e();相关函数 E函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

PI

返回π的值。此函数为MaxCompute 2.0扩展函数。命令格式 double pi()返回值说明 返回DOUBLE类型。使用示例-返回3.141592653589793。select pi();相关函数 PI函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

PERCENTILE_APPROX

array<double>percentile_approx(double[,double],array([,<p2>.])[,])命令说明 percentile_approx 是从编号1开始计算,假设某列有 n 条数据计算该列的 p 百分位点,则 percentile_approx 会先对该列进行升序排序,假设排序后该列数据为...

E-MapReduce本地盘实例规模数据集测试

大数据基准测试用于公平、客观评测不同大数据产品/平台的功能和性能,对用户选择合适的大数据平台产品具有重要的参考价值,TPC-DS逐渐成为了业界公认的大数据系统测试基准。本文以阿里云E-MapReduce+D1本地盘方案模拟TPC-DS测试的演示方案...

新建计算资源

通过新建云计算资源,为使用数据探索做数据支撑。本文主要介绍如何新建云计算资源。背景信息 数据探索当前支持的云计算资源有MaxCompute、Hive、RDS MySQL、*ADB MySQL 2.0、*Spark cluster、*Spark on yarn。说明 带星号(*)的云计算资源...

什么是阿里云Cloudera CDP

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造的阿里云上的大数据平台。Cloudera CDP企业数据云平台 Cloudera企业数据云是社区版CDH的全新商业化升级产品,是阿里云和Cloudera联合打造阿里云上的...

准备数据源和计算

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

准备数据源和计算

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

数据源配置常见问题

如果您已有API中的逻辑在使用DataV的API数据源时不支持(例如计算签名等),可使用阿里云API网关托管您的API,DataV连接阿里云API网关数据源时可以间接调用您在API网关中托管的API,此时阿里云API网关相当于API的代理。具体使用操作请参见 ...

什么是图计算服务

大数据生态,深度对接 对接完整的阿里大数据及AI产品生态,提供基于MaxCompute+Flink+Graph Compute 的场景化图计算解决方案。图计算服务Graph Compute特点 高性能 查询延时低、数据导入快(千亿数据查询延时2ms以内,数据载入最高达500w...

数据源配置常见问题

如果您已有API中的逻辑在使用DataV的API数据源时不支持(例如计算签名等),可使用阿里云API网关托管您的API,DataV连接阿里云API网关数据源时可以间接调用您在API网关中托管的API,此时阿里云API网关相当于API的代理。具体使用操作请参见 ...

专线连接介绍

高速通道提供了一种快速安全连接阿里云与本地数据中心的方法。您可以通过租用一条运营商的专线将本地数据中心连接到阿里云接入点,建立专线连接。此连接绕过公网,更加安全可靠、速度更快、延迟更低。您可以选择使用点对点以太网连接或MPLS...

计算成本控制

由于MaxCompute的查询响应是分钟级,不适合直接用于前端查询,计算出的结果数据同步到外部存储中保存,对于部分用户来说,关系型数据库是最优先的选择。轻度计算推荐使用MaxCompute,重度计算(即直接出最终结果。前端展示时,不做任何...

通过数据同步功能同步SLS数据至数仓版

通过 AnalyticDB for MySQL 的数据同步功能,您可以将SLS中指定时间点之后产生的数据实时同步至 数仓版(3.0)集群,以满足日志数据实时分析的需求。前提条件 数仓版(3.0)集群与日志服务SLS的 Project和 Logstore位于同一地域。具体操作...

DAS Auto Scaling弹性能力

背景信息 为业务应用选择一个合适的数据计算规格(CPU和内存),是每个数据库运维人员都会经常面临的一个问题。若规格得过,会产生资源浪费;若规格的过小,计算性能不足会影响业务。通常情况下,运维人员会采用业务平稳运行状态下...

数据上云工具

您可以根据实际应用场景,选择合适的工具进行数据的上传和下载。阿里云数加产品 MaxCompute客户端(Tunnel通道系列)客户端基于 批量数据通道 的SDK,实现了内置的Tunnel命令,可对数据进行上传和下载,Tunnel命令的使用请参见 Tunnel命令...

使用MaxCompute控制台(离线)

MaxCompute控制台提供数据上传功能,支持您将本地文件或阿里云对象存储服务OSS中的文件数据离线(非实时)上传至MaxCompute进行分析处理及相关管理操作。使用限制 仅支持基于 本地文件 或 阿里云对象存储OSS 上传数据,具体如下。本地文件...

新建 ADB 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建云原生数据仓库 AnalyticDB MySQL 版(简称 ADB)数据源。背景信息 ADB 的基本介绍请参见 基础数据类型。ADB 的建表、分区表和分布表的详情请参见 ...

通过数据同步功能同步SLS数据至湖仓版

通过 AnalyticDB for MySQL 的数据同步功能,您可以将SLS中指定时间点之后产生的数据实时同步至 湖仓版(3.0)集群,以满足日志数据实时分析的需求。前提条件 湖仓版(3.0)集群与日志服务SLS的 Project和 Logstore位于同一地域。具体操作...

新建 DataHub 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 DataHub 数据源。操作步骤 登录 OceanBase 管理控制台。在左侧导航栏,单击 数据传输>数据源管理。在 数据源列表 页面,单击右上角的 新建数据源。在 ...

POSITIVE

返回表达式的值。命令格式 TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL positive(TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL)参数说明 expr:必...相关函数 POSITIVE函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

NEGATIVE

返回表达式的负值。命令格式 TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL negative(TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL)参数说明 expr:...相关函数 NEGATIVE函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

开通服务

操作步骤 登录 阿里云官网,选择 产品>计算>边缘计算>视图计算。在 视图计算产品详情 页面,单击 立刻开通。选择您使用的上下行接入计费方式,支持上下行带宽或流量计费,勾选 我已阅读并同意视图计算服务协议,单击 立刻开通。开通完成后...

国标协议接入流程

配置“SIP服务器地址”和“SIP服务器端口”为阿里云视图计算产品提供的SIP服务器地址和端口(以上两步用到的阿里云视图计算产品国标信息,在通过控制台或API创建空间后可获取到)。协议版本设置为“GB/T28181-2016”。配置为基于TCP协议...

东软案例

如下图所示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,幅度提升了政府、企业数字系统性能和在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。图 1.阿里云Lindorm数据库驱动的IT运维...

续费

手动续费 支持通过阿里云用户中心和数据资源平台控制台2种方式进行手动续费,请根据实例的状态,选择合适的续费方式。通过阿里云用户中心续费 若您购买的实例已过期或即将过期,都可通过阿里云用户中心进行续费。进入 阿里云用户中心。在...

公交出行:启迪公交

PolarDB-X 专注解决海量数据存储、超高并发吞吐、表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍启迪公交如何通过 PolarDB-X 应对业务挑战。所属...

ISNAN

判断表达式的值是否为 NaN,如果值为 NaN,返回True,否则返回False。命令格式 boolean isnan()参数说明 expr:必填。DOUBLE类型。...相关函数 ISNAN函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 数据传输服务 实时计算 Flink版 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用