创建数据板块

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐 此模式。创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据...

创建数据板块

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐 此模式。创建Dev-Prod模式数据板块,请参见 创建Dev-Prod模式数据板块。Basic模式 生成独立的Basic数据板块,数据生产过程稳定且便捷。如果您关注数据...

概述

Spark全密态数据计算引擎常用于解决数据存储与计算安全、敏感数据合规和数据安全共享场景中的数据安全问题。以下是常见的应用场景:数据存储与计算安全场景:在不可信环境中(如第三方平台),Spark全密态计算引擎 可以为关键的数据分析...

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

创建通用项目

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。Basic模式:完成项目的创建后,系统默认生成了Basic项目(开发和生产一体的项目)。Basic项目的数据生产过程稳定且便捷。如果您关注数据研发...

创建通用项目

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。Basic模式:完成项目的创建后,系统默认生成了Basic项目(开发和生产一体的项目)。Basic项目的数据生产过程稳定且便捷。如果您关注数据研发...

数据传输费用(公网下载)

本文介绍MaxCompute中数据下载计费规则。MaxCompute仅对公网的下载数据进行收费,并按照下载的数据大小按量计费。MaxCompute会在第二天给出您的下载费用账单,您可以进入 费用中心 查看。下载计费规则如下。计费公式 价格 说明 一次下载...

使用MaxCompute控制台(离线)

查看上传记录 提交上传后,若数据量较,需要耗费一些时间,您无需在提交页面一直等待,可后续通过单击 数据上传 页面右上角的 查看上传记录 查看通过该功能上传数据的详情记录。说明 通过该页面的 查看上传记录 查询到的记录详情也包含...

功能概览

VCS提供从视频采集、存储、到多视觉算法融合计算数据分析的全过程,向企业、开发商和个人提供能够快速构建基于实时视频数据、图片数据等进行智能分析应用的服务。VCS功能如下 接入服务 支持仅国标GB/T28181-2016版协议的设备(包含NVR、...

RDS外部表

使用RDS数据源创建MaxCompute的外部表并加载数据 使用RDS数据源创建MaxCompute外部表的步骤如下:登录RDS数据库,执行建表语句并插入数据。操作详情请参见 通过DMS登录RDS数据库。建表示例如下:CREATE TABLE `rds_mc_external`(`id` int...

镜像管理

MaxCompute提供镜像管理功能,内置数据分析、科学计算、机器学习(如Pandas、Numpy、Scikit-learn、Xgboost)等各类常用镜像,并已对镜像进行预先加热,您可在SQL UDF、PyODPS开发等场景中直接引用已有镜像,无需执行繁琐的镜像打包、上传...

UDT示例

聚合操作 UDT实现聚合的原理是,先用内建函数 COLLECT_SET 或 COLLECT_LIST 将数据转变成List,之后对该List应用UDT的标量方法计算数据的聚合值。示例如下,计算BigInteger的中位数(由于数据是 java.math.BigInteger 类型的,所以不能直接...

Tunnel操作

MaxCompute通过Tunnel实现上传下载数据功能。本文为您介绍如何通过Tunnel上传、下载数据。Tunnel操作详情请参见 Tunnel命令。Tunnel操作常用命令如下。类型 功能 角色 操作入口 上传数据 将本地文件的数据上传至MaxCompute的表中,以追加...

Serverless Spark概述

DLA Spark基于云原生架构,提供面向数据湖场景的数据分析和计算功能。开通DLA服务后,您只需简单的配置,就可以提交Spark作业,无需关心Spark集群部署。重要 云原生数据湖分析(DLA)产品已退市,云原生数据仓库 AnalyticDB MySQL 版 湖仓...

产品简介

DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储与计算数据引擎产品。基于DLA无服务器化(Serverless)数据湖分析服务与内置的Spark计算引擎,DLA Ganos打通了阿里云各个存储系统,如...

MaxFrame概述

您可以用更熟悉、高效、便捷的方式利用MaxCompute的海量计算资源及数据进行规模数据处理、可视化数据探索分析以及科学计算、ML/AI开发等工作。本文为您介绍MaxFrame背景信息、功能介绍及使用场景。版本说明 当前MaxCompute MaxFrame功能...

客户案例

客户需求 海量数据处理效率下降,离线数据计算时长不稳定。实时计算不开发维护代价,希望对数仓进行综合治理。价值体现 基于飞天数据平台产品,快狗打车不仅机器成本节约30%以上,数据开发效率提升100%。从Java Storm迁移到Flink SQL使...

数据分析整体趋势

存储计算分离:云计算的本质是资源高效池化,而数据库的两核心组件是存储和计算。通过存储计算分离,做到两者解耦,资源池化,独立扩展,满足业务上资源隔离,数据共享的需求,是当下的架构趋势。计算分析一体化:传统数据分析方案是定期...

ECS资源复用版

ECS资源复用版是MaxCompute按量付费类型中的...则04:00~05:00的账单详情(部分字段)示例如下:产品 产品明细 消费时间 实例ID 计费项code 单价 用量 官网价 云原生大数据计算服务 MaxCompute 大数据计算服务MaxCompute(按量付费)2023-12-30...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

应用场景

本文将以部门场景和技术领域场景为例,为您介绍实时计算Flink版的大数据是实时化场景。说明 更多场景案例请参见 阿里云实时计算Flink版产品案例和解决方案汇总。背景信息 作为流式计算引擎,Flink可以广泛应用于实时数据处理领域,例如ECS...

产品概述

专注解决海量数据存储、超高并发吞吐、表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。PolarDB-X 1.0 核心能力采用标准关系型数据库技术实现,配合完善的...

内置时空数据引擎Ganos

空间和时空数据具有非结构化、体量数据密集兼具计算密集以及较高安全合规属性。PolarDB PostgreSQL版(兼容Oracle)的自研Ganos时空SQL引擎支持直接在数据库中就完成不同时空维度数据的信息检索及处理,相比传统需要跨库信息提取再汇总...

性能指标

用户在配置PSI任务时可以选择是否使用PSI缓存任务,如果选择使用PSI缓存任务,则可以只对增量数据进行PSI计算,适用于大数据量场景、增量更新较少的场景下的周期性PSI安全求交计算。以下是一组使用PSI缓存任务、不使用PSI缓存任务的性能...

准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

技术原理

分析型查询指的是涉及数据量较计算比较复杂的查询,例如对一定时间区间内的数据进行聚合。相比于业务中常见的简单查询,这类查询往往要执行数秒甚至数分钟,需要消耗较多的计算资源。为了加速复杂分析型查询,PolarDB-X将计算任务切分...

2024年

新说明 ECS资源复用版是MaxCompute按量付费类型中的一种实例规格,旨在将ECS闲置实例转换为可用的MaxCompute计算资源,该方式可以充分利用已有的计算资源,而不需要额外购买新的MaxCompute计算资源,从而在满足大数据处理需求的同时,提高...

数据中心

数据中心包含数据管理、数据配置。数据管理 数据管理模块展示并管理用户添加的数据。主要功能包括数据表引入、本地数据导入。数据表 支持用户从已注册的计算资源类型中添加数据表。支持基于已添加的数据查看表信息、表内展示的字段。支持将...

产品简介

多方安全建模控制台作为多方安全建模的可视化操作平台,提供了一站式端到端的数据安全计算服务,服务包括安全计算环境安装、数据连接、数据探查、数据分析、模型研发、模型投产和模型监控,同时可根据您的业务需求配置安全策略。...

羲和分析计算引擎

相对于传统的以数据为中心的计算方式,面向算子为中心的计算方式对现代CPU计算更友好:缓存友好的同时,利用乱序执行扩大了CPU的指令并发,利用SIMD又扩大CPU的数据并发,充分挖掘了现代CPU的算力。面向混合负载的查询执行 羲和分析计算...

访问数据库

本文介绍函数计算访问VPC内数据库的机制,并提供访问数据库的示例。访问机制 在函数计算中,运行函数的实例由函数计算动态分配,IP地址不固定,因此无法通过添加函数实例的IP地址到数据库白名单的方式来访问数据库。此外,基于最小权限原则...

应用场景

该场景可实现:在离线一体化 支持数据实时增删改、具备在线分析和ETL计算一体化,实现大数据数据库的融合。通过资源组隔离让在离线计算任务不相互影响,保证业务稳定运行。计算存储资源弹性 采用计算存储分离架构,计算资源和存储资源按...

Pandas API支持

MaxFrame提供了兼容Pandas的API接口,您可以用类似于Pandas的方式来操作MaxCompute中的数据,同时利用MaxCompute强大的分布式计算能力,简化您在大数据环境下的数据处理工作,本文为您介绍Pandas API的支持情况。当前MaxFrame支持的API详情...

ECS实例说明

本文介绍E-MapReduce(简称EMR)支持的ECS实例类型,以及各实例类型适用的场景。EMR支持的ECS实例类型 通用型 vCPU:Memory=1:4。例如,8核32 GiB,使用云盘作为存储...Task计算实例 用于补充集群的计算能力,可以使用除大数据型外的所有机型。

功能简介

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。数据导入 支持512 MB...

E-MapReduce弹性低成本离线大数据分析

大数据是一项涉及不同业务和技术领域的技术和工具的集合,海量离线数据分析可以应用于多种商业系统环境,例如,电商海量日志分析、用户行为画像分析、科研行业的海量离线计算分析任务等场景。离线大数据分析概述 主流的三分布式计算框架...

数据质量保障原则

一致性 一致性通常体现在跨度很数据仓库中。例如,某公司有很多业务数仓分支,对于同一份数据,在不同的数仓分支中必须保证一致性。例如,从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要...

功能简介

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。如果数据表格存储的是...

基本概念

数据数据表是多方安全计算中存储在节点的原始数据,并且只能在节点本地使用。数据授权 在项目使用机构数据前,由机构管理员将数据表、特征组等数据授权到项目内使用的操作称为数据授权。特征 用户离线样本的信息维度。特征服务 提供特征...

HASH

使用示例 示例1:计算相同数据类型的输入参数的Hash值。命令示例如下。返回66。select hash(0,2,4);示例2:计算不同数据类型的输入参数的Hash值。命令示例如下。返回97。select hash(0,'a');示例3:任一输入参数为空或NULL。命令示例如下。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 实时计算 Flink版 数据传输服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用