项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

Paimon外部表

阿里云实时计算Flink版、开源大数据平台E-MapReduce 的常见计算引擎(如Spark、Hive或Trino)都与Paimon有完善的集成。借助Apache Paimon,您可以快速构建自己的数据湖存储服务在存储服务OSS上,并接入MaxCompute实现数据湖的分析。关于...

云产品集成

常见云产品如下:大数据开发治理平台 DataWorks 实时计算 Flink 版 数据库管理 DMS DataV 数据可视化 Quick BI 数据分析与展现 前提条件 已获取 OceanBase 数据库的基本连接信息,详细步骤请参见 获取连接参数。大数据开发治理平台 ...

技术架构选型

数据模型设计之前,您需要首先完成技术...MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks则包括数据开发、数据质量、数据安全、数据管理等在内的一系列功能。icmsDocProps={'productMethod':'created','language':'zh-CN',};

历史功能发布记录(2023年及之前)

计算巢支持服务创建者在服务中创建快照策略并应用于对应的云盘,并利用快照回滚计算巢服务实例的云盘,保护系统盘和数据盘的数据。2023-12-31 创建包含快照策略的服务并使用快照回滚服务实例的云盘 计算巢审核申请页中新增申请信息风险审核...

公告

该地域项目的存储、下载后付费账单归属的 产品明细 将从 大数据计算服务MaxCompute(包月)变成 大数据计算服务MaxCompute(按量付费),同时对应的用量明细选择的计量规格变成 大数据计算服务MaxCompute(按量付费)。当您使用的包年包月...

什么是物联网边缘计算

提供的路由路径如下:设备至IoT Hub 设备至函数计算 设备至流数据分析 函数计算至函数计算 函数计算至IoT Hub 流数据分析至IoT Hub 流数据分析至函数计算 IoT Hub至函数计算 断网续传 边缘计算节点在断网或弱网情况下提供数据恢复能力。...

概述

库仓一站式(Zero-ETL)传统数据仓库,会通过数据ETL方式同步数据,采用MPP/BSP等并行计算架构可以很好解决OLAP复杂查询,但面相高并发的数据在线查询(Serving场景)会有明显的资源并发瓶颈,会通过数据回流到OLTP数据库提供在线查询。...

创建通用项目

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。Basic模式:完成项目的创建后,系统默认生成了Basic项目(开发和生产一体的项目)。Basic项目的数据生产过程稳定且便捷。如果您关注数据研发...

创建通用项目

如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。Basic模式:完成项目的创建后,系统默认生成了Basic项目(开发和生产一体的项目)。Basic项目的数据生产过程稳定且便捷。如果您关注数据研发...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

2024年

操作审计事件数据迁移至MaxCompute 2024-03-26 新增Pandas API 新说明 MaxFrame提供了兼容Pandas的API接口,您可以用类似于Pandas的方式来操作MaxCompute中的数据,同时利用MaxCompute强大的分布式计算能力,简化您在大数据环境下的数据...

挂载NAS

1.背景 绝部分计算模型下,客户数据直接存储于云端 NAS 里。为了方便客户读写云端计算数据,批量计算根据用户提供的挂载信息,自动将 NAS 的挂载点挂载到本地目录。完成 NAS 挂载后,对挂载目录里数据的读写行为将和读写本地数据完全相同...

计算费用(按量付费)

当您购买按量付费规格后,MaxCompute会对SQL、MapReduce、Lightning(交互式分析)、Spark、Mars(数据科学)和MCQA(查询加速SQL)计算类型按量付费。本文为您介绍不同计算类型下的计费规则。背景信息 MaxCompute是以作业的执行情况作为...

自定义函数(邀测中)

AnalyticDB for MySQL 未开启压缩,将数据直接传输至函数计算服务,函数计算服务经过计算后,将计算结果使用GZIP格式压缩后返回给 AnalyticDB for MySQL,导致 AnalyticDB for MySQL 无法解析数据。调用 REMOTE_CALL 函数时,出现 parse ...

数据传输费用(公网下载)

本文介绍MaxCompute中数据下载计费规则。MaxCompute仅对公网的下载数据进行收费,并按照下载的数据大小按量计费。MaxCompute会在第二天给出您的下载费用账单,您可以进入 费用中心 查看。下载计费规则如下。计费公式 价格 说明 一次下载...

应用场景

随着大数据时代的到来,图计算在处理海量关系数据上的优势也越来越明显,在商品推荐、社交网络、金融风控、网络安全等场景上应用也日趋广泛。个性化推荐 图计算引擎在处理海量关系数据上具备天然优势,能够提高实时推荐的效率和准确性。以...

功能概览

VCS提供从视频采集、存储、到多视觉算法融合计算数据分析的全过程,向企业、开发商和个人提供能够快速构建基于实时视频数据、图片数据等进行智能分析应用的服务。VCS功能如下 接入服务 支持仅国标GB/T28181-2016版协议的设备(包含NVR、...

RDS外部表

使用RDS数据源创建MaxCompute的外部表并加载数据 使用RDS数据源创建MaxCompute外部表的步骤如下:登录RDS数据库,执行建表语句并插入数据。操作详情请参见 通过DMS登录RDS数据库。建表示例如下:CREATE TABLE `rds_mc_external`(`id` int...

数据组织优化

Compaction服务通过消除记录中间历史状态,可节省计算和存储成本,极加速全量快照查询场景的效率,但也不是频率越高越好,首先执行一次也要读取一遍全量数据进行Merge,极消耗计算和IO资源,并且生成的新BaseFile也会占据额外的存储...

性能指标

计算资源 数据数据量 传输通道 传输带宽 任务平均运行时间 不使用缓存 MaxCompute 1000*1000 CU MaxCompute 5亿*1亿 ODPS CopyTask 1000Mb/s 39分钟 使用缓存 MaxCompute 1000*1000 CU MaxCompute 5亿*1亿 ODPS CopyTask 1000Mb/s 19...

PyODPS概述

PyODPS提供了 to_pandas 接口,可以直接将MaxCompute数据转化成Pandas DataFrame数据结构,但这个接口只应该被用于获取小规模数据做本地开发调试使用,而不是用来规模处理数据,因为使用这个接口会触发下载行为,将位于MaxCompute中的...

镜像管理

MaxCompute提供镜像管理功能,内置数据分析、科学计算、机器学习(如Pandas、Numpy、Scikit-learn、Xgboost)等各类常用镜像,并已对镜像进行预先加热,您可在SQL UDF、PyODPS开发等场景中直接引用已有镜像,无需执行繁琐的镜像打包、上传...

功能更新动态(2022年之前)

2021年08月19日 华北2(北京)、华东1(杭州)计费说明 2021年08月24日 华南1(深圳)2021年08月26日 华东2(上海)系统将依据您选择的数据处理单元规格分配不同的默认调度资源,选购的规格越高,分配的调度资源越多,可以支持的任务并发数...

连续查询

连续查询是一种简化的流计算能力,能够定期执行SQL查询,将查询结果存储在指定的数据表中,可用于预降采样和预计算,实现数据降精度长期存储以及查询性能提升。本文介绍Lindorm时序引擎连续查询的概念、使用方法和常见场景。背景信息 在...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

什么是ETL

数据传输服务DTS提供的流式数据ETL(Extract Transform Load)功能是一种高效的实时数据加工工具。ETL支持通过可视化拖拉拽操作、Flink SQL语句配置任务,并结合DTS的高效流数据复制能力,可以实现流式数据的抽取、数据转换和加工、数据...

什么是物联网边缘计算

物联网边缘计算可以结合阿里云的大数据、AI学习、语音、视频等能力,打造出云边端三位一体的计算体系。功能特性 功能特性 描述 边缘一体机 边缘一体机是物联网边缘计算服务配套的硬件,是一个边缘实例业务的核心,提供整个边缘实例所需要的...

流式ETL

数据传输服务DTS提供的流式数据ETL(Extract Transform Load)功能是一种高效的实时数据加工工具。ETL支持通过可视化拖拉拽操作、Flink SQL语句配置任务,并结合DTS的高效流数据复制能力,可以实现流式数据的抽取、数据转换和加工、数据...

PERCENTILE_APPROX

array<double>percentile_approx(double[,double],array([,<p2>.])[,])命令说明 percentile_approx 是从编号1开始计算,假设某列有 n 条数据计算该列的 p 百分位点,则 percentile_approx 会先对该列进行升序排序,假设排序后该列数据为...

公开数据集概述

简介 MaxCompute开放的公开数据集类别包括:GitHub公开事件数据、国家统计数据、TPC性能测试数据、数字商业类数据、生活服务类数据、金融股票类数据。所有的数据均存储在MaxCompute产品的公开项目BIGDATA_PUBLIC_DATASET的不同Schema中。...

UDT示例

聚合操作 UDT实现聚合的原理是,先用内建函数 COLLECT_SET 或 COLLECT_LIST 将数据转变成List,之后对该List应用UDT的标量方法计算数据的聚合值。示例如下,计算BigInteger的中位数(由于数据是 java.math.BigInteger 类型的,所以不能直接...

Tunnel操作

MaxCompute通过Tunnel实现上传下载数据功能。本文为您介绍如何通过Tunnel上传、下载数据。Tunnel操作详情请参见 Tunnel命令。Tunnel操作常用命令如下。类型 功能 角色 操作入口 上传数据 将本地文件的数据上传至MaxCompute的表中,以追加...

控制台发布记录

2024-3-7 开启冷数据归档 数据与缓存一站式 PolarDB MySQL版 支持数据与缓存一站式功能,在保证数据强一致性的同时,面向在线业务场景构建一套完整的数据库+缓存的解决方案。2024-3-12 灰度发布中 PolarDB MySQL推出数据与缓存一站式功能 ...

功能特性

BSP支持计算数据落盘,适用于计算,吞吐高的复杂场景。XIHE BSP SQL开发 Spark引擎 Spark开发 完全兼容开源Spark,且AnalyticDB for MySQL Spark提供了更好的性能和更低的资源成本。Spark计算引擎 Spark运维 完全兼容开源Spark,...

文档更新动态(2022年之前)

新功能 网络连通解决方案 2021年08月24日 数据服务:支持数据服务模块的数据查询加速、支持的数据源类型和版本拓展 为了满足对数据查询速度有要求的业务场景,Dataphin支持为项目添加加速计算源,且完成Dataphin数据源开发后,您可以手动...

计费逻辑说明

资源费用明细:数据服务API调用 数据质量 数据质量可对任务产出的表数据进行数据质量监控,DataWorks将根据数据质量规则实例数量计费。资源费用明细:数据质量 OpenAPI DataWorks提供OpenAPI,您可基于OpenAPI实现业务定制化开发,...

2022年

基于MaxCompute的智能推荐解决方案 基于MaxCompute+开放搜索的电商、零售行业搜索开发实践 基于MaxCompute+PAI的用户增长方案实践 基于MaxCompute的实时数据处理实践 基于MaxCompute分布式Python能力的规模数据科学分析 基于MaxCompute+...

温度平均值计算

本文以计算五秒温度平均值为例,详细说明如何使用流数据分析预置的算子(统计、窗口等)实现五秒温度平均值的计算并存入数据库中。本文操作中,步骤一至步骤四主要说明如何计算平均温度,步骤五主要说明如何将计算结果保存到数据库中,步骤...

按量付费闲时版

计费说明 类型 计费公式 价格 SpotSQL作业(指计算配额为os_SpotQuota的普通SQL或查询加速SQL作业)SpotSQL作业当日总费用=计算输入数据量×SQL复杂度×单价 计费单价如下:公共云:0.1元/GB 金融云:0.19元/GB 引用外部表的SpotSQL作业...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用