BITMAP精准去重

传统数据仓库中的Bitmap重功能,对亿级别以上Bitmap基数的交并集计算性能较差,有两个主要原因:一是当Bitmap基数较(超过1GB)时,网络和磁盘IO处理时间比较长;二是集群在扫描数据后,会全部传输到顶层节点进行并集运算,给顶层单...

外部表概述

随着大数据业务的不断扩展,新的数据使用场景在不断产生,MaxCompute计算框架也在不断演化。MaxCompute原来主要面对内部特殊格式数据的强大计算能力,正一步步地开放给不同的外部数据。现阶段MaxCompute SQL处理的主要是以 cfile 列格式...

世纪联华

本文介绍如何通过函数计算、API网关、日志服务及表格存储云服务,再配合Serverless架构的快速扩容、弹性高可用的特性,轻松解决世纪联华流量突增及服务器需求过的问题。客户介绍 世纪联华是一个超过170余家,具有全国网点布局,在快速...

世纪联华

本文介绍如何通过函数计算、API网关、日志服务及表格存储云服务,再配合Serverless架构的快速扩容、弹性高可用的特性,轻松解决世纪联华流量突增及服务器需求过的问题。客户介绍 世纪联华是一个超过170余家,具有全国网点布局,在快速...

什么是MaxCompute

MaxCompute提供离线和实时的数据接入,支持规模数据计算及查询加速能力,为您提供面向多种计算场景的数据仓库解决方案及分析建模服务。MaxCompute还为您提供完善的数据导入方案以及多种经典的分布式计算模型,您可以不必关心分布式计算和...

升级和降配

在 变配 页面,配置升级后所需的CU数量,并勾选 大数据计算服务MaxCompute服务等级协议 和 阿里云产品服务协议-MaxCompute,单击 立即购买。订单价格计算规则如下:升级订单价格计算=新配置剩余时长购买金额(新配置的月单价/30/24×剩余时...

整体架构

云原生数据仓库AnalyticDB MySQL版 是阿里巴巴自主研发、经过超大规模以及核心业务验证的PB级实时数据仓库。概述 自2012年第一次在集团发布上线以来,AnalyticDB MySQL版 至今已累计迭代发布近百个版本,支撑起集团内的电商、广告、物流、...

新零售:杭州数云信息技术有限公司

PolarDB 采用存储和计算分离的架构,提供分钟级的配置升降级、秒级的故障恢复、全局数据一致性和免费的数据备份容灾服务,既融合了商业数据库稳定可靠、高性能、可扩展的特征,又具有开源云数据库简单开放、自我迭代的优势。本文介绍杭州...

查询执行模式

相比较于全内存计算的 Interactive 模式,Batch 模式可以对查询的任务进行分批执行,每个子任务在内存不足的情况下,自适应地将内存数据换出到磁盘,降低数据计算的成本,提升数据处理的容量上限。Interactive模式 AnalyticDB MySQL 接收到...

基础概念

语法详述见 功能概览 使用过程中请注意:iGraph Gremlin语法与开源使用差异 其他相关服务 MaxCompute:大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布...

数据科学计算概述

MaxFrame是由阿里云自研的分布式科学计算框架,是对历史相关产品功能(PyODPS、Mars)的重大升级,在MaxCompute之上提供一套完全兼容Pandas接口的API,让用户用更为熟悉、更符合Python社群习惯的方式使用MaxCompute。本文为您介绍...

数据倾斜诊断

数据倾斜计算规则 AnalyticDB PostgreSQL版 会根据表的倾斜率定义数据存储在每个计算节点之间的倾斜程度。倾斜率的取值范围是0%~100%,该值越表示数据倾斜的越严重。倾斜率计算公式如下:Avg=(S1+S2+.Sn)/n Max=Max(S1,S2,.Sn)倾斜率=...

企业版产品系列

共享分布式存储(PolarStore)多个计算节点共享一份数据,而不是每个计算节点都存储一份数据,极降低了用户的存储成本。基于分布式块存储和文件系统,存储容量可以在线平滑扩展,不会受到单个数据库服务器的存储容量限制,可应对上百TB...

计量计费

本文为您介绍如何估算MaxCompute SQLML作业的费用。背景信息 通常情况下,每个算法组件由多个子任务组成。...查看账单信息 MaxCompute SQLML作业,在账单中体现的是 大数据计算服务MaxCompute+机器学习(PAI)两个产品的费用。

应用场景

本文主要介绍弹性高性能计算集群的主要应用场景,您可以根据不同的应用场景配置不同的资源类型。气象预报 E-HPC结合数值模型计算分析气象数据与环境数据,可以预测天气、环境等气象信息。能源勘探 E-HPC可以帮助勘探行业进行勘探数据分析,...

文档更新动态(2022年之前)

新功能 创建Impala数据源、新建AnalyticDB for MySQL 3.0数据源、Dataphin支持的数据源 2021年08月24日 数据集成:数据集成读取和写入组件拓展、支持为AnalyticDB for PostgreSQL目标数据源一键建表操作、数据源权限申请的交互优化 新增...

基于Delta lake的一站式数据湖构建与分析实战

数据湖计算与分析 相比于数据仓库,数据湖以更开放的方式对接多种不同的计算引擎,如传统开源大数据计算引擎Hive、Spark、Presto、Flink等,同时也支持云厂商自研的数据引擎,如阿里云MaxCompute、Hologres等。在数据湖存储与计算引擎...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

Serverless Spark概述

DLA Spark基于云原生架构,提供面向数据湖场景的数据分析和计算功能。开通DLA服务后,您只需简单的配置,就可以提交Spark作业,无需关心Spark集群部署。重要 云原生数据湖分析(DLA)产品已退市,云原生数据仓库 AnalyticDB MySQL 版 湖仓...

2023年

2023-06 功能名称 功能描述 发布时间 发布地域 相关文档 新增JSON数据类型 新增JSON数据类型,MaxCompute支持写入JSON数据类型时,自动优化存储,提高JSON数据计算分析性能。2023-06-27 全部地域 MaxCompute JSON类型使用指南(试用Beta...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

应用场景

大数据场景 云数据库HBase支持海量全量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松与Spark、MaxCompute等大数据平台集成,完成数据规模离线分析。优势如下:低成本:高压缩比,数据冷热分离,...

账单数据订阅及查询分析

您可在用户中心订阅不同类型的账单数据,例如,计费项明细账单、计费项账单按天汇总等。订阅成功后,账单数据将会定时同步至MaxCompute,您可使用DataWorks的数据分析功能查询并分析账单数据,将分析结果生成可视化图表卡片及报告,同时,...

基本概念

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB、PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将Lindorm数据导入...

选择付费方式

对周期性高密度计算作业使用包年包月模式,对非周期性的规模数据处理作业使用按量计费模式。按量计费模式下可以不存储数据,通过读取其它账号下的表获取数据,从而可以节省数据存储费用。不同账号下跨表计算需要通过授权来实现,详细请...

技术面临的挑战与革新

计算下如何平衡扩展性和稳定性SLA 云计算环境下,企业和个人通过开启云服务,即可以得到所需的软件功能、计算资源、存储空间,并按实际使用量付费。在业务量逐步上涨的过程中,用户需要不断提升计算和存储资源来满足业务需要。因此,扩展...

应用场景

大数据场景:海量数据存储与分析 Lindorm支持海量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松与Spark、MaxCompute等大数据平台集成,完成数据规模离线分析。优势 低成本:高压缩比,数据冷热分离...

Tablestore外部表

注意事项 MaxCompute与Tablestore是两个独立的大数据计算和存储服务,所以两者之间的网络必须保证连通性。MaxCompute公共云服务访问Tablestore存储时,推荐您使用Tablestore私网地址,即Host名以 ots-internal.aliyuncs.com 作为结尾的地址...

某历史养成类游戏开发公司实时计算数据仓库方案

2)数据明细层:操作数据层使用Spark Streaming等进行数据去噪、重、字段规范后写入Lindorm SQL服务,也可以直接使用JDBC写入数据;3)数据汇总层:数据明细层的数据可以定期(按天或者按小时)ETL(比如关联维表、过滤、聚合)后写入到...

购买方式2:按量付费

由于存储空间是根据数据量和存储时长收费的,若您需要的数据量较(如1000 GB或以上),我们推荐配合存储包一起使用,能够享受一定的折扣优惠,且购买的存储包容量越折扣越多。说明 存储包分为 中国内地通用 和 中国香港及海外通用 两...

购买方式2:按量付费

由于存储空间是根据数据量和存储时长收费的,若您需要的数据量较(如1000 GB或以上),我们推荐配合存储包一起使用,能够享受一定的折扣优惠,且购买的存储包容量越折扣越多。说明 存储包分为 中国内地通用 和 中国香港及海外通用 两...

MapReduce

Map Worker在输出数据时,需要为每一条输出数据指定一个Key,这个Key值决定了这条数据将会被发送给一个Reduce Worker。Key值和Reduce Worker是多对一的关系,具有相同Key的数据会被发送给同一个Reduce Worker,单个Reduce Worker有可能会...

JindoFS实战演示

使用Checksum迁移HDFS数据到OSS 使用Checksum迁移HDFS数据到OSS 2021-05-11 通过Checksum算法,你可以在大数据迁移场景中校验数据的完整性、对比数据差异并实现增量迁移。本视频为您介绍如何使用Jindo Distcp迁移HDFS数据到OSS,以及在迁移...

迁移方案

外部数据的读写效率会影响您对实时计算能力的评估,例如:如果实时计算需要从日志服务(LogService)读取数据,但LogService对于请求调用配额(Quota)存在一定限制,则实时计算整体的计算能力将被限制在LogService允许的范围内。...

创建湖仓版集群

计算预留资源 计算预留资源用于数据计算。增加计算资源可以提高数据查询速度。如果需要创建AnalyticDB MySQL内表,计算预留资源需大于0 ACU。计算预留资源为0 ACU时,只能使用外表。如果创建集群时选择的计算预留资源为0 ACU,集群创建成功...

产品优势

本文介绍 云原生多模数据库 Lindorm 与其他开源数据库的区别。背景信息 云原生多模数据库 Lindorm 兼容HBase、Cassandra、S3、TSDB、HDFS、Solr等多种标准接口,支持宽表、时序、对象、文本、队列、空间等多种数据模型,适用于日志、账单、...

计算抵扣包和存储抵扣包

000 33000 75%24,750.00 计算抵扣包选择示例 例如您的阿里云账号开通使用MaxCompute上海区域的按量计费服务,主要使用SQL和Spark进行数据计算,每个月计算费用原价大概有 1000 元,一年则有 12000 元,那么您可以考虑购买计算抵扣包。...

创建集群

计算预留资源 计算预留资源用于数据计算。增加计算资源可以提高数据查询速度。如果需要创建AnalyticDB MySQL内表,计算预留资源需大于0 ACU。计算预留资源为0 ACU时,只能使用外表。如果创建集群时选择的计算预留资源为0 ACU,集群创建成功...

2022年

基于MaxCompute的智能推荐解决方案 基于MaxCompute+开放搜索的电商、零售行业搜索开发实践 基于MaxCompute+PAI的用户增长方案实践 基于MaxCompute的实时数据处理实践 基于MaxCompute分布式Python能力的规模数据科学分析 基于MaxCompute+...

功能更新动态(2022年之前)

2021年08月19日 华北2(北京)、华东1(杭州)购买指引、计费说明 2021年08月24日 华南1(深圳)2021年08月26日 华东2(上海)数据源:可支持的数据源类型和版本拓展,优化数据源配置交互 新建数据源页面支持分类展示数据源类型,同时增加...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用