分布式计算框架 MaxCompute MaxFrame
MaxCompute MaxFrame(简称“MaxFrame”)是阿里云自研分布式计算框架,支持 Python 编程接口并可直接使用云原生大数据计算服务 MaxCompute 计算资源及数据接口,与 MaxCompute Notebook、镜像管理等功能共同构成 MaxCompute 完整 Python 开发生态,极大提升了 MaxCompute 上的 Python 开发体验。

产品优势

更熟悉的开发生态
MaxFrame 兼容 Python 开发生态,提供 MaxCompute Python 生态统一开发接口,通过一份 Python Code 实现 Data+AI 开发完整流程。
更完善的算子支持
MaxFrame 兼容 Pandas 接口且自动进行分布式处理,在保证强大数据处理能力的同时,大幅度提高数据处理规模及计算效率。
更快的处理性能
MaxFrame 可直连 MaxCompute 数据,运行时无需将数据拉取至本地计算,消除了不必要的本地数据传输,提高执行效率。
MaxFrame 可直接使用 MaxCompute 海量弹性计算资源,并支持自动分布式、并行处理,大幅缩短数据处理的时间。
更便捷的开发体验
MaxFrame 已与 MaxCompute Notebook、DataWorks 集成,无需配置环境即可直接使用,同时 MaxFrame 也支持在本地环境安装使用。
MaxFrame 支持直接引用 MaxCompute 内置镜像及用户自定义镜像,降低开发环境准备时间,避免环境版本冲突。

产品功能

兼容 Python 开发生态的分布式计算框架
高性能分布式计算,相比开源 Pandas 算子性能提升10倍以上。
高易用性兼容 Python 开发习惯,内置 Python 开发环境,开箱即用。
资源可弹性基于 MaxCompute 海量计算资源,可根据作业大小弹性扩展计算资源。

应用场景

基于 MaxFrame 进行大规模数据处理及探索
MaxFrame 是阿里云自研分布式计算框架,结合 MaxCompute Notebook、镜像管理等功能提供一套完整的 Python 开发生态。适用于大规模数据处理、科学计算、机器学习、AI 开发等场景。
能够解决
熟悉 Python 开发生态,需要开箱即用的 Python 开发环境快速进行数据科学、大规模数据处理及交互式数据探索等开发。
处理数据量大、处理逻辑复杂,需要基于 MaxCompute 海量数据及弹性计算资源及 MaxFrame 分布式能力进行大规模数据分析、处理及数据挖掘,提高开发效率。
面向 Data+AI 开发,需要依赖第三方或自定义镜像完成数据开发、模型开发等整体流程。
推荐搭配使用