环境准备

使用Hive/HadoopMR来访问表格存储中的表 通过 表格存储E-MapReduce 官方团队发布的依赖包,可以直接使用Hive及HadoopMR来访问表格存储中的数据并进行数据分析。安装JDK-7+下载并安装JDK-7+安装包。Linux/macOS系统:使用系统自带的包...

概述

使用Spark计算引擎访问表格存储时,您可以通过E-MapReduce SQL或者DataFrame编程方式对表格存储中数据进行复杂的计算和高效的分析。应用场景 功能特性 对于批计算,除了基础功能外,Tablestore On Spark提供了如下核心优化功能:索引选择:...

E-MapReduce数据迁移

本文介绍如何将E-MapReduce HDFS上的数据迁移到 文件存储 HDFS 版 文件系统。背景信息 阿里云E-MapReduce是构建在阿里云云服务器ECS上的开源Hadoop、Spark、Hive、Flink生态大数据PaaS产品。提供用户在云上使用开源技术建设数据仓库、离线...

准备工作

当阿里云E-MapReduce的Hadoop集群在VPC中时,请确保已绑定表格存储的实例和E-MapReduce的Hadoop集群所在的VPC。具体操作,请参见(可选)绑定VPC。已开通DataV服务并制作大屏。具体操作,请参见 开通DataV服务。数据准备 产品 数据收集 ...

SmartData使用说明(EMR-3.20.0~3.22.0版本)

应用场景 E-MapReduce目前提供了三种大数据存储系统,E-MapReduce OssFileSystem、E-MapReduce HDFS和E-MapReduce JindoFS,其中OssFileSystem和JindoFS都是云上存储的解决方案,下表为这三种存储系统和开源OSS各自的特点。特点 开源OSS E-...

JindoFS块存储模式

应用场景 E-MapReduce目前提供了三种大数据存储系统,E-MapReduce OssFileSystem、E-MapReduce HDFS和E-MapReduce JindoFS,其中OssFileSystem和JindoFS都是云上存储的解决方案,下表为这三种存储系统和开源OSS各自的特点。特点 开源OSS E-...

管理共享存储

E-HPC所有用户数据、调度器信息、作业数据等信息都会存储在共享的文件系统中,供集群所有节点访问,以提高集群的共享存储能力。创建E-HPC集群时,您必须为集群挂载一个文件系统。如果您有更多的存储需求,可以为集群挂载新的存储资源,来...

存储说明

本文介绍E-MapReduce集群中数据存储相关的信息,包括磁盘角色、云盘与本地盘,以及OSS。背景信息 关于存储的类型、性能和相关的限制信息,请参见 什么是块存储存储价格估算如下:本地盘实例存储为0.04 元/GB/月 OSS标准型存储为0.12 元/...

转换文件存储类型

OSS提供标准、低频访问、归档、冷归档和深度冷归档多种存储类型,全面覆盖从热到冷的各种数据存储场景。本文主要介绍如何转换文件(Object)的存储类型。注意事项 当您使用webpack或browserify等打包工具时,请通过 npm install ali-oss 的...

OSS参考使用说明

本文介绍在E-MapReduce作业配置中使用的OSS URI。OSS URI 使用E-MapReduce时,通常会使用两种OSS URI:native URI:oss:/bucket[.endpoint]/object/path。您在作业中指定输入输出数据源时使用此URI,等同于 hdfs:/。您操作OSS数据时,可以...

卸载并释放E-MapReduce HDFS使用的云盘

背景信息 当E-MapReduce已经成功运行在阿里云 文件存储 HDFS 版 上时,ECS挂载的云盘只用来存储运算中的临时Shuffle文件,可以选择卸载原来用于构建E-MapReduce HDFS服务的云盘,降低集群的拥有成本。重要 从数据安全性考虑,数据迁移后...

SmartData使用说明(EMR-3.22.0~3.25.1版本)

JindoFS是一种云原生的文件系统,结合OSS和本地存储,成为E-MapReduce产品的新一代存储系统,为上层计算提供了高效可靠的存储。本文主要说明JindoFS的配置使用方式,以及介绍一些典型的应用场景。概述 JindoFS提供了块存储模式(Block)和...

在文件存储 HDFS 版上使用Apache HBase

说明 如果您使用的是CDH或者阿里云E-MapReduce中内置的HBase,请参见 在文件存储HDFS版上使用CDH6 和 在文件存储HDFS版上使用E-MapReduce。步骤一:Hadoop集群挂载 文件存储 HDFS 版 实例 在Hadoop集群中配置 文件存储 HDFS 版 实例。具体...

选型配置说明

存储价格估算如下:本地盘实例存储为0.04 元/GB/月 OSS标准型存储为0.12 元/GB/月 OSS归档型存储为0.033 元/GB/月 OSS深度归档型存储为0.015 元/GB/月 高效云盘存储为0.35 元/GB/月 SSD云盘存储为1.00 元/GB/月 云盘的具体价格信息,请参见...

概述

文件存储NAS 阿里云文件存储NAS(Network Attached Storage)是一款面向阿里云ECS实例、E-HPC和容器服务等计算节点的高可靠、高性能的分布式文件系统,可共享访问、弹性扩展。NAS基于POSIX文件接口,天然适配原生操作系统。文件存储CPFS ...

列举存储空间

存储空间(Bucket)是用来存储对象(Object)的容器。对象都隶属于存储空间。存储空间按照字母顺序排列。您可以列举当前账号所有地域下符合指定条件的存储空间。注意事项 使用示例前,需要初始化ossClient用于列举存储空间,初始化方法如下...

NAS存储卷FAQ

NAS存储卷挂载时间延长 NAS存储卷挂载失败时出现timeout错误 使用NAS存储卷时,提示chown:option not permitted 挂载NAS存储卷失败 使用NAS动态存储卷时Controller的任务队列已满且无法创建新的PV NAS存储卷挂载时间延长 问题现象:NAS存储...

获取存储空间的访问权限

存储空间(Bucket)是存储对象(Object)的容器。对象都隶属于存储空间。本文介绍如何获取存储空间访问权限(ACL)。存储空间的读写权限(ACL)有以下三类:访问权限 描述 访问权限值 私有 存储空间的拥有者和授权用户有该存储空间内的文件...

创建存储空间

存储空间(Bucket)是存储对象(Object)的容器。对象都隶属于存储空间。本文介绍如何创建存储空间。注意事项 使用本文示例前您需要先通过自定义域名、STS等方式新建OSSClient,具体请参见 如何初始化Android端OSSClient实例。示例代码 ...

获取存储空间信息

存储空间(Bucket)是存储对象(Object)的容器。本文介绍如何获取存储空间的信息。注意事项 使用本文示例前您需要先通过自定义域名、STS等方式新建OSSClient,具体请参见 如何初始化Android端OSSClient实例。示例代码 以下代码用于获取...

阿里云存储服务

文件存储 阿里云文件存储NAS(Apsara File Storage)是面向阿里云ECS实例、E-HPC和容器服务等计算节点的文件存储服务。它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统,支持NFS和SMB协议。NAS提供极速型、通用性能型、...

管理存储空间读写权限

存储空间(Bucket)是存储对象(Object)的容器。对象都隶属于存储空间。本文介绍如何设置和获取存储空间读写权限(ACL)。注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网...

JindoFS块存储模式使用说明

存储模式(Block)提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的块存储模式及其使用方式...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS Bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

Block模式使用说明

xxxx 说明 考虑到性能和稳定性,推荐使用同账户、同Region下的OSS bucket作为存储后端,此时,E-MapReduce集群能够免密访问OSS,无需配置AccessKey ID和AccessKey Secret。jfs.namespaces.test.oss.access.secret 表示存储后端OSS的...

快速入门

本文将帮助您快速部署和使用阿里云 文件存储 HDFS 版。您将完成创建 文件存储 HDFS 版 文件系统并完成挂载操作。部署成功后,您就可以像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。前提条件 已开通 ...

获取存储空间的地域

存储空间(Bucket)是存储对象(Object)的容器。对象都隶属于存储空间。本文介绍如何获取存储空间所在的地域。示例代码 以下代码用于获取存储空间所在的地域(称为Region或Location):const OSS=require('ali-oss')const client=new OSS...

NAS存储卷概述(ASK)

功能介绍 阿里云文件存储NAS(Apsara File Storage)是面向阿里云ECS实例、E-HPC和容器服务等计算节点的文件存储服务。它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。NAS基于POSIX文件接口,天然适配原生操作系统,...

NAS存储卷概述

功能介绍 阿里云文件存储NAS(Apsara File Storage)是面向阿里云ECS实例、E-HPC和容器服务等计算节点的文件存储服务。它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。NAS基于POSIX文件接口,天然适配原生操作系统,...

获取存储空间的存储容量

本文介绍如何获取指定存储空间(Bucket)的存储容量以及Bucket内不同存储类型文件(Object)的数量及其存储容量。注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。...

什么是表格存储

Spark 宽表模型 使用Spark计算引擎 使用Spark计算引擎时,支持通过E-MapReduce SQL或者DataFrame编程方式访问 表格存储。Hive或者HadoopMR 宽表模型 使用Hive或者HadoopMR 使用Hive或者HadoopMR访问 表格存储 中的数据。函数计算 宽表模型 ...

一般性问题

挂载点是计算节点(ECS 实例、E-HPC 或容器服务)访问数据库文件存储(DBFS)的入口。挂载点定义了采用怎样的权限来访问数据库文件存储(DBFS),同一个挂载点可以被多个计算节点同时挂载并进行共享访问。数据库文件存储DBFS的挂载点目前...

PutBucket

调用 PutBucket 接口创建存储空间(Bucket)。注意事项 要创建存储空间,您必须有 oss:PutBucket 权限。具体操作,请参见 为RAM用户授权自定义的权限策略。同一阿里云账号在同一地域(Region)内最多支持创建100个存储空间。每个地域都有...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 云存储网关 文件存储 CPFS 混合云存储 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用