什么是文件存储 HDFS

产品概述 文件存储 HDFS 允许您就像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等...

迁移开源HDFS的数据到文件存储 HDFS

文件存储 HDFS 可以帮助您实现将开源HDFS的数据迁移到云上,并允许您在云上就像在Hadoop分布式文件系统中管理和访问数据。准备工作 开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。...

功能特性

无缝集成 文件存储 HDFS 允许您就像在Hadoop分布式文件系统HDFS)中一样管理和访问数据。文件存储 HDFS SDK可在所有Apache Hadoop 2.x环境中使用,包括阿里云EMR和阿里云Flink。文件存储 HDFS 支持的原生文件系统语义被开发人员...

快速入门

文件存储 HDFS 兼容了标准的HadoopFS协议接口,使您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、高可靠和高可用的分布式文件系统。相比自建HDFS存储,使用 文件存储 HDFS 服务可以大量节约...

CDH6数据迁移

步骤一:为 文件存储 HDFS 添加用户和组映射 迁移数据前,您需要在 文件存储 HDFS 文件系统实例上创建原CDH集群HDFS服务中已有的用户和组映射关系。关于 文件存储 HDFS 实例访问控制的详细信息,请参见 访问控制。获取原CDH集群...

挂载文件存储 HDFS 版文件系统

确认不再使用 文件存储 HDFS 文件系统后,您需要参考 挂载文件系统 中的内容,删除所有已部署的 文件存储 HDFS Java SDK和所有core-site.xml文件中的 文件存储 HDFS 相关配置,完成卸载文件系统。如果您想释放 文件存储 HDFS ...

卸载并释放CDH6 HDFS服务使用的云盘

已配置CDH使用 文件存储 HDFS 文件系统。具体操作,请参见 配置CDH6使用文件存储HDFS版。背景信息 当CDH已经成功运行在阿里云 文件存储 HDFS 上时,ECS挂载的云盘只用来存储运算中的临时Shuffle文件,可以选择卸载原来用于构建CDH ...

使用Fuse-DFS挂载文件存储 HDFS

本文主要介绍如何使用Fuse-DFS工具实现 文件存储 HDFS 在本地文件系统的映射。前提条件 已 创建文件系统 和 添加挂载点。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。建议您使用的Hadoop版本不低于2.7.2,本文使用的Hadoop版本...

创建文件系统实例后,为什么无法访问文件存储 HDFS ...

本文介绍了在创建文件系统实例后无法访问 文件存储 HDFS 的排查方法。您可以请根据以下几种情况进行排查:确认访问 文件存储 HDFS 服务的ECS实例对应的专有网络及虚拟交换机ID,与挂载点的专有网络及虚拟交换机ID是否一致。确认挂载...

E-MapReduce数据迁移

本文介绍如何将E-MapReduce HDFS上的数据迁移到 文件存储 HDFS 文件系统。背景信息 阿里云E-MapReduce是构建在阿里云云服务器ECS上的开源Hadoop、Spark、Hive、Flink生态大数据PaaS产品。提供用户在云上使用开源技术建设数据仓库、离线...

SDK示例

本文列出了使用Java代码通过Hadoop FileSystem API对 文件存储 HDFS 文件系统进行常用操作的示例,您可以参考这些示例代码开发您的应用。前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储...

文件存储 HDFS 上使用Apache HBase

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已部署Apache HBase分布式集群,且版本必须与Hadoop版本兼容。具体...

文件存储 HDFS 上使用Presto

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已搭建Hadoop集群并且所有集群节点已安装JDK,JDK版本不低于1.8。建议您使用的Hadoop版本不低于2.7.2,本文档中使用的Hadoop...

文件存储HDFS版

您可以像在Hadoop分布式文件系统(Hadoop Distributed File System)中管理和访问数据那样使用文件存储HDFS版。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布...

常见问题排查

本文介绍使用 文件存储 HDFS 文件系统SDK时遇到的常见问题及排查方法。提示 java.lang.ClassNotFoundException 信息 执行 hadoop 命令或者任务失败,提示 java.lang.ClassNotFoundException:Class ...

目录和文件访问权限

文件存储 HDFS 为目录和文件提供了一种访问权限,该访问权限类似于POSIX文件系统的权限模型。本文简要介绍访问权限的概念、使用方式及其相关注意事项。访问权限介绍 文件存储 HDFS 文件系统中的每一个文件或者目录会关联到三个权限...

文件存储 HDFS 上使用Apache Spark

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已 下载Apache Hadoop压缩包。建议您选用的Hadoop版本不低于2.7.2,...

DeleteUserGroupsMapping-删除用户和组的映射关系

删除文件存储 HDFS 版文件系统实例的用户和组的映射关系。接口说明 文件存储 HDFS 文件系统权限管理依赖文件的用户和组,用户和组映射关系需要通过 OpenAPI 进行管理。有关文件存储 HDFS 文件系统目录和文件访问权限的信息,请参见文件...

文件存储 HDFS 和对象存储OSS双向数据迁移

文件存储 HDFS 允许您就像在Hadoop的分布式文件系统中一样管理和访问数据,并对热数据提供高性能的数据访问能力。对象存储OSS是海量、安全、低成本、高可靠的云存储服务,提供标准型、归档型等多种存储类型。您可以在 文件存储 HDFS ...

ListUserGroupsMappings-查看用户和组的映射关系

查看文件存储 HDFS 版文件系统实例的用户和组的映射关系。接口说明 文件存储 HDFS 文件系统权限管理依赖文件的用户和组,用户和组映射关系需要通过 OpenAPI 进行管理。有关文件存储 HDFS 版文件系统目录和文件访问权限的信息,请参见 ...

文件存储 HDFS 上使用Apache Flink

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已 下载Apache Hadoop压缩包。建议您选用的Hadoop版本不低于2.7.2,...

API概览

本产品(文件存储 HDFS /2018-06-20)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求...

CreateUserGroupsMapping-创建用户和组的映射关系

创建文件存储 HDFS 版文件系统实例的用户和组的映射关系。接口说明 文件存储 HDFS 文件系统权限管理依赖文件的用户和组,用户和组映射关系需要通过 OpenAPI 进行管理。有关文件存储 HDFS 版文件系统目录和文件访问权限的信息,请参见 ...

使用云企业网跨VPC访问文件存储 HDFS

您也可以使用 文件存储 HDFS 的多挂载功能实现单文件系统实例同地域的多VPC访问。属性 VPC1 VPC2 VPC3 网络实例的网段规划 VPC网段:192.168.0.0/16 交换机网段:192.168.0.0/24 VPC网段:10.0.0.0/16 交换机网段:10.0.0.0/24 VPC网段...

安装文件系统SDK

本文档主要介绍 文件存储 HDFS 文件系统SDK的安装及使用方式。前提条件 已创建 文件存储 HDFS 文件系统并添加挂载点。具体操作,请参见 创建文件系统 和 添加挂载点。已为ECS实例安装JDK,且JDK版本不低于1.8。背景信息 本文以hadoop...

开通文件存储 HDFS 服务

本文介绍如何开通 文件存储 HDFS 服务。前提条件 已注册阿里云账号并完成实名认证。详情请参见 注册阿里云账号 和 个人实名认证。操作步骤 登录 阿里云官网。打开 文件存储 HDFS 申请公测页面。在申请公测页面,填写必要信息后单击 ...

性能监控

前提条件 已创建 文件存储 HDFS 文件系统。具体操作,请参见 创建文件系统。已开通云监控服务。您可以登录 云监控产品详情页,根据页面提示开通服务。性能监控指标说明 指标 指标名称 单位 描述 read_iops 文件系统读请求频率 次/秒 该...

用户和组映射

如果您是初次使用 文件存储 HDFS 文件系统,可使用该API创建组并关联用户。DeleteUserGroupsMapping:删除用户和组的映射关系。ListUserGroupsMappings:查看用户和组的映射关系。使用限制 用户名和组名命名规则:必须以字母或者下划线...

应用场景

文件存储 HDFS 适用于对吞吐要求较高的大数据分析与机器学习的业务需求场景。大数据分析与机器学习 在大数据分析与机器学习场景中,应用对数据访问的吞吐性能和延迟有较高要求。而 文件存储 HDFS 能够提供高吞吐量和低延迟的访问能力...

卸载并释放E-MapReduce HDFS使用的云盘

重要 从数据安全性考虑,数据迁移后建议进行数据完整性校验并让E-MapReduce系统文件存储 HDFS 上正常运行一段时间后再卸载和释放云盘。云盘释放以后原有数据将无法找回。集群中的每台机器至少需要保留一块数据盘,通常是/mnt/disk1上...

CreateVscMountPoint-创建VSC挂载点

e389e5c7-bcb4-4558-846a-e5afc444*InstanceIds object 否 待挂载文件存储 HDFS 版文件系统的 ECS 实例 ID。添加多个 ECS 实例 ID 时,使用半角逗号(,)分隔。最多支持 100 个 ECS 实例 ID。["i-bp1g6zv0ce8oghu7*","i-bp1g6zv0ce8oghu1*...

AttachVscMountPoint-绑定VSC挂载点

取值:Primary(默认值):ECS 实例上的预留默认 VSC Secondary:ECS 实例上的可重复 VSC Primary InstanceIds object 否 待挂载文件存储 HDFS 版文件系统的 ECS 实例 ID。添加多个 ECS 实例 ID 时,使用半角逗号(,)分隔。最多支持 100 ...

概述

文件存储HDFS版 文件存储HDFS版(Apsara File Storage for HDFS)是一款面向阿里云ECS实例及容器服务等计算资源的文件存储服务,满足以Hadoop为代表的分布式计算业务类型对分布式存储性能、容量和可靠性的多方面要求。表格存储 表格存储...

GetMountPoint-查询挂载点信息

您可以在已挂载的 VPC 网段内通过此域名访问文件存储 HDFS 版文件系统。f-37af8f42f*.cn-hangzhou.dfs.aliyuncs.com RegionId string 地域 ID。cn-hangzhou 示例 正常返回示例 JSON 格式 {"RequestId":"55C5FFD6-BF99-41BD-9C66-FFF39189*...

概览

本文介绍阿里云 文件存储 HDFS 提供的文件系统SDK和管控系统SDK。目前,公测期间只提供文件系统SDK,管控操作则通过控制台进行。文件系统SDK 文件系统SDK实现了 Hadoop FileSystem 接口,提供一种Hadoop兼容的文件系统,对外输出为一个...

DescribeVscMountPoints-获取VSC挂载点信息列表

hdfs1 Instances object[]已挂载 HDFS 文件系统的 ECS 实例信息集合。Status string 已挂载 HDFS 文件系统的 ECS 实例状态。包括:NORMAL:挂载成功。CREATING:挂载中。INVALID:挂载失败。NORMAL InstanceId string 已挂载 HDFS 文件系统...

ListMountPoints-批量查询挂载点信息

您可以在已挂载的 VPC 网段内通过此域名访问文件存储 HDFS 版文件系统。f-37af8f42f*.cn-hangzhou.dfs.aliyuncs.com RegionId string 地域 ID。cn-hangzhou 示例 正常返回示例 JSON 格式 {"TotalCount":1,"RequestId":"55C5FFD6-BF99-41BD-...

配置E-MapReduce服务使用文件存储 HDFS

本文介绍如何配置E-MapReduce上的HDFS服务、HIVE服务、SPARK服务、HBase服务来使用 文件存储 HDFS 。前提条件 已完成数据迁移。具体操作,请参见 E-MapReduce数据迁移。配置HDFS服务 登录 阿里云E-MapReduce控制台。在 集群管理 页面,...

使用RAM授权访问文件存储 HDFS

授予RAM用户对 文件存储 HDFS 管控系统只读权限 {"Version":"1","Statement":[{"Action":["dfs:Get*","dfs:List*"],"Resource":"*","Effect":"Allow"}]} 示例二:授予RAM用户对文件系统的权限 说明为 文件存储 HDFS 文件系统实例ID,...

存储空间占用情况

OSS-HDFS服务使用OSS Bucket存储HDFS数据及其辅助数据,这些数据均存储于Bucket中的.dlsdata/路径下,并产生相应的OSS存储容量的计量和计费。OSS-HDFS文件数据块block OSS-HDFS文件的所有数据块block均占用OSS Bucket的存储空间。OSS-HDFS...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储HDFS版 文件存储 CPFS 云数据库 RDS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用