迁移开源HDFS的数据到文件存储 HDFS

文件存储 HDFS 可以帮助您实现将开源HDFS的数据迁移到云上,并允许您在云上就像在Hadoop分布式文件系统中管理和访问数据。准备工作 开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。...

使用Fuse-DFS挂载文件存储 HDFS

本文主要介绍如何使用Fuse-DFS工具实现 文件存储 HDFS 在本地文件系统的映射。前提条件 已 创建文件系统 和 添加挂载点。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。建议您使用的Hadoop版本不低于2.7.2,本文使用的Hadoop版本...

文件存储 HDFS 上使用Apache HBase

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已部署Apache HBase分布式集群,且版本必须与Hadoop版本兼容。具体...

文件存储 HDFS 上使用Apache Spark

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已 下载Apache Hadoop压缩包。建议您选用的Hadoop版本不低于2.7.2,...

文件存储 HDFS 上使用Apache Flink

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已 下载Apache Hadoop压缩包。建议您选用的Hadoop版本不低于2.7.2,...

集群吞吐性能测试

配置名称 配置说明 计算VM配置 CPU核数:4核 内存:16 GB 机器数量:6台 网络带宽:1.5 Gbps 文件存储 HDFS 配置 实例大小:10 TB 吞吐限速:1000 MB/s 软件配置 Apache Hadoop:Hadoop 2.7.6 测试工具 TestDFSIO是Hadoop系统自带的基准...

什么是文件存储 HDFS

产品概述 文件存储 HDFS 允许您就像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等...

文件存储 HDFS 和数据库MySQL双向数据迁移

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已搭建Hadoop集群。建议您使用的Hadoop版本不低于2.7.2,本文使用的Hadoop版本为Apache Hadoop 2.8.5。已为Hadoop集群所有...

开通文件存储 HDFS 服务

本文介绍如何开通 文件存储 HDFS 服务。前提条件 已注册阿里云账号并完成实名认证。详情请参见 注册阿里云账号 和 个人实名认证。操作步骤 登录 阿里云官网。打开 文件存储 HDFS 申请公测页面。在申请公测页面,填写必要信息后单击 ...

功能特性

无缝集成 文件存储 HDFS 允许您就像在Hadoop分布式文件系统(HDFS)中一样管理和访问数据。文件存储 HDFS SDK可在所有Apache Hadoop 2.x环境中使用,包括阿里云EMR和阿里云Flink。文件存储 HDFS 支持的原生文件系统语义被开发人员...

文件存储 HDFS 上使用Apache Tez

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。更多信息,下载JDK。已根据集群Hadoop版本对Tez重新编译。具体操作,...

文件存储 HDFS 上使用TensorFlow

配置TensorFlow支持 文件存储 HDFS 在TensorFlow源码中添加对 文件存储 HDFS 的支持,具体操作,请参见 tensorflow support aliyun HDFS。编译TensorFlow。编译 步骤1 中已修改的TensorFlow源码,具体操作,请参见 Build from source...

应用场景

而 文件存储 HDFS 版 能够提供高吞吐量和低延迟的访问能力,无需将数据迁移到计算资源本地,因此在该场景下推荐使用 文件存储 HDFS 存储数据。将数据存入 文件存储 HDFS 版,ECS实例或其他计算资源即可直接访问这些数据。将Hadoop或其他...

配置CDH6使用文件存储 HDFS

数据迁移完成后,您还需要配置CDH上的HDFS服务、YARN服务、Hive服务、Spark服务、HBase服务,才能使用 文件存储 HDFS 配置Cloudera Management服务 执行以下命令,将最新的 文件存储 HDFS Java SDK复制到Cloudera Management服务的...

欠费说明

本文介绍 文件存储 HDFS 版 ...重要 数据清理之前仍会继续计费,如果您确认不再使用 文件存储 HDFS 存储服务,请务必删除 文件存储 HDFS 版 上的数据。无法找回 查看欠费金额 登录 用户中心。在 首页 页面的 待办提醒 区域,查看欠费金额。

概览

本文介绍阿里云 文件存储 HDFS 提供的文件系统SDK和管控系统SDK。目前,公测期间只提供文件系统SDK,管控操作则通过控制台进行。文件系统SDK 文件系统SDK实现了 Hadoop FileSystem 接口,提供一种Hadoop兼容的文件系统,对外输出为一个...

常见问题排查

本文介绍使用 文件存储 HDFS 文件系统SDK时遇到的常见问题及排查方法。提示 java.lang.ClassNotFoundException 信息 执行 hadoop 命令或者任务失败,提示 java.lang.ClassNotFoundException:Class ...

删除文件系统

您可以在 文件存储HDFS版 控制台删除某个已创建的文件系统。前提条件 已删除该文件系统下添加的挂载点。具体操作,请参见 删除挂载点。操作步骤 登录 文件存储HDFS版控制台。在顶部菜单栏,选择地域。在左侧导航栏,选择 文件系统。在 文件...

文件存储HDFS版

您可以像在Hadoop分布式文件系统(Hadoop Distributed File System)中管理和访问数据那样使用文件存储HDFS版。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布...

计费常见问题

本地数据迁移至 文件存储 HDFS 本地数据迁移至 文件存储 HDFS 时,需要配置ECS作为中转节点从公网访问阿里云 文件存储 HDFS 。弹性公网IP对入方向流量不收费,仅对出方向流量收费。即从公网上传数据到 文件存储 HDFS 不会收取...

文件存储 HDFS 支持Python SDK吗?

文件存储 HDFS 提供两种SDK,分别为管控系统SDK和文件系统SDK。仅管控系统支持Python SDK,文件系统仅支持Java SDK。更多有关管控系统支持的SDK语言,请参见 OpenAPI。

卸载并释放CDH6 HDFS服务使用的云盘

配置CDH使用 文件存储 HDFS 文件系统。具体操作,请参见 配置CDH6使用文件存储HDFS版。背景信息 当CDH已经成功运行在阿里云 文件存储 HDFS 上时,ECS挂载的云盘只用来存储运算中的临时Shuffle文件,可以选择卸载原来用于构建CDH ...

文件存储 HDFS (Apsara File Storage for HDFS)...

阿里云 文件存储 HDFS (Apsara File Storage for HDFS)已与阿里云ActionTrail集成,您可以在ActionTrail中查看和检索用户行为日志,同时通过ActrionTrail将日志投递到日志服务LogStore或指定的OSS Bucket中,满足实时审计、问题回溯...

DeleteUserGroupsMapping-删除用户和组的映射关系

删除文件存储 HDFS 版文件系统实例的用户和组的映射关系。接口说明 文件存储 HDFS 文件系统权限管理依赖文件的用户和组,用户和组映射关系需要通过 OpenAPI 进行管理。有关文件存储 HDFS 文件系统目录和文件访问权限的信息,请参见文件...

ListUserGroupsMappings-查看用户和组的映射关系

查看文件存储 HDFS 版文件系统实例的用户和组的映射关系。接口说明 文件存储 HDFS 文件系统权限管理依赖文件的用户和组,用户和组映射关系需要通过 OpenAPI 进行管理。有关文件存储 HDFS 版文件系统目录和文件访问权限的信息,请参见 ...

修改文件系统

本文介绍如何在 文件存储HDFS版 控制台修改某个文件系统的存储容量、基本信息以及吞吐模式。前提条件 已创建文件系统。具体操作,请参见 创建文件系统。操作步骤 登录 文件存储HDFS版控制台。在顶部菜单栏,选择地域。在左侧导航栏,选择 ...

公测期间使用文件系统有哪些限制?

文件存储 HDFS 在公测期间会对单个文件系统的使用进行一定的限制,包括:单个用户可以创建的文件系统数量:1 单个文件系统最大容量:10 TB 单个文件系统目录+文件数最大数量:10万 单个文件系统最多包含挂载点数量:2 单个用户可以创建...

基本概念

本文介绍了 文件存储 HDFS 使用的一些基本概念。术语 描述 文件系统实例 一个拥有全局命名空间,可用来存储数据的文件系统。您可以通过挂载点访问文件系统实例中的数据。挂载点 挂载点是文件系统实例在专有网络或经典网络内的一个访问...

ModifyFileSystem-修改文件系统属性

接口说明 在修改文件系统前,请先了解文件存储 HDFS 的 计费方式 和 HDFS 产品定价。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前...

GetFileSystem-获取文件系统详细信息

HDFS Version string 阿里云文件存储 HDFS 的版本,非 hadoop 版本。1.0.0 MeteringSpaceSize float 文件系统的计费容量。单位:字节(byte)。计费容量=MAX[(文件数+目录数)*5MiB,使用容量]。统计数据,不作为计费数据,仅作参考。...

查询文件系统详情

登录 文件存储HDFS版控制台。在顶部菜单栏,选择地域。在 文件系统 页面,单击需要查看存储信息的文件系统名称,并选择 文件系统概览 页签。在 基础数据 区域,查看该文件系统的资源使用详情。查询文件系统基本信息 您可以在 文件系统概览 ...

ListFileSystems-批量获取文件系统详细信息

HDFS Version string 阿里云文件存储 HDFS 的版本,非 hadoop 版本。1.0.0 MeteringSpaceSize float 文件系统的计费容量。单位:字节(byte)。计费容量=MAX[(文件数+目录数)*5MiB,使用容量]。统计数据,不作为计费数据,仅作参考。...

用户和组映射

如果您是初次使用 文件存储 HDFS 文件系统,可使用该API创建组并关联用户。DeleteUserGroupsMapping:删除用户和组的映射关系。ListUserGroupsMappings:查看用户和组的映射关系。使用限制 用户名和组名命名规则:必须以字母或者下划线...

CreateVscMountPoint-创建VSC挂载点

e389e5c7-bcb4-4558-846a-e5afc444*InstanceIds object 否 待挂载文件存储 HDFS 版文件系统的 ECS 实例 ID。添加多个 ECS 实例 ID 时,使用半角逗号(,)分隔。最多支持 100 个 ECS 实例 ID。["i-bp1g6zv0ce8oghu7*","i-bp1g6zv0ce8oghu1*...

概述

文件存储HDFS版 文件存储HDFS版(Apsara File Storage for HDFS)是一款面向阿里云ECS实例及容器服务等计算资源的文件存储服务,满足以Hadoop为代表的分布式计算业务类型对分布式存储性能、容量和可靠性的多方面要求。表格存储 表格存储...

AttachVscMountPoint-绑定VSC挂载点

取值:Primary(默认值):ECS 实例上的预留默认 VSC Secondary:ECS 实例上的可重复 VSC Primary InstanceIds object 否 待挂载文件存储 HDFS 版文件系统的 ECS 实例 ID。添加多个 ECS 实例 ID 时,使用半角逗号(,)分隔。最多支持 100 ...

卸载并释放E-MapReduce HDFS使用的云盘

重要 从数据安全性考虑,数据迁移后建议进行数据完整性校验并让E-MapReduce系统文件存储 HDFS 上正常运行一段时间后再卸载和释放云盘。云盘释放以后原有数据将无法找回。集群中的每台机器至少需要保留一块数据盘,通常是/mnt/disk1上...

配置E-MapReduce服务使用文件存储 HDFS

本文介绍如何配置E-MapReduce上的HDFS服务、HIVE服务、SPARK服务、HBase服务来使用 文件存储 HDFS 。前提条件 已完成数据迁移。具体操作,请参见 E-MapReduce数据迁移。配置HDFS服务 登录 阿里云E-MapReduce控制台。在 集群管理 页面,...

授权信息

本文为您介绍 文件存储HDFS(DFS)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。文件存储HDFS(DFS)的RAM代码(RamCode)为 dfs,支持的授权粒度为 RESOURCE。权限策略通用结构 权限策略支持JSON格式,其...

使用云企业网跨VPC访问文件存储 HDFS

您也可以使用 文件存储 HDFS 的多挂载功能实现单文件系统实例同地域的多VPC访问。属性 VPC1 VPC2 VPC3 网络实例的网段规划 VPC网段:192.168.0.0/16 交换机网段:192.168.0.0/24 VPC网段:10.0.0.0/16 交换机网段:10.0.0.0/24 VPC网段...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储HDFS版 文件存储 CPFS 对象存储 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用