文件存储 HDFS 上使用Apache Tez

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。更多信息,下载JDK。已根据集群Hadoop版本对Tez重新编译。具体操作,...

ModifyFileSystem-修改文件系统属性

接口说明 在修改文件系统前,请先了解文件存储 HDFS 的 计费方式 和 HDFS 产品定价。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前...

查询文件系统详情

登录 文件存储HDFS版控制台。在顶部菜单栏,选择地域。在 文件系统 页面,单击需要查看存储信息的文件系统名称,并选择 文件系统概览 页签。在 基础数据 区域,查看该文件系统的资源使用详情。查询文件系统基本信息 您可以在 文件系统概览 ...

GetFileSystem-获取文件系统详细信息

HDFS Version string 阿里云文件存储 HDFS 的版本,非 hadoop 版本。1.0.0 MeteringSpaceSize float 文件系统的计费容量。单位:字节(byte)。计费容量=MAX[(文件数+目录数)*5MiB,使用容量]。统计数据,不作为计费数据,仅作参考。...

用户和组映射

如果您是初次使用 文件存储 HDFS 文件系统,可使用该API创建组并关联用户。DeleteUserGroupsMapping:删除用户和组的映射关系。ListUserGroupsMappings:查看用户和组的映射关系。使用限制 用户名和组名命名规则:必须以字母或者下划线...

ListFileSystems-批量获取文件系统详细信息

HDFS Version string 阿里云文件存储 HDFS 的版本,非 hadoop 版本。1.0.0 MeteringSpaceSize float 文件系统的计费容量。单位:字节(byte)。计费容量=MAX[(文件数+目录数)*5MiB,使用容量]。统计数据,不作为计费数据,仅作参考。...

性能优化最佳实践

alidfs.use.buffer.size.setting 文件存储HDFS版 是否使用Hadoop默认的 buffer size 值。取值范围如下:false:使用 alidfs.default.write.buffer.size 和 alidfs.default.read.buffer.size 配置的值。true:使用Hadoop默认的 buffer size ...

CreateFileSystem-创建文件系统

接口说明 在创建文件系统前,请先了解文件存储 HDFS 的 计费方式 和 HDFS 产品定价。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前...

元数据性能测试

配置名称 配置说明 计算VM配置 CPU核数:4核 内存:16 GB 机器数量:6台 网络带宽:1.5 Gbps 文件存储 HDFS 配置 实例大小:10 TB 吞吐限速:1000 MB/s 软件配置 Apache Hadoop:Hadoop 2.7.6 测试工具 NNbench是Hadoop系统自带的基准...

使用RAM授权访问文件存储 HDFS

授予RAM用户对 文件存储 HDFS 管控系统只读权限 {"Version":"1","Statement":[{"Action":["dfs:Get*","dfs:List*"],"Resource":"*","Effect":"Allow"}]} 示例二:授予RAM用户对文件系统的权限 说明为 文件存储 HDFS 文件系统实例ID,...

授权信息

本文为您介绍 文件存储HDFS(DFS)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。文件存储HDFS(DFS)的RAM代码(RamCode)为 dfs,支持的授权粒度为 RESOURCE。权限策略通用结构 权限策略支持JSON格式,其...

配置E-MapReduce服务使用文件存储 HDFS

本文介绍如何配置E-MapReduce上的HDFS服务、HIVE服务、SPARK服务、HBase服务来使用 文件存储 HDFS 。前提条件 已完成数据迁移。具体操作,请参见 E-MapReduce数据迁移。配置HDFS服务 登录 阿里云E-MapReduce控制台。在 集群管理 页面,...

管理权限组

文件存储 HDFS 中,权限组是一个白名单机制。您可以创建权限组和规则,允许指定的IP地址或网段访问文件系统,并给不同的IP地址或网段授予不同的访问权限。背景信息 初始情况下,每个阿里云账号会自动生成一个默认权限组,默认权限组...

文件存储HDFS的审计事件

文件存储HDFS已与操作审计服务集成,您可以在操作审计中查询用户操作文件存储HDFS产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了用户...

CreateVscMountPoint-创建VSC挂载点

e389e5c7-bcb4-4558-846a-e5afc444*InstanceIds object 否 待挂载文件存储 HDFS 版文件系统的 ECS 实例 ID。添加多个 ECS 实例 ID 时,使用半角逗号(,)分隔。最多支持 100 个 ECS 实例 ID。["i-bp1g6zv0ce8oghu7*","i-bp1g6zv0ce8oghu1*...

AttachVscMountPoint-绑定VSC挂载点

取值:Primary(默认值):ECS 实例上的预留默认 VSC Secondary:ECS 实例上的可重复 VSC Primary InstanceIds object 否 待挂载文件存储 HDFS 版文件系统的 ECS 实例 ID。添加多个 ECS 实例 ID 时,使用半角逗号(,)分隔。最多支持 100 ...

概述

文件存储HDFS版 文件存储HDFS版(Apsara File Storage for HDFS)是一款面向阿里云ECS实例及容器服务等计算资源的文件存储服务,满足以Hadoop为代表的分布式计算业务类型对分布式存储性能、容量和可靠性的多方面要求。表格存储 表格存储...

GetMountPoint-查询挂载点信息

您可以在已挂载的 VPC 网段内通过此域名访问文件存储 HDFS 版文件系统。f-37af8f42f*.cn-hangzhou.dfs.aliyuncs.com RegionId string 地域 ID。cn-hangzhou 示例 正常返回示例 JSON 格式 {"RequestId":"55C5FFD6-BF99-41BD-9C66-FFF39189*...

ListMountPoints-批量查询挂载点信息

您可以在已挂载的 VPC 网段内通过此域名访问文件存储 HDFS 版文件系统。f-37af8f42f*.cn-hangzhou.dfs.aliyuncs.com RegionId string 地域 ID。cn-hangzhou 示例 正常返回示例 JSON 格式 {"TotalCount":1,"RequestId":"55C5FFD6-BF99-41BD-...

配置CDH6使用文件存储 HDFS

数据迁移完成后,您还需要配置CDH上的HDFS服务、YARN服务、Hive服务、Spark服务、HBase服务,才能使用 文件存储 HDFS 。配置Cloudera Management服务 执行以下命令,将最新的 文件存储 HDFS Java SDK复制到Cloudera Management服务的...

如何选用NAS、OSS和EBS?

相关文档 文件存储NAS提供了两种存储类型,分别为通用型NAS和极速型NAS。关于两种存储类型的详细信息,请参见 产品规格。关于如何根据业务负载选择文件系统,请参见 如何选择合适的文件系统?关于NAS的计费信息,请参见 计费概述。

HDFS数据源

HDFS是一个分布式文件系统,为您提供读取和写入HDFS双向通道的功能,本文为您介绍DataWorks的HDFS数据同步的能力支持情况。支持的版本 目前不支持阿里云文件存储HDFS版。使用限制 离线读 使用HDFS Reader时,请注意以下事项:由于连通默认...

使用E-Mapreduce访问

在 集群管理 页面,找到需要挂载文件存储HDFS的目标E-MapReduce集群,单击 管理。更改配置。选择 集群服务>HDFS,单击 配置。在 服务配置 中,单击 core-site。找到配置项 fs.defaultFS,将其替换为文件引擎的地址。单击 保存,在 确认保 ...

入门概述

它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。NAS兼容了POSIX文件接口,可支持数千台计算节点共享访问,可以挂载到弹性计算ECS、神龙裸金属、容器服务ACK、弹性容器ECI、批量计算BCS、高性能计算EHPC及AI训练PAI等...

什么是文件存储NAS

它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。产品概述 NAS基于POSIX文件接口,天然适配原生操作系统,提供共享访问,同时保证数据一致性和锁互斥。它提供了简单的可扩展文件存储以供与ECS配合使用,多个ECS实例可以...

使用Fuse-DFS挂载文件存储 HDFS

本文主要介绍如何使用Fuse-DFS工具实现 文件存储 HDFS 在本地文件系统的映射。前提条件 已 创建文件系统 和 添加挂载点。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。建议您使用的Hadoop版本不低于2.7.2,本文使用的Hadoop版本...

NAS存储卷概述

它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。NAS基于POSIX文件接口,天然适配原生操作系统,提供共享访问,同时保证数据一致性和锁互斥。它提供了简单的可扩展文件存储以供与ECS配合使用,多个ECS实例可以同时访问...

常见问题

阿里云文件存储NAS是一个可共享访问、弹性扩展、高可靠、高性能的分布式文件系统。NAS兼容了POSIX文件接口,可支持数千台计算节点共享访问,可以挂载到弹性计算ECS、神龙裸金属、容器服务ACK、弹性容器ECI、批量计算BCS、高性能计算EHPC及...

NAS存储卷概述(ASK)

它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。NAS基于POSIX文件接口,天然适配原生操作系统,提供共享访问,同时保证数据一致性和锁互斥。它提供了简单的可扩展文件存储以供与ECS配合使用,多个ECS实例可以同时访问...

基本概念

文件存储NAS使用架构 文件存储NAS是一个可共享访问、弹性扩展、高可靠、高性能的分布式文件系统。可支持上千台弹性计算ECS、容器服务ACK等计算节点共享访问,您无需修改应用程序,即可迁移业务系统上云。计算节点和NAS各模块的关系如下图所...

HDFS概述

HDFS(Hadoop Distributed File System)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本。HDFS适用于大规模数据的分布式读写,特别是读多写少的场景...

CDH6数据迁移

步骤一:为 文件存储 HDFS 添加用户和组映射 迁移数据前,您需要在 文件存储 HDFS 文件系统实例上创建原CDH集群HDFS服务中已有的用户和组映射关系。关于 文件存储 HDFS 实例访问控制的详细信息,请参见 访问控制。获取原CDH集群...

文件存储 HDFS 上使用Apache Spark

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已 下载Apache Hadoop压缩包。建议您选用的Hadoop版本不低于2.7.2,...

文件存储NAS

它是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统,支持NFS和SMB协议。文件存储NAS 目前提供极速型、通用性能型、通用容量型三种规格:规格 说明 极速型 基于阿里云最新一代网络架构和全闪存储打造的高性能共享文件存储。...

添加数据源

建议值:2 数据源类型 为 Hadoop分布式文件系统HDFS)配置重要参数,描述如下:参数 描述 数据源类型 数据源来源类型,此处选择 Hadoop分布式文件系统HDFS)。数据源名称 用于表示HDFS的数据源名称。您可以根据情况自行定义合适的名称...

通过HDFS Shell连接并使用文件引擎

HDFS Shell是Hadoop分布式文件系统HDFS)提供的命令行工具。Lindorm文件引擎100%兼容HDFS协议,您可以通过HDFS Shell工具交互式管理文件引擎中存储的文件,例如文件查询、文件删除、文件权限管理和修改文件名称等。本文介绍通过HDFS ...

Hive连接器

背景信息 Hive数仓系统由以下三部分内容组成:不同格式的数据文件,通常存储在Hadoop分布式文件系统HDFS)或对象存储系统(例如,阿里云OSS)中。存储着数据文件到Schema和Table映射的元数据。该元数据存储在数据库(例如,MySQL)中,并...

NFS协议

NFS概念 NFS(Network File System),即网络文件系统协议,是一种分布式文件系统协议,通过NFS协议,您可以像访问本地文件一样访问远端系统上的文件。Linux操作系统和容器建议使用NFS协议类型的文件系统。如果使用SMB协议类型的文件系统,...

使用JindoFuse挂载访问

JindoFuse是一个开源的分布式文件系统访问工具,同时兼容POSIX,使得AI应用程序可以直接使用OSS-HDFS服务作为数据存储和处理的解决方案。前提条件 已开通并授权访问OSS-HDFS服务。具体操作,请参见 开通并授权访问OSS-HDFS服务。环境准备 ...

使用NAS静态存储

NAS存储卷是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。本文介绍如何使用阿里云NAS静态存储卷,以及如何实现持久化存储与共享存储。前提条件 已创建 ACK Serverless集群。具体操作,请参见 创建ACK Serverless集群。已...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储HDFS版 文件存储 CPFS 阿里邮箱 对象存储 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用