计费常见问题

本地数据迁移至 文件存储 HDFS 本地数据迁移至 文件存储 HDFS 时,需要配置ECS作为中转节点从公网访问阿里 文件存储 HDFS 。弹性公网IP对入方向流量不收费,仅对出方向流量收费。即从公网上传数据到 文件存储 HDFS 不会收取...

卸载并释放CDH6 HDFS服务使用的云盘

已配置CDH使用 文件存储 HDFS 文件系统。具体操作,请参见 配置CDH6使用文件存储HDFS版。背景信息 当CDH已经成功运行在阿里 文件存储 HDFS 上时,ECS挂载的盘只用来存储运算中的临时Shuffle文件,可以选择卸载原来用于构建CDH ...

卸载并释放E-MapReduce HDFS使用的云盘

重要 从数据安全性考虑,数据迁移后建议进行数据完整性校验并让E-MapReduce系统文件存储 HDFS 上正常运行一段时间后再卸载和释放盘。盘释放以后原有数据将无法找回。集群中的每台机器至少需要保留一块数据盘,通常是/mnt/disk1上...

E-MapReduce数据迁移

如果涉及将下集群的数据迁移到阿里 文件存储 HDFS 文件系统,请参见 迁移开源HDFS的数据到文件存储HDFS版。如果E-MapReduce HDFS文件系统上的数据量较小,可以使用 hadoop fs-cp 命令进行数据迁移。为了避免因为权限问题导致数据...

使用Fuse-DFS挂载文件存储 HDFS

本文主要介绍如何使用Fuse-DFS工具实现 文件存储 HDFS 在本地文件系统的映射。前提条件 已 创建文件系统 和 添加挂载点。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。建议您使用的Hadoop版本不低于2.7.2,本文使用的Hadoop版本...

文件存储 HDFS (Apsara File Storage for HDFS)...

阿里 文件存储 HDFS (Apsara File Storage for HDFS)已与阿里ActionTrail集成,您可以在ActionTrail中查看和检索用户行为日志,同时通过ActrionTrail将日志投递到日志服务LogStore或指定的OSS Bucket中,满足实时审计、问题回溯...

配置CDH6使用文件存储 HDFS

数据迁移完成后,您还需要配置CDH上的HDFS服务、YARN服务、Hive服务、Spark服务、HBase服务,才能使用 文件存储 HDFS 。配置Cloudera Management服务 执行以下命令,将最新的 文件存储 HDFS Java SDK复制到Cloudera Management服务的...

挂载文件存储 HDFS 版文件系统

确认不再使用 文件存储 HDFS 文件系统后,您需要参考 挂载文件系统 中的内容,删除所有已部署的 文件存储 HDFS Java SDK和所有core-site.xml文件中的 文件存储 HDFS 相关配置,完成卸载文件系统。如果您想释放 文件存储 HDFS ...

CDH6数据迁移

背景信息 CDH(Cloudera's Distribution,including Apache Hadoop)是众多Hadoop发行版本中的一种,您可以使用 文件存储 HDFS 替换CDH6原有的本地HDFS服务,通过CDH6和 文件存储 HDFS 实现大数据计算上的存储与计算分离,应对...

创建文件系统实例后,为什么无法访问文件存储 HDFS ...

本文介绍了在创建文件系统实例后无法访问 文件存储 HDFS 的排查方法。您可以请根据以下几种情况进行排查:确认访问 文件存储 HDFS 服务的ECS实例对应的专有网络及虚拟交换机ID,与挂载点的专有网络及虚拟交换机ID是否一致。确认挂载...

开通文件存储 HDFS 服务

本文介绍如何开通 文件存储 HDFS 服务。前提条件 已注册阿里账号并完成实名认证。详情请参见 注册阿里账号 和 个人实名认证。操作步骤 登录 阿里官网。打开 文件存储 HDFS 申请公测页面。在申请公测页面,填写必要信息后单击 ...

SDK示例

本文列出了使用Java代码通过Hadoop FileSystem API对 文件存储 HDFS 文件系统进行常用操作的示例,您可以参考这些示例代码开发您的应用。前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储...

删除文件系统

您可以在 文件存储HDFS版 控制台删除某个已创建的文件系统。前提条件 已删除该文件系统下添加的挂载点。具体操作,请参见 删除挂载点。操作步骤 登录 文件存储HDFS版控制台。在顶部菜单栏,选择地域。在左侧导航栏,选择 文件系统。在 文件...

计费项

本文为您介绍 文件存储 HDFS 服务的计费说明。产品定价 关于 文件存储 HDFS 的计费定价,请参见 文件存储 HDFS 产品定价。计费周期 文件存储 HDFS 每小时统计前一小时的实际用量并进行结算,从账户余额中扣除实际消费金额。例如...

应用场景

文件存储 HDFS 能够提供高吞吐量和低延迟的访问能力,无需将数据迁移到计算资源本地,因此在该场景下推荐使用 文件存储 HDFS 存储数据。将数据存入 文件存储 HDFS ,ECS实例或其他计算资源即可直接访问这些数据。将Hadoop或其他...

文件存储 HDFS 支持Python SDK吗?

文件存储 HDFS 提供两种SDK,分别为管控系统SDK和文件系统SDK。仅管控系统支持Python SDK,文件系统仅支持Java SDK。更多有关管控系统支持的SDK语言,请参见 OpenAPI。

常见问题排查

本文介绍使用 文件存储 HDFS 文件系统SDK时遇到的常见问题及排查方法。提示 java.lang.ClassNotFoundException 信息 执行 hadoop 命令或者任务失败,提示 java.lang.ClassNotFoundException:Class ...

基本概念

本文介绍了 文件存储 HDFS 使用的一些基本概念。术语 描述 文件系统实例 一个拥有全局命名空间,可用来存储数据的文件系统。您可以通过挂载点访问文件系统实例中的数据。挂载点 挂载点是文件系统实例在专有网络或经典网络内的一个访问...

目录和文件访问权限

文件存储 HDFS 为目录和文件提供了一种访问权限,该访问权限类似于POSIX文件系统的权限模型。本文简要介绍访问权限的概念、使用方式及其相关注意事项。访问权限介绍 文件存储 HDFS 文件系统中的每一个文件或者目录会关联到三个权限...

安装文件系统SDK

本文档主要介绍 文件存储 HDFS 文件系统SDK的安装及使用方式。前提条件 已创建 文件存储 HDFS 文件系统并添加挂载点。具体操作,请参见 创建文件系统 和 添加挂载点。已为ECS实例安装JDK,且JDK版本不低于1.8。背景信息 本文以hadoop...

公测期间使用文件系统有哪些限制?

文件存储 HDFS 在公测期间会对单个文件系统的使用进行一定的限制,包括:单个用户可以创建的文件系统数量:1 单个文件系统最大容量:10 TB 单个文件系统目录+文件数最大数量:10万 单个文件系统最多包含挂载点数量:2 单个用户可以创建...

文件存储 HDFS 和数据库MySQL双向数据迁移

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已搭建Hadoop集群。建议您使用的Hadoop版本不低于2.7.2,本文使用的Hadoop版本为Apache Hadoop 2.8.5。已为Hadoop集群所有...

修改文件系统

本文介绍如何在 文件存储HDFS版 控制台修改某个文件系统的存储容量、基本信息以及吞吐模式。前提条件 已创建文件系统。具体操作,请参见 创建文件系统。操作步骤 登录 文件存储HDFS版控制台。在顶部菜单栏,选择地域。在左侧导航栏,选择 ...

文件存储 HDFS 上使用Apache Spark

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已 下载Apache Hadoop压缩包。建议您选用的Hadoop版本不低于2.7.2,...

用户和组映射

如果您是初次使用 文件存储 HDFS 文件系统,可使用该API创建组并关联用户。DeleteUserGroupsMapping:删除用户和组的映射关系。ListUserGroupsMappings:查看用户和组的映射关系。使用限制 用户名和组名命名规则:必须以字母或者下划线...

性能优化最佳实践

alidfs.use.buffer.size.setting 文件存储HDFS版 是否使用Hadoop默认的 buffer size 值。取值范围如下:false:使用 alidfs.default.write.buffer.size 和 alidfs.default.read.buffer.size 配置的值。true:使用Hadoop默认的 buffer size ...

什么是文件存储 HDFS

产品概述 文件存储 HDFS 允许您就像在Hadoop分布式文件系统(Hadoop Distributed File System)中一样管理和访问数据。您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等...

文件存储 HDFS 上使用Apache Flink

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已 下载Apache Hadoop压缩包。建议您选用的Hadoop版本不低于2.7.2,...

快速入门

文件存储 HDFS 兼容了标准的HadoopFS协议接口,使您无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、高可靠和高可用的分布式文件系统。相比自建HDFS存储,使用 文件存储 HDFS 服务可以大量节约...

文件存储 HDFS 上使用Presto

前提条件 已开通 文件存储 HDFS 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已搭建Hadoop集群并且所有集群节点已安装JDK,JDK版本不低于1.8。建议您使用的Hadoop版本不低于2.7.2,本文档中使用的Hadoop...

账单查询

您可以通过阿里管理控制台查看 文件存储 HDFS 的费用账单。查看文件系统费用账单 登录 用户中心。在左侧导航栏,单击 账单管理>账单详情。在 明细账单 页签中,设置查询 账期,并在列表中筛选产品为 文件存储 HDFS 。您还可以通过 ...

新建云计算资源

相关操作 操作 说明 编辑云计算资源 在 云计算资源 页面,单击目标云计算资源 操作 列的 编辑,可对云计算资源的连接信息、应用场景标签等进行修改。重要 编辑云计算资源的AK、用户名、密码可能导致该云计算资源中存储的已授权物理表无法...

检测云计算资源连通性

云计算资源新建完成后,支持一键检测云计算资源的连通性,从而保障云计算资源连接通畅。操作步骤 登录企业数据智能平台。在页面右上角,单击 图标,选择 系统设置。在页面左侧导航栏,单击 工作组管理。在 工作组管理 页面,选择目标工作组...

查看云计算资源物理表

云计算资源新建完成后,可查看当前云计算资源中的物理表的基本信息和表结构;同时,可通过获取最新物理表和更新缓存表来更新物理表。本文主要介绍如何查看云计算资源的物理表。前提条件 已新建云计算资源,具体操作,请参见 新建云计算资源...

云计算资源类型

云计算资源是 企业数据智能平台 中数据标准字段使用的基础,通过了解数据标准支持的云计算资源类型,并在系统设置模块添加数据标准需要使用的云计算资源类型对应资源,以备在物理化质量校验函数和物理化数据字典时使用。本文介绍数据标准...

云计算资源类型

云计算资源是 企业数据智能平台 中通用资源使用的基础,通过了解通用资源支持的云计算资源类型,并在系统设置模块添加通用资源需要使用的云计算资源类型对应资源,以备在新建函数资源、自定义函数并物理化以及新建数据基础库并物理化时使用...

云计算资源类型

云计算资源是 企业数据智能平台 中数据建模使用的基础,通过了解数据建模支持的云计算资源类型,并在系统设置模块添加数据建模需要使用的云计算资源类型对应资源,以备在物理化逻辑表和设置对应资源的质量规则时使用。本文介绍数据建模中...

云计算资源类型

通过了解质量评估支持的云计算资源类型,并在系统设置模块添加质量评估需要使用的云计算资源类型对应资源,以备在运行质量检测计划时使用。本文介绍质量评估模块支持的云计算资源类型。质量规则 支持的云计算资源类型:MaxCompute Hive ...

通过HDFS Shell连接并使用文件引擎

HDFS Shell是Hadoop分布式文件系统HDFS)提供的命令行工具。Lindorm文件引擎100%兼容HDFS协议,您可以通过HDFS Shell工具交互式管理文件引擎中存储的文件,例如文件查询、文件删除、文件权限管理和修改文件名称等。本文介绍通过HDFS ...

云计算资源类型

云计算资源是 企业数据智能平台 资产管理的基础,了解运营支持的云计算资源类型,以备在系统设置模块添加对应资源。本文介绍运营模块支持的云计算资源类型。表资产 支持的云计算资源类型:MaxCompute、DataHub、Hive、RDS MySQL、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云服务器 ECS 文件存储HDFS版 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用