环境准备

java-version java version"1.8.0_77"Java(TM)SE Runtime Environment(build 1.8.0_77-b03)Java HotSpot(TM)64-Bit Server VM(build 25.77-b03,mixed mode)安装并启动Hadoop环境 下载2.6.0版本以上的Hadoop安装包,具体下载路径请参见 ...

在文件存储 HDFS 版上使用Apache Tez

./hadoop-mapreduce/hadoop-2.8.5/share/hadoop/hdfs/*:./hadoop-mapreduce/hadoop-2.8.5/share/hadoop/hdfs/lib/*:./hadoop-mapreduce/hadoop-2.8.5/share/hadoop/yarn/*:./hadoop-mapreduce/hadoop-2.8.5/share/hadoop/yarn/lib/*:./...

搭建Hadoop环境

步骤二:安装Hadoop 执行以下命令,下载Hadoop安装包。wget https://mirrors.bfsu.edu.cn/apache/hadoop/common/hadoop-3.2.4/hadoop-3.2.4.tar.gz执行以下命令,将Hadoop安装包解压至/opt/hadoop。sudo tar-zxvf hadoop-3.2.4.tar.gz-C/...

通过ES-Hadoop实现Hive读写阿里云Elasticsearch数据

操作流程 准备工作 创建同一专有网络下的阿里云Elasticsearch和E-MapReduce(以下简称EMR)实例、关闭Elasticsearch实例的自动创建索引功能并创建索引和Mapping、下载与Elasticsearch实例版本一致的ES-Hadoop安装包。步骤一:上传ES-Hadoop...

挂载文件存储 HDFS 版文件系统

安装Hadoop客户端,建议您使用的Hadoop版本不低于2.7.2。Hadoop下载地址,请参见 Hadoop Releases。挂载说明 如果挂载点网络类型是专有网络,则只支持与挂载点同一VPC网络的ECS实例挂载文件系统,且挂载点所绑定的权限组中授权地址必须...

元数据性能测试

NNbench的jar包位于${HADOOP_HOME}/share/hadoop/mapreduce目录下,${HADOOP_HOME}为测试机器中的Hadoop 安装目录,NNbench的jar包名为hadoop-mapreduce-client-jobclient-x.x.x-tests.jar,使用方法如下。本文所有命令均在${HADOOP_HOME}/...

通过开源HDFS客户端连接并使用文件引擎

export HADOOP_HOME=${Hadoop安装目录}/hadoop-2.7.3 执行以下命令进入 hadoop 目录。cd$HADOOP_HOME 将Java环境变量 JAVA_HOME 添加至 etc/hadoop/目录下的 hadoop-env.sh 文件中,假设Java安装在/opt/install/java。set to the root of ...

通过ES-Hadoop将HDFS中的数据写入Elasticsearch

步骤一:上传ES-Hadoop JAR包至HDFS 下载ES-Hadoop安装包,并上传至EMR Master节点的HDFS目录下。步骤二:配置pom依赖 创建Java Maven工程,并配置pom依赖。步骤三:编写并运行MapReduce任务 编写MapReduce写数据到Elasticsearch的Java代码...

集群吞吐性能测试

TestDFSIO的jar包位于开源Hadoop版本的${HADOOP_HOME}/share/hadoop/mapreduce目录下,其中${HADOOP_HOME}为测试机器中的Hadoop安装目录,jar包名为hadoop-mapreduce-client-jobclient-x.x.x-tests.jar,您可通过执行以下命令,查看...

Hadoop使用JindoSDK访问OSS-HDFS服务

ssh-keygen-t rsa-P ''-f~/.ssh/id_rsa cat~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys chmod 0600~/.ssh/authorized_keys 安装Hadoop。下载Hadoop安装包。wget ...

快速入门

已为ECS实例安装Hadoop客户端,建议您使用的Hadoop版本不低于2.7.2。Hadoop下载地址,请参见 Hadoop Releases。本文使用的Hadoop版本为Apache Hadoop 2.7.2。操作视频 步骤一:创建文件系统 您可以通过 文件存储 HDFS 版 控制台创建文件...

使用教程

Hive访问示例 HADOOP_HOME及HADOOP_CLASSPATH可以添加到/etc/profile 中,示例如下:export HADOOP_HOME=${您的Hadoop安装目录} export HADOOP_CLASSPATH=emr-tablestore-1.4.2.jar:tablestore-4.3.1-jar-with-dependencies.jar:joda-time-...

基于eRDMA增强型实例部署Spark集群

步骤一:准备环境 在测试集群性能前,需要先准备测试需要的集群环境,例如Hadoop和Spark机器、安装Hadoop安装并配置eRDMA等。准备Hadoop环境。如果已有大数据集群,请忽略该步骤。软硬件环境要求 部署该集群需要准备Hadoop、Spark机器,...

异构数据源访问

自建Hadoop集群xml文件一般位于以下两个位置之一:conf目录:在早期版本的Hadoop中,这些配置文件通常放在Hadoop安装目录下的conf子目录中。etc/hadoop目录:在较新版本的Hadoop中,配置文件通常放在 etc/hadoop目录下。这个目录位于 ...

在文件存储 HDFS 版上使用Apache Flink

本文介绍如何在挂载 文件存储 HDFS 版 的Hadoop集群上安装及使用Apache Flink。前提条件 已开通 文件存储 HDFS 版 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK版本不...

在文件存储 HDFS 版上使用Apache Spark

本文主要介绍如何在挂载 文件存储 HDFS 版 的Hadoop集群上安装及使用Apache Spark。前提条件 已开通 文件存储 HDFS 版 服务并创建文件系统实例和挂载点。具体操作,请参见 文件存储HDFS版快速入门。已为Hadoop集群所有节点安装JDK,且JDK...

YARN缺陷修复公告

mv$HADOOP_HOME/share/hadoop/yarn/hadoop-yarn-server-resourcemanager-3.2.1.jar/tmp/cp hadoop-yarn-server-resourcemanager-3.2.1.jar$HADOOP_HOME/share/hadoop/yarn/命令中的$HADOOP_HOME 为Hadoop安装目录。本文示例中Hadoop的...

从OSS迁移数据

Hadoop集群所有节点上安装JDK,本操作要求JDK版本不低于1.8。在Hadoop集群安装OSS客户端JindoFS SDK。JindoFS SDK详细介绍请参见 JindoFS SDK。下载 jindofs-sdk.jar。cp./jindofs-sdk-*.jar${HADOOP_HOME}/share/hadoop/hdfs/lib/为...

MapReduce开发手册

common-X.X.X.jar:<HADOOP_HOME>/share/hadoop/mapreduce/hadoop-mapreduce-client-core-X.X.X.jar:<HADOOP_HOME>/share/hadoop/common/lib/commons-cli-1.2.jar-d wordcount_classes EmrWordCount.java HADOOP_HOME:Hadoop安装目录,...

在ECI中访问HDFS数据

usr/local/hadoop-2.7.2/share/hadoop/hdfs:/usr/local/hadoop-2.7.2/share/hadoop/hdfs/lib/*:/usr/local/hadoop-2.7.2/share/hadoop/hdfs/*:/usr/local/hadoop-2.7.2/share/hadoop/yarn/lib/*:/usr/local/hadoop-2.7.2/share/hadoop/...

迁移开源HDFS的数据到文件存储 HDFS 版

迁移集群上安装Hadoop版本不低于2.7.2。说明 如果原集群满足上述条件且计算资源充足,可以直接将原集群当作迁移集群使用,不必额外创建新集群。在迁移集群中配置 文件存储 HDFS 版 实例。具体操作,请参见 挂载文件存储HDFS版文件系统。...

HBase使用OSS-HDFS服务作为底层存储

export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:${JINDOSDK_HOME}/lib/*重要 请将安装目录和环境变量部署到所有所需节点上。将已下载的JindoSDK JAR包安装Hadoop的classpath路径下。cp jindosdk-x.x.x-linux/lib/jindo-core-x.x.x.jar...

使用Presto访问

Hadoop集群中安装Apache Hive,详情请参见 使用Hive访问。下载Presto压缩包和presto-cli-xxx-executable.jar。Presto下载地址:官方链接,在本文档使用Presto的版本为0.241。配置Presto 您可以参见以下步骤配置Presto,Presto官方配置...

Ambari与文件引擎集成

Ambari提供Hadoop组件的安装、运维、监控等功能,您可以使用Ambari管理您的Hadoop集群。本文介绍如何将Ambari与Lindorm文件引擎集成,来替换底层HDFS存储。您可以基于Ambari+Lindorm文件引擎构建云原生存储计算分离的开源大数据系统。前提...

CDH6与文件引擎集成

CDH(Cloudera's Distribution,including Apache Hadoop)提供Hadoop组件的安装、运维、监控等功能,您可以使用 CDH6(表示CDH 6.X 版本)管理您的Hadoop集群。本文介绍如何将CDH6与Lindorm文件引擎集成,来替换底层HDFS存储。您可以基于...

Superset(仅对存量用户开放)

这里以E-MapReduce Hadoop集群默认安装的Hive引擎为例,更多的数据库类型访问方式请参见 SQLAlchemy。登录Superset。您需要在SSH连接中创建隧道以查看开源组件的Web页面,详情请参见 通过SSH隧道方式访问开源组件Web UI。默认用户名和密码...

搭建Linux开发环境

spark.sql.catalogImplementation={odps|hive}#如下参数配置保持不变 spark.hadoop.odps.task.major.version=cupid_v2 spark.hadoop.odps.cupid.container.image.enable=true spark.hadoop.odps.cupid.container.vm.engine.type=hyper ...

使用PyJindo访问阿里云OSS-HDFS

export JINDOSDK_CONF_DIR=etc/taihao-apps/jindosdk-conf export HADOOP_CONF_DIR=etc/taihao-apps/hadoop-conf 安装和升级pip及PyJindo安装包。python3.8-m ensurepip python3.8-m pip install pip-upgrade-trusted-host mirrors.aliyun....

SHOW

包含如下信息:创建或安装Package的名称(PackageName)创建时间(CreateTime)Package所属MaxCompute项目(SourceProject)安装时间(InstallTime)状态(Status)+-+-+|PackageName|CreateTime|+-+-+|datashare|2021-12-28T18:10:39+0800...

SHOW

包含如下信息:创建或安装Package的名称(PackageName)创建时间(CreateTime)Package所属MaxCompute项目(SourceProject)安装时间(InstallTime)状态(Status)+-+-+|PackageName|CreateTime|+-+-+|datashare|2021-12-28T18:10:39+0800...

UDF开发(Java)

当MaxCompute提供的内建函数无法支撑您的业务实现时,您可以根据...如果UDF是在其他版本的Hive或Hadoop上开发的,您需要使用兼容的Hive或Hadoop版本重新编译UDF JAR包。在MaxCompute上使用Hive UDF的具体案例,请参见 兼容Hive Java UDF示例。

FE参数配置

本文介绍FE进程的相关配置项。背景信息 FE的配置文件fe.conf通常存放在FE部署路径的 conf/目录下。而在0.14版本中会引入另一个配置文件fe_custom.conf。该配置文件用于记录您在运行时动态配置并持久化的配置项。FE进程启动后,会先读取fe....

使用Fuse-DFS挂载文件存储 HDFS 版

已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。建议您使用的Hadoop版本不低于2.7.2,本文使用的Hadoop版本为Apache Hadoop 2.8.5。已下载与Hadoop集群版本相同的Hadoop源码包。具体下载地址请参见 下载Hadoop源码包。背景信息 Fuse-...

在文件存储 HDFS 版上使用Apache HBase

已为Hadoop集群所有节点安装JDK,且JDK版本不低于1.8。已部署Apache HBase分布式集群,且版本必须与Hadoop版本兼容。具体操作,请参见 Apache HBase Reference Guide。本文使用Hadoop-2.10.1和HBase-2.3.7测试验证。更多信息,请参见 HBase...

产品概述

形态 描述 EMR on ECS EMR负责将开源Hadoop生态的组件安装部署在ECS上,并启动相应的服务。您可以在EMR控制台完成对集群ECS及服务的运维操作。关于EMR on ECS的更多介绍,请参见 什么是EMR on ECS。EMR on ACK 您需要先完成ACK集群的安装...

产品简介

形态 描述 EMR on ECS EMR负责将开源Hadoop生态的组件安装部署在ECS上,并启动相应的服务。您可以在EMR控制台完成对集群ECS及服务的运维操作。关于EMR on ECS的更多介绍,请参见 什么是EMR on ECS。EMR on ACK 您需要先完成ACK集群的安装...

在文件存储 HDFS 版上使用TensorFlow

已为Hadoop集群所有节点安装JDK,且版本不能低于1.8。已根据目前使用的TensorFlow版本下载 源码。本文使用的TensorFlow版本为1.15.0。背景信息 TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。说明 由于...

文件存储 HDFS 版和数据库MySQL双向数据迁移

export HADOOP_COMMON_HOME=usr/local/hadoop-2.8.5 export HADOOP_MAPRED_HOME=$HADOOP_COMMON_HOME export HIVE_HOME=usr/local/apache-hive-2.3.9-bin#若没有安装hive可不必添加此配置 执行 cp${HIVE_HOME}/lib/hive-common-2.3.9.jar${...

什么是EMR on ACK

形态 描述 EMR on ECS EMR负责将开源Hadoop生态的组件安装部署在ECS上,并启动相应的服务。您可以在EMR控制台完成对集群ECS及服务的运维操作。您需要将其大数据任务提交至EMR集群。EMR on ACK 您需要先完成ACK集群的安装部署。当ACK集群...

常见问题

DataFlow集群中的Hadoop YARN的软件安装目录是/opt/apps/YARN/yarn-current,配置文件的目录是/etc/taihao-apps/hadoop-conf/,您需要将 yarn-current 目录及 hadoop-conf 目录下载到提交Flink作业的客户端上。然后,在提交Flink作业的客户...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 弹性公网IP 数字证书管理服务(原SSL证书) 开源大数据平台 E-MapReduce 商标服务 短信服务
新人特惠 爆款特惠 最新活动 免费试用