Block模式使用说明

Block模式提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的Block模式及其使用方式。背景信息 ...

Block模式使用说明

Block模式提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的Block模式及其使用方式。背景信息 ...

Block模式使用说明

Block模式提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的Block模式及其使用方式。背景信息 ...

Block模式使用说明

Block模式提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的Block模式及其使用方式。背景信息 ...

Block模式使用说明

Block模式提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的Block模式及其使用方式。背景信息 ...

Block模式使用说明

Block模式提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的Block模式及其使用方式。背景信息 ...

Block模式使用说明

Block模式提供了最为高效的数据读写能力和元数据访问能力。数据以Block形式存储在后端存储OSS上,本地提供缓存加速,元数据则由本地Namespace服务维护,提供高效的元数据访问性能。本文主要介绍JindoFS的Block模式及其使用方式。背景信息 ...

OSS/OSS-HDFS概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括 JindoFS 存储系统(原JindoFS Block模式)...

产品优势

云消息队列 Kafka 版 100%兼容开源,支持0.10.x~2.6.x的开源版本,无需代码改造无缝迁移上云,体验全托管、免运维的分布式消息队列服务。开箱即用 云消息队列 Kafka 版 100%兼容开源,使您无缝迁移上云。兼容开源:云消息队列 Kafka 版 100...

Catalog概述

Catalog StarRocks 2.3及以上版本支持Catalog功能,方便您轻松访问并查询存储在各类外部源的数据。当前StarRocks提供Internal Catalog和External Catalog两种类型的Catalog。说明 本文图片和部分内容来源于开源StarRocks的 概述。Internal ...

合作伙伴及开源生态

技术合作伙伴 开源技术社区 开源项目布局 2018 年 4 月,蚂蚁集团宣布开源 SOFAStack 金融级分布式架构。得益于社区的信任和支持,目前已经累积超过 2.5 万的 Star 数和超过 100 家企业用户,并持续朝打造金融级云原生多个技术领域的标杆...

技术支持的范围和方式

阿里云E-MapReduce(简称EMR)是云原生开源大数据平台,能够为用户提供简单易集成的开源大数据解决方案。EMR on ECS集群主要构建于ECS之上,集群资源归属于用户,EMR提供基于该资源的半托管云服务能力,用户对集群拥有完全的管理操作权限,...

管理日志

E-Mapreduce(简称EMR)开源组件运行过程中会产生大量的日志。日志管理功能将EMR与日志服务SLS相结合,允许您在EMR控制台直接查询开源组件的日志。前提条件 已在EMR控制台上创建集群,具体操作请参见 创建集群。已开通SLS服务,具体操作请...

创建工作空间

支持开通DLF的地域请参见 已开通的地域和访问域名。已开通OSS服务并创建了存储空间,详情请参见 开通OSS服务 和 创建存储空间。操作步骤 进入EMR Serverless Spark页面。登录 E-MapReduce控制台。在左侧导航栏,选择 EMR Serverless>Spark...

基本概念

本文介绍开源大数据平台E-MapReduce使用过程中遇到的常用名词的基本概念和简要描述。集群 E-MapReduce产品中的一个独立的机器组合,为上层业务提供一些基础的引擎服务。一个E-MapReduce集群是由一个或多个阿里云ECS实例组成的。ECS实例 在E...

Flink(VVR)作业配置

EMR-3.27.x及之前版本使用Flink社区开源版本,EMR-3.27.x之后版本使用完全兼容开源Flink的企业版(VVR)。本文介绍如何配置Flink(VVR)类型的作业。背景信息 Flink企业版由Apache Flink创始团队官方出品,拥有全球统一商业化品牌。VVR提供...

管理工作空间

通过工作空间,您可以创建和编辑Notebook文件,方便地上传和下载文件,与其他用户共享Notebook和数据,并灵活地管理访问权限。前提条件 已完成系统角色授权,详情请参见 EMR Notebook角色授权。账号与访问权限 账号类型 说明 阿里云账号...

快速使用EMR Notebook

EMR Notebook提供了全托管的兼容开源Jupyter的Notebook服务,同时内置了SQL Editor的功能。支持SparkSQL、Hive、StarRocks、PySpark等应用程序的开发和运行。本文以Hive查询为例,为您介绍如何使用EMR Notebook。前提条件 已完成系统角色...

开源软件迁移

当前大部分应用系统都基于开源软件构建,并且大部分的开源软件在倚天ARM平台上已经提供较好的应用生态,您可以直接使用操作系统提供的开源生态软件来安装部署。本文介绍Nginx、MySQL、Redis、TensorFlow、PyTorch等开源软件如何在倚天...

Spark对接Kafka

背景信息 E-MapReduce上的Hadoop集群和Kafka集群都是基于纯开源软件,相关编程使用方法可参见官方相应文档。Spark官方文档:streaming-kafka-integration 和 structured-streaming-kafka-integration。E-MapReduce-demo:github地址。访问...

Hadoop DistCp介绍

集群之间的HDFS数据迁移需要先确保网络的打通,然后再使用Hadoop DistCp工具进行迁移,具体操作请参见 E-MapReduce数据迁移方案。出现ACLs not supported on at least one file system异常,如何处理?具体报错:org.apache.hadoop.tools....

JindoFS块存储模式

概念 块存储模式提供了最为高效的数据读写能力和元数据访问能力,并且能够支持更加全面的Hadoop文件系统语义。同时,JindoFS也提供了外部客户端,能够从集群外部访问建立在E-MapReduce集群内的JindoFS文件系统。数据以Block形式存储在后端...

迁移方案

经典网络与VPC网络互通:目前阿里云存在经典网络和VPC两种网络类型。由于E-MapReduce集群是在VPC网络中,而很多用户的业务系统还存在于经典网络中,为了解决此问题,阿里云推出了ClassicLink方案,您可以参见此方案进行网络互访,详情请...

Impala概述

优点 为了避免延迟,Impala没有使用MapReduce,而是使用分布式查询引擎直接访问数据,该引擎与RDBMS中的查询引擎相似,其性能比Hive快了几个数量级,具体取决于查询和配置的类型。Impala相对于Hadoop上SQL查询,优点如下:由于在数据节点上...

公共参数

AccessKeyId String 是 阿里云颁发给用户的访问服务所用的密钥ID。Signature String 是 签名结果串,关于签名的计算方法,请参见 签名机制。SignatureMethod string 是 签名方式。取值:HMAC-SHA1。Timestamp String 是 请求的时间戳。日期...

访问权限控制

注意 请确保 users.default.networks.ip、users.default.networks.host 和 users.default.networks.host_regexp 三个参数中,至少有一个参数值不为空,否则可能会导致网络不通。users.default.profile default用户默认使用的profile名称。...

新功能发布记录

2023-06-07 Presto概述 通过命令行方式访问Presto 通过JDBC方式访问Presto 配置连接器 管理LDAP认证 2023年5月 功能名称 功能概述 发布时间 相关文档 EMR Workflow EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache ...

Hive元数据说明

自建RDS在多集群部署架构图 内置MySQL 元数据存储在MySQL中,且MySQL Server实例部署在用户的EMR集群中(通常是Master节点),Hive、Spark或Presto等引擎访问元数据时,也不是直接访问MySQL,而是通过访问Hive Metastore间接访问MySQL。...

添加开源Elastic Search数据源

通过开源Elastic Search和DataV结合使用,可以实现数据分析和搜索结果的大屏展示。本文介绍在DataV中添加并使用开源Elastic Search数据源的方法。前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 ...

Lindorm for Cassandra应用实践

开源Cassandra挑战 开源Cassandra是基于Amazon DynamoDB和Google Bigtable设计的一款分布式NoSQL数据库,具备无中心、一致性可调、提供类SQL查询语言CQL等优点。但在实际使用中,Cassandra存在一些难以解决的挑战。比如Cassandra存储和计算...

添加开源Elastic Search数据源

通过开源Elastic Search和DataV结合使用,可以实现数据分析和搜索结果的大屏展示。本文介绍在DataV中添加并使用开源Elastic Search数据源的方法。前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 ...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 TrinoMaster 操作列的>enableLDAP。在弹出...

生命周期策略

本文为您介绍开源大数据开发平台E-MapReduce(简称EMR)的产品生命周期策略及产品终止策略(包含产品粒度与发行版本粒度),以便您知晓详细规则,提早做好相应准备。背景信息 产品的更新换代是基础技术软件领域的常态。在开源大数据社区蓬勃...

JindoFS介绍和使用

JindoFS是基于阿里云对象存储OSS,为开源大数据生态构建的Hadoop兼容文件系统(Hadoop Compatible File System,HCFS)。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS...

生命周期策略

本文为您介绍开源大数据开发平台E-MapReduce(简称EMR)的产品生命周期策略及产品终止策略(包含产品粒度与发行版本粒度),以便您知晓详细规则,提早做好相应准备。背景信息 产品的更新换代是基础技术软件领域的常态。在开源大数据社区蓬勃...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 SparkThriftServer 操作列的>enableLDAP。...

HDFS概述

HDFS(Hadoop Distributed File System)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本。HDFS适用于大规模数据的分布式读写,特别是读多写少的场景...

使用限制

禁止停止Master的MySQL服务(创建集群时,元数据选择集群内置MySQL)emr-header-1上的MySQL服务,关联到Hive MetaStore、Oozie和Ranger,如果停止服务,会造成支持的服务无法访问到数据库。无。禁止修改emr-header-1节点上预装的MySQL root...

EMR-5.2.x版本说明

优化CBO(Cost-Based Optimization)、DPP(DynamicPartitionPruning)以及Z-Order等功能,性能比开源Spark 3版本提升50%。支持阿里云Log Service、DataHub和消息队列RocketMQ版(简称ONS)等数据源。Tez 优化Tez默认参数,以提升作业性能...

使用StarRocks Console

访问查询页面 进入StarRocks-Console页面。登录EMR on ECS控制台。在顶部菜单栏处,根据实际情况选择地域 和资源组。在 集群管理 页面,单击目标集群操作列的 集群服务。在 集群服务 页面,单击 StarRocks-Console 服务区域的 状态。获取...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS VPN网关 负载均衡 共享流量包 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用