数据膨胀诊断

AnalyticDB PostgreSQL版 提供的智能诊断数据膨胀功能,可以定期自动诊断数据库内的所有,并生成诊断信息。您可以通过诊断信息,查看的膨胀情况并获得相应的处理建议(如执行VACUUM或VACUUM FULL操作)。注意事项 智能诊断数据膨胀...

Spark访问湖仓一体外部数据源

访问基于Hadoop外部数据源的外部项目 MaxCompute SQL访问外部项目-hadoop_external_project 为外部项目,映射的是EMR的Hive数据库-访问非分区表 SELECT*from hadoop_external_project.testtbl;访问分区表 SELECT*from hadoop_external_...

无锁结构变更

背景信息 为解决变更数据库表结构时的锁表问题,ODC V4.2.0 版本提供了无锁结构变更功能,该功能可以较好地规避因锁表以致于阻塞业务。本文档旨在介绍如何通过提交无锁变更工单实现数据库无锁结构变更。ODC 支持的在线结构变更 分类 操作 ...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

使用JindoFS SDK免密功能

本文介绍使用JindoFS SDK时,E-MapReduce(简称EMR)集群外如何以免密方式访问E-MapReduce JindoFS的文件系统。前提条件 适用环境:ECS(EMR环境外)+Hadoop+JavaSDK。背景信息 使用JindoFS SDK时,需要把环境中相关Jindo的包从环境中移除...

Credential Provider使用说明

您可以使用Credential Provider配置加密后的AccessKey信息至文件中,避免泄露AccessKey信息。背景信息 EMR-3.30.0版本支持JindoOSS Credential Provider功能。您可以通过使用Hadoop Credential Provider将加密后的AccessKey信息存入文件,...

通过OSS SDK接入开源生态

开源生态 说明 使用Hadoop或者Hive访问OSS 此系列文档由开源软件Apache社区提供。使用Flink访问OSS 将HBase快照保存在OSS 将Kafka数据导入OSS 此系列文档由面向开源项目的托管平台GitHub提供。使用Logstash将日志导入OSS 使用Fluentd访问...

设置Dataphin实例的计算引擎为Hadoop

前提条件 已完成系统元数据的初始化,请参见 使用Hadoop作为元仓计算引擎进行元仓初始化。操作步骤 使用超级管理员或系统管理员账号,登录Dataphin控制台。在Dataphin首页,单击顶部菜单栏 管理中心。在 管理中心 页面,按照下图操作进入 ...

2023年

新说明 MaxFrame是由阿里云自研的分布式科学计算框架,是对历史相关产品功能(PyODPS、Mars)的重大升级,在MaxCompute之上提供一套完全兼容Pandas接口的API,让用户更为熟悉、更符合Python社群习惯的方式使用MaxCompute。本文为您介绍...

性能优化最佳实践

您可以通过调整core-site.xml配置、TestDFSIO配置或避免使用小文件来优化集群性能。调整core-site.xml配置 在测试集群吞吐性能之前建议在core-site.xml文件中增加或修改如下配置,同步到所有依赖hadoop-common的节点上并重启集群服务。...

Multi-Master关键技术介绍

本文对Multi-Master架构的关键技术点进行介绍,包括分布式事务处理、全局死锁处理、DDL支持、分布式表锁支持、集群容错和高可能力。分布式事务管理 AnalyticDB PostgreSQL版 分布式事务 AnalyticDB PostgreSQL版 通过二阶段提交协议(2PC...

E-MapReduce数据迁移

cp~/aliyun-sdk-dfs-1.0.2-beta.jar/opt/apps/ecm/service/hadoop/2.8.5-1.3.1/package/hadoop-2.8.5-1.3.1/share/hadoop/hdfs/在E-MapReduce服务中,对应的路径为/opt/apps/ecm/service/hadoop/x.x.x-x.x.x/package/hadoop-x.x.x-x.x.x/...

EMR集群JindoData升级流程(旧版控制台)

准备软件包和升级脚本 登录EMR集群的Master节点,并将下载的patch包放在Hadoop用户的HOME目录下,将patch包解压缩后,使用hadoop用户执行操作。su-hadoop cd/home/hadoop/wget ...

通过ES-Hadoop实现Hive读写阿里云Elasticsearch数据

ES-Hadoop是Elasticsearch推出的专门用于对接Hadoop生态的工具,可以让数据在Elasticsearch和Hadoop之间双向移动,无缝衔接Elasticsearch与Hadoop服务,充分使用Elasticsearch的快速搜索及Hadoop批处理能力,实现交互式数据处理。...

文件存储 HDFS 版和对象存储OSS双向数据迁移

建议您使用Hadoop版本不低于2.7.2,本文档中使用Hadoop版本为Apache Hadoop 2.8.5。已开通对象存储OSS服务并创建存储空间(Bucket)。具体操作,请参见 对象存储OSS快速入门。背景信息 阿里云 文件存储 HDFS 版 是面向阿里云ECS实例及...

通过ES-Hadoop将HDFS中的数据写入Elasticsearch

ES-Hadoop是Elasticsearch推出的专门用于对接Hadoop生态的工具,可以让数据在Elasticsearch和Hadoop之间双向移动,无缝衔接Elasticsearch与Hadoop服务,充分使用Elasticsearch的快速搜索及Hadoop批处理能力,实现交互式数据处理。...

通过Hadoop Shell命令访问

如果您希望通过命令行的方式在开通OSS-HDFS服务的Bucket中执行上传、下载、删除等相关操作,您可以使用Hadoop Shell的方式。环境准备 您可以选择以下任意一种方式访问OSS-HDFS服务。通过阿里云EMR访问OSS-HDFS服务,确保已创建EMR-3.44.0及...

执行DDL操作提示“获取不到MDL

ERROR 1094(HY000):Unknown thread id:xxx 使用Hint语法指定只读节点执行以下SQL查询目标上MDL状态。force_node='pi-bp10k7631d6k3*'*/SELECT t.PROCESSLIST_ID,m.OBJECT_TYPE,m.OBJECT_SCHEMA,m.OBJECT_NAME,m.LOCK_TYPE,m.LOCK_...

Credential Provider使用说明

背景信息 您可以通过使用Hadoop Credential Provider将加密后的AccessKey信息存入文件,从而避免配置明文AccessKey,根据不同情况选择合适的JindoOSS Credential Provider。配置JindoOSS Credential Provider 进入SmartData服务。登录 阿里...

Credential Provider使用说明

背景信息 您可以通过使用Hadoop Credential Provider将加密后的AccessKey信息存入文件,从而避免配置明文AccessKey,根据不同情况选择合适的JindoOSS Credential Provider。配置JindoOSS Credential Provider 进入SmartData服务。登录 阿里...

作业上线问题

130)at org.apache.hadoop.io.retry.RetryInvocationHandler$Call.invokeOnce(RetryInvocationHandler.java:107)at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:359)at com.sun.proxy.$Proxy...

附加/分离分区

在这种模式下,内部使用两个事务:在第一个事务期间,对父和分区都采用 SHARE UPDATE EXCLUSIVE ,并将分区标记为正在进行分离;此时,事务已提交,并且使用分区的所有其他事务都将等待。所有这些事务完成后,第二个事务将获取分区...

附加/分离分区

在这种模式下,内部使用两个事务:在第一个事务期间,对父和分区都采用 SHARE UPDATE EXCLUSIVE ,并将分区标记为正在进行分离;此时,事务已提交,并且使用分区的所有其他事务都将等待。所有这些事务完成后,第二个事务将获取分区...

附加/分离分区

在这种模式下,内部使用两个事务:在第一个事务期间,对父和分区都采用 SHARE UPDATE EXCLUSIVE ,并将分区标记为正在进行分离;此时,事务已提交,并且使用分区的所有其他事务都将等待。所有这些事务完成后,第二个事务将获取分区...

DML操作常见问题

如果同时多个作业写入,该元数据总是处于加写入的状态,可能出现部分作业在尝试加超时之前一直没有抢到,从而导致报错 cannot acquire exclusive lock(作业尝试加超时时间大约半分钟,超过则报错,加粒度为级)。...

HDFS常见命令介绍

您可以在已经创建好的E-MapReduce(简称EMR)集群中,直接使用hadoop fs命令来对HDFS中的文件进行操作。本文为您介绍HDFS的常见命令。背景信息 HDFS常见命令如下所示。命令 功能 mkdir 在HDFS文件系统中创建目录。touchz 在HDFS文件系统...

监控大盘

table_lock_escalations_per_sec 上的升级到TABLE或HoBT粒度的次数。average_lock_wait_time 请求资源的平均等待时间。total_latch_wait_time 在最后一秒内的总等待时间。说明 监控指标含义也可以在控制台的监控大盘中单击每个指标...

迁移开源HDFS的数据到文件存储 HDFS 版

说明 使用 hadoop distcp 命令将原集群数据迁移至 文件存储 HDFS 版 时,请注意 文件存储 HDFS 版 不支持以下参数,其它参数使用Hadoop DistCp工具官方说明文档 一致。文件存储 HDFS 版 及命令行存在限制的更多信息,请参见 使用限制。...

EMR集群JindoSDK升级流程(旧版控制台)

rw-r-1 hadoop hadoop xxxx May 01 00:00 bootstrap_jindosdk.sh-rw-r-1 hadoop hadoop xxxxxxxxx May 01 00:00 jindosdk-4.6.2.tar.gz-rw-r-1 hadoop hadoop xxxx May 01 00:00 jindosdk-patches.tar.gz 执行以下命令,制作升级包。...

HBase

使用Databricks 读写云数据库HBase数据 通过Spark建读取云数据库HBase数据%sql-使用org.apache.hadoop.hbase.spark创建spark CREATE DATABASE IF NOT EXISTS test_hbase;USE test_hbase;DROP TABLE IF EXISTS spark_on_hbase;CREATE ...

什么是EMR on ECS

与自建Hadoop集群对比 开源大数据开发平台EMR与自建Hadoop集群的优势对比如下所示。对比项 阿里云EMR 自建Hadoop集群 成本 支持按量和包年包月付费方式,集群资源支持灵活调整,数据分层存储,资源使用率高。无额外软件License费用。需...

使用Prometheus监控E-MapReduce

本文介绍如何使用Prometheus监控E-MapReduce(简称EMR)。前提条件 创建EMR集群,具体操作,请参见 创建集群。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。步骤一:开启Exporter端口 创建完EMR集群后,系统会默认在ECS...
共有73条 < 1 2 3 4 ... 73 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
开源大数据平台 E-MapReduce 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储
新人特惠 爆款特惠 最新活动 免费试用