[帮助文档] 如何使用E-MapReduce上的Hive关联阿里云HBase的表

阿里云HBase需要借助外部Hive对多表进行关联分析,本文介绍如何使用E-MapReduce(简称EMR)上的Hive关联阿里云HBase的表。

[帮助文档] 使用Hive扩展功能记录数据血缘

E-MapReduce集群默认在Hive服务上集成了EMR-HOOK。EMR-HOOK可以收集作业的SQL信息,例如数据血缘、访问频次等。通过EMR-HOOK,您可以利用数据湖构建(DLF)的数据概况,以统计表和分区的访问次数。同时,您也可以使用DataWorks来管理数据血缘。本文将为您介绍如何配...

大数据Hive教程精讲

25 课时 |
799 人已学 |
免费
开发者课程背景图

[帮助文档] 如何使用AnalyticDB MySQL湖仓版(3.0)Spark访问Hive数据_云原生数据仓库AnalyticDB MySQL版(AnalyticDB for MySQL)

AnalyticDB MySQL湖仓版(3.0)支持访问Hive数据源。本文以E-MapReduce集群的Hive服务为例,介绍使访问Hive数据的方法。

[帮助文档] 如何使用加密文件访问RDS

EMR Hive服务默认使用明文保存密码来访问本地MySQL或RDS MySQL,但也可以使用加密文件来访问这些数据库。本文为您介绍如何使用加密文件访问RDS MySQL。

[帮助文档] EMRHive作业如何处理TableStore中的数据

本文通过示例为您介绍EMR Hive作业如何处理TableStore中的数据。

pyspark访问hive数据实战

数据分析都是直接使用hive脚本进行调用,随着APP用户行为和日志数据量的逐渐累积,跑每天的脚本运行需要花的时间越来越长,虽然进行了sql优化,但是上spark已经提上日程。 直接进行spark开发需要去学习scala,为了降低数据分析师的学习成本,决定前期先试用sparkSQL,能够让计算引擎无缝...

在E-MapReduce中使用pyspark访问hive数据时报错

报错信息如下:“o'rg.datanucleus.store.rdsms.connectionpool.DatastoreDriverNotFoundException: The specified datastore driver ("com.mysql.jdbc.Driver") was not...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
Comparison of Spark SQL with Hive
Hive Bucketing in Apache Spark
spark替代HIVE实现ETL作业
立即下载 立即下载 立即下载