数据湖平台-阿里云

流数据湖平台Apache Paimon（六）集成Spark之DML插入数据

4.4. 插入数据INSERT 语句向表中插入新行。插入的行可以由值表达式或查询结果指定，跟标准的sql语法一致。INSERT INTO table_identifier [ part_spec ] [ column_list ] { value_expr | query }part_spec可选，...

大数据知识图谱系列—如何选择合适的OLAP引擎进行数据湖分析

4 课时 |

110 人已学 |

加入学习

流数据湖平台Apache Paimon（五）集成 Spark 引擎

第4章集成 Spark 引擎4.1 环境准备Paimon 目前支持 Spark 3.4、3.3、3.2 和 3.1。课程使用的Spark版本是3.3.1。1）上传并解压Spark安装包tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/module/mv /...

流数据湖平台Apache Paimon（四）集成 Hive 引擎

第3章集成 Hive 引擎前面与Flink集成时，通过使用 paimon Hive Catalog，可以从 Flink 创建、删除、查询和插入到 paimon 表中。这些操作直接影响相应的Hive元存储。以这种方式创建的表也可以直接从 Hive 访问。更进一步的与 Hive 集成，可以使用 Hiv...

流数据湖平台Apache Paimon（三）Flink进阶使用

2.9 进阶使用2.9.1 写入性能Paimon的写入性能与检查点密切相关，因此需要更大的写入吞吐量：增加检查点间隔，或者仅使用批处理模式。增加写入缓冲区大小。启用写缓冲区溢出。如果您使用固定存储桶模式，请重新调整存储桶数量。2.9.1.1 并行度建议sink的并行度小于等于bucket的数量，最好...

流数据湖平台Apache Paimon（二）集成 Flink 引擎

第2章集成 Flink 引擎Paimon目前支持Flink 1.17, 1.16, 1.15 和 1.14。本课程使用Flink 1.17.0。2.1 环境准备环境准备2.1.1 安装 Flink1）上传并解压Flink安装包tar -zxvf flink-1.17.0-bin-scala_2.1...

流数据湖平台Apache Paimon（一）概述

第1章概述1.1 简介Flink 社区希望能够将 Flink 的 Streaming 实时计算能力和 Lakehouse 新架构优势进一步结合，推出新一代的 Streaming Lakehouse 技术，促进数据在数据湖上真正实时流动起来，并为用户提供实时离线一体化的开发体验。Flink 社区内部...

袋鼠云数据湖平台「DataLake」，存储全量数据，打造数字底座

一、什么是数据湖？在探讨数据湖技术或如何构建数据湖之前，我们需要先明确，什么是数据湖？数据湖的起源，应该追溯到 2010 年 10 月。基于对半结构化、非结构化存储的需求，同时为了推广自家的 Pentaho 产品以及 Hadoop，2010 年 Pentaho 的创始人兼 CTO James Dix...

基于Apache Hudi在Google云构建数据湖平台

自从计算机出现以来，我们一直在尝试寻找计算机存储一些信息的方法，存储在计算机上的信息（也称为数据）有多种形式，数据变得如此重要，以至于信息现在已成为触手可及的商品。多年来数据以多种方式存储在计算机中，包括数据库、blob存储和其他方法，为了进行有效的业务分析，必须对现代应...

共有16条

< 1 2 >

跳转至： GO

更新时间 2024-03-17 10:45:40

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"optioninfo":{"dynamic":"ture","static":"true"},"simplifiedDisplay":"newEdition","newCard":[{"ifIcon":"img","link":"https://img.alicdn.com/tfs/TB1XY8hGYr1gK0jSZFDXXb9yVXa-1740-328.png","icon":"数据湖构建","iconImg":"https://img.alicdn.com/tfs/TB1aU0U1oT1gK0jSZFrXXcNCXXa-200-200.png","contentLink":"https://www.aliyun.com/product/bigdata/dlf","title":"数据湖构建","des":"数据湖构建服务作为云原生数据湖架构核心组成部分，帮助用户简单快速地构建云原生数据湖解决方案。数据湖构建提供湖上元数据统一管理、企业级权限控制，并无缝对接多种计算引擎，打破数据孤岛，洞察业务价值。","link1":"https://common-buy.aliyun.com/?commodityCode=dlf_post_public_cn#/buy","btn1":"免费试用","link2":"https://dlf.console.aliyun.com/","btn2":"管理控制台","btn3":"","link3":"","infoGroup":[{"infoName":"产品文档","infoContent":{"firstContentLink":"https://help.aliyun.com/document_detail/183492.html","firstContentName":"产品简介","lastContentLink":"https://help.aliyun.com/document_detail/183498.html","lastContentName":"用户指南"}},{"infoName":"相关推荐","infoContent":{"firstContentName":"对象存储 OSS","firstContentLink":"https://www.aliyun.com/product/oss","lastContentName":"大数据计算","lastContentLink":"https://www.aliyun.com/product/emapreduce"}}]}],"card":[],"search":[],"infoCard":[],"title":{"mainTitle":"数据湖构建","subtitle":"数据湖是一个集中式存储库，可存储任意规模结构化和非结构化数据，支持大数据和AI计算。数据湖构建服务（Data Lake Formation，DLF）作为云原生数据湖架构核心组成部分，帮助用户简单快速地构建云原生数据湖解决方案。数据湖构建提供湖上元数据统一管理、企业级权限控制，并无缝对接多种计算引擎，打破数据孤岛，洞察业务价值。","linkUrl":"https://www.aliyun.com/product/mobilepaas/mpaas-miniprogram","btnText":""},"visual":{"topbg":"https://img.alicdn.com/tfs/TB1bQuBIYH1gK0jSZFwXXc7aXXa-3840-740.gif","icon":"","textColor":"dark"},"dataList":[{"summary":"啦啦啦","author":"wuwu","linksUrl":"#"}],"sceneCard":[],"txt":[]}

{"$env":{"JSON":{}},"$page":{"env":"production"},"$context":{"optioninfo":{"dynamic":"ture","static":"true"},"simplifiedDisplay":"newEdition","newCard":[{"ifIcon":"img","link":"https://img.alicdn.com/tfs/TB1XY8hGYr1gK0jSZFDXXb9yVXa-1740-328.png","icon":"数据湖构建","iconImg":"https://img.alicdn.com/tfs/TB1aU0U1oT1gK0jSZFrXXcNCXXa-200-200.png","contentLink":"https://www.aliyun.com/product/bigdata/dlf","title":"数据湖构建","des":"数据湖构建服务作为云原生数据湖架构核心组成部分，帮助用户简单快速地构建云原生数据湖解决方案。数据湖构建提供湖上元数据统一管理、企业级权限控制，并无缝对接多种计算引擎，打破数据孤岛，洞察业务价值。","link1":"https://common-buy.aliyun.com/?commodityCode=dlf_post_public_cn#/buy","btn1":"免费试用","link2":"https://dlf.console.aliyun.com/","btn2":"管理控制台","btn3":"","link3":"","infoGroup":[{"infoName":"产品文档","infoContent":{"firstContentLink":"https://help.aliyun.com/document_detail/183492.html","firstContentName":"产品简介","lastContentLink":"https://help.aliyun.com/document_detail/183498.html","lastContentName":"用户指南"}},{"infoName":"相关推荐","infoContent":{"firstContentName":"对象存储 OSS","firstContentLink":"https://www.aliyun.com/product/oss","lastContentName":"大数据计算","lastContentLink":"https://www.aliyun.com/product/emapreduce"}}]}],"card":[],"search":[],"infoCard":[],"title":{"mainTitle":"数据湖构建","subtitle":"数据湖是一个集中式存储库，可存储任意规模结构化和非结构化数据，支持大数据和AI计算。数据湖构建服务（Data Lake Formation，DLF）作为云原生数据湖架构核心组成部分，帮助用户简单快速地构建云原生数据湖解决方案。数据湖构建提供湖上元数据统一管理、企业级权限控制，并无缝对接多种计算引擎，打破数据孤岛，洞察业务价值。","linkUrl":"https://www.aliyun.com/product/mobilepaas/mpaas-miniprogram","btnText":""},"visual":{"topbg":"https://img.alicdn.com/tfs/TB1bQuBIYH1gK0jSZFwXXc7aXXa-3840-740.gif","icon":"","textColor":"dark"},"dataList":[{"summary":"啦啦啦","author":"wuwu","linksUrl":"#"}],"sceneCard":[],"txt":[]}}