开源项目

本文介绍阿里云容器服务Kubernetes版主要使用开源项目。项目分类 项目名称 项目简介 项目地址 参考文档 核心组件 Kubernetes Cloud Controller Manager for Alibaba Cloud 为Kubernetes应用创建负载均衡,管理节点路由条目。Cloud-...

AI开源项目

阿里云开源的AI及大数据相关开源项目,如用于全自动分布式深度学习系统TePDist、NLP 开发和应用工具包EasyNLP等,您可以根据需要选择AI及大数据开源项目。PAI相关的开源项目信息请前往 阿里云大数据&AI开源项目

TSDB开源生态概述

时间序列数据库TSDB以其强大的功能和兼容性,对于当前的一些开源解决方案实现了较好的适配。以下是TSDB与一些开源组件或开源项目对接的方法。Grafana如何对接TSDB Quick BI如何接入TSDB

合作伙伴及开源生态

(数据统计截止时间为 2021 月 7 月 22 日)SOFAStack 目前涵盖的开源项目有:主要项目:基于 Spring Boot 的研发框架 SOFABoot、生产级 Java RPC 框架 SOFARPC、分布式链路跟踪系统 SOFATracer、高可用服务注册中心 SOFARegistry。...

创新、资质和荣誉

技术奖项 2019 年,荣获 OSCAR 尖峰开源技术创新奖(自主研发)2019 年,开源中国 GVP:SOFATracer 2019 年,码云 2019 年度 GVP 2019 年,中国开源云联盟中国优秀开源项目:二等奖 2019 年,SegmentFault 思否 2019 中国技术品牌影响力...

相关的云服务

本文为您介绍典型场景下,使用开源大数据平台E-MapReduce时通常会使用到的其他云服务。云服务名称 说明 云服务器ECS 使用云服务器ECS(Elastic Compute Service)作为集群的节点,每个ECS实例集群中的一个节点。专有网络VPC 专有网络VPC...

使用OpenAPI

本文为您介绍使用开源大数据平台E-MapReduce OpenAPI的基本信息。关于使用阿里云OpenAPI的详细介绍,请参见 使用OpenAPI。基本信息 版本说明 版本号 说明 2021-03-20 推荐使用。接入点说明 根据实例所在的地域,选择对应的服务接入点地址,...

通过客户端方式连接StarRocks实例

使用开源MySQL客户端连接StarRocks 步骤一:下载MySQL客户端并安装数据库 下载 MySQL客户端。执行以下命令,解压缩安装包。tar-zxvf mysql-5.6.40-linux-glibc2.12-i686.tar.gz 执行以下命令,复制解压后的mysql目录到系统的本地软件目录。...

使用独立的Trino集群

背景信息 在使用开源大数据平台E-MapReduce控制台时,您可以在创建DataLake集群、自定义集群或Hadoop集群时选择Trino服务,或者创建独立的Trino集群使用Trino服务。Trino集群具备以下特点:Trino独享集群资源,受其他组件干扰少。支持弹性...

产品优势

HBase Shell 黑屏工具 数据查询 集群管理系统内支持图形化SQL交互查询,请参见 数据查询,也支持使用开源工具HBase Shell/CQLsh。HBase Shell CQLsh 生态体系 数据搬迁 支持与HBase/Cassandra各个版本之间的在线、跨版本、自动化、高效搬迁...

通过OSS SDK接入开源生态

使用Flink访问OSS 将HBase快照保存在OSS 将Kafka数据导入OSS 此系列文档由面向开源项目的托管平台GitHub提供。使用Logstash将日志导入OSS 使用Fluentd访问OSS 使用Thanos访问OSS 此文档由开源Thanos社区提供。将Elasticsearch的快照备份至...

参数说明

EMR Workflow支持配置内置时间参数、任务级别参数(本地参数)、工作流级别参数(全局参数)和项目级别参数,同时还支持参数传递功能。参数配置 内置时间参数 参数定义 内置时间参数无需定义,可以直接在任务中使用。参数使用 EMR Workflow...

项目管理

配置项 描述 提交作业默认用户 设置项目使用所选集群提交作业时的默认用户,默认值是hadoop,默认用户只能有一个。提交作业默认队列 设置项目使用所选集群提交作业时的默认队列,默认作业提交到default队列。提交作业用户白名单 设置可以...

数据上云工具

MaxCompute平台支持丰富的数据上传和下载工具(其中大部分工具已经在GitHub公开源代码,以开源社区的方式进行维护)。您可以根据实际应用场景,选择合适的工具进行数据的上传和下载。阿里云数加产品 MaxCompute客户端(Tunnel通道系列)...

安装HBase Java SDK

使用开源HBase客户端连接并使用Lindorm宽表引擎需要注意以下问题:开源HBase客户端不支持通过公网访问Lindorm宽表引擎。当前不支持通过开源HBase客户端访问多可用区实例。由于存在协议转换,使用开源HBase客户端直接访问Lindorm宽表引擎...

概述

开源应用的调试过程中需要使用开源UI,MaxCompute Spark提供原生的开源实时UI和查询历史日志的功能。其中,对于部分开源应用还支持交互式体验,在后台引擎运行后即可进行实时交互。系统结构 MaxCompute Spark是阿里云通过Spark on ...

EMR Studio概述

EMR Studio核心优势 优势 描述 兼容开源 EMR Studio提供深度优化的开源组件使用体验,100%兼容开源大数据生态。您无需修改任务代码,即可平滑迁移上云。通过EMR Studio数据开发工作台,您可以在开源组件原生UI的基础上无缝衔接开发环节和...

添加开源Elastic Search数据源

本文介绍在DataV中添加并使用开源Elastic Search数据源的方法。前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 DataV控制台。在 我的数据 页签中选择 数据源管理,单击 添加数据。从 类型 列表中...

添加开源Elastic Search数据源

本文介绍在DataV中添加并使用开源Elastic Search数据源的方法。前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 DataV控制台。在 工作台 页面,单击 数据准备>数据源,进入 数据源 页面,单击 新建...

初始化

环境准备 在Eclipse项目使用阿里云E-MapReduce OpenAPI Java SDK。请确保代码运行环境设置了环境变量ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET。具体配置方法,请参见 配置方案。创建一个Maven工程,添加Maven依赖...

示例项目使用说明

集群运行 开源项目运行示例如下:Spark SparkWordCount:spark-submit-class SparkWordCount examples-1.0-SNAPSHOT-shaded.jar<inputPath><outputPath>参数说明如下:参数 描述 inputPath 输入数据路径。outputPath 输出路径。...

如何解决MSE Nacos开源控制台无法使用问题

说明 不建议使用开源控制台,请使用MSE控制台,MSE控制台功能丰富且更安全。解决方案 确认是否已经打开鉴权功能。具体操作,请参见 Nacos Client访问鉴权。若已开启鉴权功能,请使用MSE控制台对Nacos进行操作。若未开启鉴权功能,请确认...

创建项目

项目中您可以进行任务的编辑和工作流的调度。文为您介绍如何在EMR Workflow上创建项目。前提条件 已创建工作空间,详情请使用 管理工作空间。操作步骤 进入项目管理页面。使用阿里云账号(主账号)或RAM用户登录 E-MapReduce控制台。在...

开源对比

本文从稳定性、内核能力、治理能力以及使用习惯等方面,对比阿里云 云消息队列 Kafka 版 与开源Apache Kafka。稳定性 项目 云消息队列 Kafka 版 Apache Kafka 磁盘水位 磁盘写满删除旧数据。磁盘写满直接宕机。线程池隔离 读冷数据仍可以...

开源RabbitMQ迁移上云

使用开源RabbitMQ集群时,当您希望能够解决各种稳定性痛点(例如消息堆积、脑裂等问题)、实现高并发、分布式、灵活扩缩容时,您可以将开源RabbitMQ集群迁移至 云消息队列 RabbitMQ 版,本文介绍迁移上云的前提条件、操作步骤、注意事项...

Flink(VVR)作业配置

EMR-3.27.x及之前版本使用Flink社区开源版本,EMR-3.27.x之后版本使用完全兼容开源Flink的企业版(VVR)。本文介绍如何配置Flink(VVR)类型的作业。背景信息 Flink企业版由Apache Flink创始团队官方出品,拥有全球统一商业化品牌。VVR提供...

EMR Hive功能增强

EMR版本 组件版本 功能增强 EMR-5.2.1 Hive 3.1.2 修复使用DLF元数据执行 show create table 命令,结果显示不正确的问题。优化Hive默认参数,以提升作业性能。修改E-MapReduce控制台上,Hive服务 配置 页面的 hive-env 页签的配置项名称为...

Iceberg概述

类别 项目项目 开源Iceberg Iceberg商业版(阿里云)基础功能 ACID 无√历史版本回溯 无√Source和Sink集成 Batch√Streaming√高效数据过滤 无√数据变更 Schema Evolution 无√Partition Evolution 无√CopyOnWrite更新 无√...

Hadoop集群迁移至DataLake集群

背景信息 E-MapReduce(简称EMR)新版控制台是EMR发布的下一代云原生开源大数据平台,为用户提供全新平台体验、全新开发平台、全新资源形态和全新分析场景。新版控制台的功能特点,详情请参见 EMR新版控制台上线公告。EMR on ECS作为EMR...

开源对比

云消息队列 RabbitMQ 版 是一款基于高可用分布式存储架构实现的AMQP 0-9-1协议的消息产品,能够兼容开源RabbitMQ客户端,与开源RabbitMQ相比,能够解决各种稳定性痛点(例如消息堆积、脑裂等问题),同时具备高并发、分布式、灵活扩缩容等...

EMR数据开发停止更新公告

2022年2月21日21点起,E-MapReduce(简称EMR)数据开发功能停止更新,进入维护状态,会影响创建项目、新建和运行作业、工作流、数据开发运维等功能。如果您还在使用数据开发功能,请尽快迁移到DataWorks构建数据开发平台。本文为您介绍数据...

Kerberos概述

在这种高安全级别的集群中,所有开源组件均采用Kerberos安全模式启动,确保只有经过Kerberos认证的客户端能够访问集群提供的服务(例如HDFS)。背景信息 集群开启Kerberos之后:客户端:可以对可信任的客户端提供认证,使得可信任客户端...

Sqoop作业配置

使用限制 EMR-1.3.0及后续版本支持Sqoop作业类型。在低版本集群上运行Sqoop作业会失败,errlog会报不支持的错误。参数详情请参见 Sqoop。操作步骤 进入数据开发的项目列表页面。通过阿里云账号登录 阿里云E-MapReduce控制台。在顶部菜单栏...

开源支持

本文将为您介绍MaxCompute相关的开源功能。SDK MaxCompute提供Java SDK和Python SDK接口实现创建、查看、删除MaxCompute表等操作。通过SDK,您可以通过编辑代码灵活地操作MaxCompute。MaxCompute提供的SDK如下:Java SDK Java SDK使用说明...

EMR Spark功能增强

阿里云E-MapReduce产品构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,做了大量优化。本文为您介绍E-MapReduce(简称EMR)Spark相对开源增强的功能。背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,...

EMR数据开发(旧版)停止全面支持公告

停止全面支持时间 2023年9月30日0点 影响 您在停止全面支持时间点前创建的数据开发(旧版)项目不会受到影响,可正常使用EMR数据开发(旧版)模块,包括运行作业和工作流调度,但阿里云不再提供EMR数据开发(旧版)的用户答疑、问题解决和...

Delta Lake概述

如果您存在以下场景,可以使用Delta:实时查询:数据实时从上游流入Delta,查询侧即可查询该数据,例如,在CDC场景下,Spark Streaming实时消费binlog时,使用Delta merge功能,实时将上游的数据通过merge更新到Delta Lake,然后可以使用...

Hive作业配置

E-MapReduce默认提供了Hive环境,您可以直接使用Hive来创建和操作创建的表和数据。前提条件 已创建好项目,详情请参见 项目管理。已准备好Hive SQL的脚本,并上传到OSS的某个目录中(例如 oss:/path/to/uservisits_aggre_hdfs.hive)。...

三方开源大语言模型

本文主要介绍阿里云百炼平台引入上架的三方开源大语言模型基本信息,计费情况等调用必备基础信息。基本信息 重要 三方开源大模型API调用需申请后开通体验,请点击“立即申请”,申请通过后才能调用。模型服务 模型名称 模型描述 特征 Llama...

快速使用EMR Workflow

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。本文以...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
开源大数据平台 E-MapReduce 云数据库 RDS 检索分析服务 Elasticsearch版 微服务引擎 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用