EMR Workbench

阿里云EMR Workbench是一个综合性的大数据分析和开发环境,作为阿里云E-MapReduce的一部分,它提供了EMR Notebook和EMR Workflow两个核心功能。通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作...

产品简介

DLA Ganos是基于云原生数据分析(Data Lake Analytics,DLA)系统设计开发面向时空大数据存储与计算的数据引擎产品。基于DLA无服务器化(Serverless)数据分析服务与内置的Spark计算引擎,DLA Ganos打通了阿里云各个存储系统,如...

PolarDB HTAP实时数据分析技术解密

MySQL生态HTAP数据库解决方案 MySQL是一款主要面向OLTP场景设计的开源数据库。开源社区的研发方向侧重于加强其事务处理的能力,例如:提升单核性能、多核扩展性能、增强集群能力以提升可用性等。在处理大数据量下复杂查询所需要的能力方面...

东软案例

目前,东软在物联网、互联网等新场景下面临的IT系统运维主要问题与挑战有:多模型数据融合分析困难,面向海量数据采集终端同时写入数据的并发能力弱,数据且价值密度低导致存储成本高,基于开源软件自建数据存储集群稳定性低运维成本...

列存索引技术架构介绍

随着MySQL发展为世界上最为流行的开源数据系统,用户在其中存储了大量的数据,并且运行着关键的业务逻辑,对这些数据进行实时分析成为一个日益增长的需求。当单机MySQL不能满足需求时,用户寻求一个更好的解决方案。如 MySQL+专用AP数据...

新功能发布记录

2022-08-05 使用EMR-CLI自定义部署Gateway环境 2022年7月 功能名称 功能概述 发布时间 相关文档 EMR Doctor E-MapReduce Doctor(简称EMR Doctor)是E-MapReduce产品自研的面向开源大数据集群的智能运维诊断系统。2022-07-25 EMR Doctor...

JindoFS介绍和使用

JindoFS是基于阿里云对象存储OSS,为开源大数据生态构建的Hadoop兼容文件系统(Hadoop Compatible File System,HCFS)。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS...

创建集群

通过阿里云E-MapReduce(简称EMR),您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行规模数据处理和分析等操作。本文为您介绍在EMR on ECS上创建集群的操作步骤和相关配置,帮助您快速搭建和管理大数据集群。...

产品优势

类别 云数据库HBase增强版(Lindorm)HBase开源版 核心功能 HBase API 支持 支持 数据模型 支持宽列(HBase API)、表格(SQL-Like API)、队列等多种,对其他模型感兴趣的话,请联系我们。仅支持宽列 全局二级索引 内置,查询透明、高性能...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

引擎简介

LindormDFS支撑,充分利用了对象存储的低成本与高可靠、块存储的高性能等优势,并通过高低速分层存储、副本共享去重、智能冷热转存等技术,面向用户提供弹性低成本、100%HDFS协议兼容的云原生大数据存储能力,可使用开源HDFS客户端直接访问...

概述

Alluxio是一个面向基于云的数据分析和人工智能的开源数据编排技术。Alluxio为数据驱动型应用和存储系统构建了桥梁,将数据从存储层移动到距离数据驱动型应用更近的位置,从而能够更容易被访问,同时使得应用程序能够通过一个公共接口连接...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

简介

系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等,结合云数据库HBase强大的分布式存储能力以及Spark分析平台能力,广泛应用于空间、时空、遥感大数据存储、查询、分析数据挖掘...

数据分析整体趋势

技术发展趋势 商业数据库起步于二十世纪八十年代,主要代表为Oracle,SQL Server,DB2等结构化数据在线处理的关系型数据库,而以MySQL,PostgreSQL为代表的开源关系型数据库也在二十世纪九十年代得到了发展。近些年来,随着业务数据量的...

图扑案例

Lindorm 针对工业物联网数据高并发写入,实时存取等特点,创新性地融合时序、索引、宽表等多模引擎能力,为存储、分析低价值密度、高通量、高实时性的工业物联网监控数据提供了高性价比的最优解决方案,幅度降低了数据存储和存储系统运维...

什么是EMR Serverless Milvus

它包含了数据分区分片、持久化、增量摄取、混合查询等高级功能,同时支持time travel操作,提供了直观的API和多语言SDK,适用于推荐系统、图像检索、视频分析、自然语言处理等多个AI领域。产品优势 云原生极速向量检索服务 集成了Vector...

应用场景

适用场景 OLAP多维分析 用户行为分析 用户画像、标签分析、圈人 高维业务指标报表 自助式报表平台 业务问题探查分析 跨主题业务分析 财务报表 系统监控分析 实时数仓 电商大促数据分析 教育行业的直播质量分析 物流行业的运单分析 金融行业...

E-MapReduce弹性低成本离线大数据分析

大数据是一项涉及不同业务和技术领域的技术和工具的集合,海量离线数据分析可以应用于多种商业系统环境,例如,电商海量日志分析、用户行为画像分析、科研行业的海量离线计算分析任务等场景。离线大数据分析概述 主流的三分布式计算框架...

EMR Doctor概述

E-MapReduce Doctor(简称EMR Doctor)是E-MapReduce产品自研的面向开源大数据集群的智能运维诊断系统。通过EMR Doctor(即集群管理页面的“健康检查”功能)可以全局了解集群的健康状况和动态走势,为运维决策和资源优化提供有力的信息...

计算设置概述

设置Dataphin实例的计算引擎为MaxCompute AnalyticDB for PostgreSQL 专注于OLAP领域的分析数据库,是云端托管的PB级高并发实时数据仓库,具备海量数据计算无缝伸缩能力 设置Dataphin实例的计算引擎AnalyticDB for PostgreSQL E-...

产品架构

宽表引擎 LindormTable 是面向海量半结构化、结构化数据设计的分布式NoSQL系统,适用于元数据、订单、账单、画像、社交、feed流、日志等场景,兼容HBase、Cassandra等开源标准接口。其基于数据自动分区+分区多副本+LSM的架构思想,具备全局...

OSS/OSS-HDFS概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括 JindoFS 存储系统(原JindoFS Block模式)...

基于Delta lake的一站式数据湖构建与分析实战

数据湖计算与分析 相比于数据仓库,数据湖以更开放的方式对接多种不同的计算引擎,如传统开源大数据计算引擎Hive、Spark、Presto、Flink等,同时也支持云厂商自研的大数据引擎,如阿里云MaxCompute、Hologres等。在数据湖存储与计算引擎...

产品简介

EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云其他的云数据存储系统和数据库系统(例如,阿里云OSS和RDS等)进行数据传输。产品介绍 阿里云EMR...

客户案例

MaxCompute已被广泛应用于各领域处理云上大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...

产品概述

EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云其他的云数据存储系统和数据库系统(例如,阿里云OSS和RDS等)进行数据传输。阿里云EMR提供了on ...

什么是云原生多模数据库Lindorm

本文介绍 云原生多模数据库 Lindorm 的...流引擎 云原生多模数据库 Lindorm 流引擎是 面向流式数据处理 的引擎,提供了流式数据的存储和轻计算功能,帮助您轻松实现流式数据存储至 云原生多模数据库 Lindorm,构建基于流式数据的处理和应用。

Tair扩展数据结构概览

数据库 Redis 版 与开源Redis相同,支持String、List、Hash、Set、Sorted Set、Stream等数据类型,能够满足部分场景下的开发需求,但无法直接满足一些复杂场景的业务需求,需要通过开发大量代码、使用Lua脚本等复杂的方式实现。...

StarRocks概述

具体的业务场景如下所示:OLAP多维分析 用户行为分析 用户画像、标签分析、圈人 高维业务指标报表 自助式报表平台 业务问题探查分析 跨主题业务分析 财务报表 系统监控分析 实时数仓 电商大促数据分析 教育行业的直播质量分析 物流行业的...

应用场景

提高看数据的效率 与内部系统集成,可结合进行数据分析,极提高看数据的效率。统一系统入口 解决员工使用多系统的麻烦,利于使用与控制。推荐搭配使用 RDS+Quick BI 交易数据权限管控 数据对某支付平台的每个城市经理来说都至关重要...

概述

Flink(VVR)完全兼容开源Flink,相关内容请参见如下文档:DataStream API Table API&SQL Python API 使用场景 Flink广泛应用于大数据实时化的场景,本文从技术领域和企业应用场景进行介绍。技术领域 从技术领域的角度,Flink主要用于以下...

选型配置说明

Flink、Kafka、YARN OLAP 数据分析场景,其中核心组件ClickHouse是一个面向联机分析处理(OLAP)的开源的面向列式存储的DBMS,与Hadoop和Spark相比,ClickHouse更轻量级。ClickHouse支持线性扩展,简单方便,具有高可靠性和高容错。...

产品优势

支持snappy/LZ4/LZO,压缩率不高 支持snappy/LZ4,压缩率不高 编码 面向数据类型的自适应编码,压缩率高,并且无需解码,即可快速查找。支持DIFF,压缩效果一般,并且编码后的数据无法检索 无 冷热分离 冷热数据自动分层,其中冷数据使用高...

什么是MaxCompute

MaxCompute是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效...

客户案例

DataWorks在多个行业中均有典型的案例落地,帮助多个行业的企业解决数据痛点,挖掘数据价值,本文为您介绍典型行业中已落地的客户案例。新零售行业:大润发云上数据中台建设 客户架构如下。客户简介 为了快速数字化转型,拥抱新零售,...

应用场景

Lindorm是阿里云自研的云原生多模型数据库,面向海量多模型数据的低成本存储分析,构建万物互联时代的数据底座。Lindorm支持宽表模型、时序模型,提供自研的宽表引擎、时序引擎和搜索引擎,兼容HBase、Phoenix、OpenTSDB、Solr等多种开源...

Tair命令概览

Cpc 无 TairCpc是基于CPC(Compressed Probability Counting)压缩算法开发的数据结构,支持仅占用很小的内存空间对采样数据进行高性能计算,支持滚动窗口和滑动窗口,可以更好地支持流式运算,支持大数据分析中常用的聚合算子,如:...

基本概念

系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法等,结合 云原生多模数据库 Lindorm 宽表引擎强大的分布式存储能力以及DAL Spark分析平台,可以广泛应用于空间或时空存储、查询、分析数据挖掘场景...

引擎类型

云原生多模数据库 Lindorm 内含宽表引擎、时序引擎、搜索引擎、文件引擎、计算引擎和流引擎,兼容HBase/Cassandra/S3、OpenTSDB、Solr、HDFS、Kafka等多种开源标准接口,同时提供SQL查询、时序处理、文本检索分析等能力。为应对动态变化的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用