功能简介

利用智能算法能力自动生成洞察报告,极降低业务人员分析数据的门槛。智能化深度诊断和建议:快速分析波动原因,提高业务优化决策效率。可针对用户在全平台中指定的波动指标,分钟级诊断深度原因和关联因素。数据集 对连接的数据集统一...

2023年

本文为您介绍公开数据集信息,并指导您如何通过MaxComputeSQL分析连接查询并分析数据。公开数据集概述 2023-08-01 新增作业运行常见问题 新说明 本文为您介绍MaxCompute作业运行过程中的常见问题。作业运行常见问题 2023-08-01 新增Github...

Spark集成分析

用户可以通过DLA Ganos实现Spark加载HBase中的...在GeometryRDD基础上,DLA Ganos基于SparkSQL设计了一系列用于空间数据表达的UDT与UDF或UDAF,允许用户使用类似SQL结构化查询语言进行数据的查询与分析。详细内容请参考:数据湖时空引擎Ganos

Spark集成分析

用户可以通过DLA Ganos实现Spark加载HBase中的...在GeometryRDD基础上,DLA Ganos基于SparkSQL设计了一系列用于空间数据表达的UDT与UDF或UDAF,允许用户使用类似SQL结构化查询语言进行数据的查询与分析。详细内容请参考:数据湖时空引擎Ganos

Napatech案例

Lindorm支持海量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松各类大数据平台集成,完成数据规模离线分析。基于Lindorm的解决方案,用户在采用到100Gbps+流量产生的大量数据包元数据直接通过...

低成本历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过App写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

低成本RDS历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过App写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

应用场景:低成本历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过APP写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

分析数据

DataWorks的电子表格为您提供丰富、便捷的数据分析操作,其操作Office Excel高度一致,大大降低您的学习成本。前提条件 已创建并导入数据至电子表格。详情请参见 创建电子表格 和 导入数据至电子表格。背景信息 您可以在电子表格的编辑...

选型配置说明

广泛用于日志收集和监控数据聚合等场景,支持离线或流式数据处理以及实时数据分析等。Flink、Kafka、YARN OLAP 数据分析场景,其中核心组件ClickHouse是一个面向联机分析处理(OLAP)的开源的面向列式存储的DBMS,Hadoop和Spark相比,...

常见术语

数据湖分析 数据湖分析就是针对数据湖数据分析的方案。云原生数据湖分析(简称DLA)是新一代数据解决方案,采取计算存储完全分离的架构,支持数据库(RDS\PolarDB)消息实时归档建仓,提供弹性的SparkPresto,满足在线交互式查询、...

规格及选型

案例二:互联网SaaS用户 用户为互联网SaaS客户,需要建立数据中台,涉及多数据源包括RDS、Flink、OSS等,期待在平台上完成数据的ETL流程,实现多源处理以及分析侧不同场景的混合负载支持,需要高稳定性保证,同时平台对接数据应用支持报表...

增强分析(卡片和报告)

数据分析提供卡片和报告功能,您无需下载数据,即可快速完成数据可视化分析与报告创作,轻松打造个性化可视化作品,讲述数据故事、表达数据观点。本文为您介绍如何生成卡片并创作报告。计费说明 卡片及报告自2023年12月13日开始收费,收费...

可观测性能力

热Key与大Key分析 当某个Key接收的访问次数显著高于其它Key时,可以将其称为热Key(Hotkeys),若未能及时处理热Key可能会导致访问倾斜甚至缓存击穿等问题;当某个Key含有较多数据成员或者占用较大内存时,可以将其称为大Key(Big keys),...

支持的云服务

MaxCompute和DataWorks提供完善的ETL、数据分析数据地图、数据治理和数据仓库管理能力,并支持SQL、MapReduce、Graph等多种经典的分布式计算模型,能够更快速地解决用户海量数据计算问题,有效降低企业成本,保障数据安全。更多DataWorks...

什么是云原生数据分析

支持 AnalyticDB PostgreSQL 支持 支持 MaxCompute 支持 支持 Elasticsearch 支持 支持 Cassandra 支持 支持 Kudu 支持 支持 ECS自建Druid数据数据 支持 支持 何时使用DLA DLA主要围绕数据湖存储OSS提供一站式的云原生数据分析与计算...

什么是MaxCompute

随着数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(TB、PB、EB)级别。MaxCompute提供离线和实时的数据接入,支持规模数据计算及查询加速能力,为您提供面向多种计算场景的数据仓库解决...

确定需求

需求分析的途径有两种:根据与分析师和业务运营人员的沟通获知需求。对报表系统中现有的报表进行研究分析。在需求分析阶段,您需要沉淀出业务分析或报表中的指标,以及指标的定义和粒度。粒度可以作为维度的输入。建议您思考下列问题,对...

产品简介

DLA Ganos是基于云原生数据分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储计算的数据引擎产品。基于DLA无服务器化(Serverless)数据分析服务内置的Spark计算引擎,DLA Ganos打通了阿里云各个存储系统,如...

确定需求

需求分析的途径有两种:根据与分析师和业务运营人员的沟通获知需求。对报表系统中现有的报表进行研究分析。在需求分析阶段,您需要沉淀出业务分析或报表中的指标,以及指标的定义和粒度。粒度可以作为维度的输入。建议您思考下列问题,对...

DataWorks数据服务对接DataV最佳实践

当今社会数据收集的方式不断丰富,行业数据大量积累,导致数据规模已增长到传统软件行业无法承载的海量级别。MaxCompute服务于批量结构化数据的存储和计算,已经连续多年稳定支撑阿里巴巴全部的离线分析业务。过去,如果您想要通过DataV...

后续指引

开发与分析 数据类型 MaxCompute支持三种数据类型版本,为您介绍各版本支持的数据类型、适用场景及各版本间的差异,避免开发过程中出现数据类型无法解析问题。介绍:数据类型 常见问题:数据类型常见问题 常用命令 提供开发过程中的针对 表...

概述

Flume最终会将数据落地到实时计算平台(例如Flink、Spark Streaming和Storm)、离线计算平台上(例如MR、Hive和Presto),也可仅落地到数据存储系统中(例如HDFS、OSS、Kafka和Elasticsearch),为后续分析数据和清洗数据做准备。...

库表结构优化

冷热数据优化 分析数据表的使用情况,对长期未使用的数据表,建议将其迁移至冷盘存储,以减低数据表存储成本。此类型的优化建议针对数据表级别。迁移数据表到冷盘存储的具体操作,请参见 数据存储冷热分离。说明 数据表迁移至冷盘后,该...

应用场景

访问频度极高业务 如社交网络、电子商务、游戏、广告等。...实现对大数据的分布式分析处理,适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版 MaxCompute 间的同步,简化数据操作流程。

实验介绍

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集,...

大数据安全治理的难点

大数据体系的特点安全治理难点 由于大数据系统在“存储、用户、入口、流转、交付”等多方面的特点,想要回答好上述问题,存在诸多难点。存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)...

云产品集成

常见云产品如下:大数据开发治理平台 DataWorks 实时计算 Flink 版 数据库管理 DMS DataV 数据可视化 Quick BI 数据分析与展现 前提条件 已获取 OceanBase 数据库的基本连接信息,详细步骤请参见 获取连接参数。大数据开发治理平台 ...

产品概述

数据总线DataHub阿里云流计算引擎StreamCompute无缝连接,用户可以轻松使用SQL进行流数据分析数据总线DataHub服务也提供分发流式数据到各种云产品的功能,目前支持分发到MaxCompute(原ODPS),OSS等。系统整体功能图 产品优势 高吞吐 ...

快速体验

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集、...

JindoFS实战演示

Flink高效sink写入OSS Flink高效sink写入OSS 2021-06-01 当您需要将流式数据写入OSS,或者需要在线分析数据时,可能会遇到的问题:开源Apache Flink还不支持直接写入OSS、Hadoop OSS SDK写入性能不满足需求。此时您可以使用JindoFS Flink ...

数据洞察

DataWorks数据洞察是指通过深度数据分析和解读来获取深刻的数据理解和发现,它支持数据探索和可视化。您可以通过数据洞察了解数据分布,创建数据卡片,并组合成数据报告。此外,数据洞察结果能够通过长图形式的报告进一步分享。该功能利用...

数据可视化展现

即已通过数据开发DataStudio将数据加工为用户画像基本数据数据分析场景 本案例通过数据分析对用户画像数据进行可视化与分析,具体分析场景如下:场景 图示 城市注册人数排行榜分析 注册会员访问次数年龄分布 注册会员访问次数性别分布 ...

DataWorks On CDP/CDH使用说明

开始使用:数据分析 DataWorks数据分析提供CDP及CDH数据分析与服务共享能力。开始使用:数据治理 DataWorks提供 CDP及CDH 元数据管理与数据治理能力。开始使用:数据服务 DataWorks提供数据服务能力,帮助您统一管理面向内外部的API服务。...

确定需求

需求分析的途径有两种:通过与分析师、业务运营人员的沟通获知需求。对报表系统中现有的报表进行研究分析。在需求分析阶段,您需要沉淀出业务分析或报表中的指标,以及指标的定义和粒度。粒度可以作为维度的输入。建议您思考下列问题,对...

常见问题

数据湖后端存储使用OSS,用户使用数据湖构建面向大数据分析和机器学习场景可以获得集中式权限管理和统一的元数据视图,更容易对接云上大数据分析产品。什么情况下我需要使用数据湖构建?在云上有数据分析和机器学习需求,希望构建云上的...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

功能特性

查询治理 慢日志分析 统计并分析数据库实例中执行时间超过阈值的SQL语句,并提供相应的治理方案。慢日志 锁分析 查看、分析数据库实例最近一次死锁。锁分析 自动SQL限流 自动提取SQL特征,通过关键词对问题SQL进行限流。自动SQL限流 自动...

查询加速

本章将详细介绍如何在 云数据库 SelectDB 版 实例中进行查询优化和数据分析,云数据库 SelectDB 版 提供了多种分析SQL和优化方案,帮助您提升查询速度并实现高效的数据分析。概述 云数据库 SelectDB 版 采用了MySQL网络连接协议,兼容 标准...

性能调优

AnalyticDB MySQL版 做为分布式系统,其优势在于利用多机并行的能力,提升海量数据的处理速度,适合大数据量的分析。在某些场景中,查询计算量不是特别,AnalyticDB MySQL具备分布式开销,反而查询较慢。也有某些场景下,AnalyticDB ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云原生大数据计算服务 MaxCompute 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用