互联网、电商行业离线大数据分析

方案介绍 实现互联网、电商行业离线大数据分析的流程如下:同步用户订单等数据至MaxCompute。通过DataWorks对原始数据进行处理,并形成开放API。以API的形式通过DataV在大屏上展示结果数据。方案优势 大规模存储:超大规模存储且自动扩容,...

Spark概述

Spark是一个通用的大数据分析引擎,具有高性能、易用性和普遍性等特点。架构 Spark架构如下图所示,基于Spark Core构建了Spark SQL、Spark Streaming、MLlib和Graphx四个主要编程库,分别用于离线ETL(Extract-Transform-Load)、在线数据...

基于Delta lake的一站式数据湖构建与分析实战

2.统一元数据服务 对象存储本身是没有面向大数据分析的语义的,需要结合Hive Metastore Service等元数据服务为上层各种分析引擎提供数据的Meta信息。数据湖计算与分析 相比于数据仓库,数据湖以更开放的方式对接多种不同的计算引擎,如传统...

AnalyticDB MySQL助力Flowerplus业务高速发展

由此可见,Flowerplus对大数据分析的实时性要求较高,而传统的MySQL数据库无法满足这一需求。复杂数据查询性能 使用传统MySQL数据库对订单、商品流量、采购、业务转化率以及商品售罄报警等分析时速度较慢,数据达到千万级或者亿级时,复杂...

EMR Workbench

阿里云EMR Workbench是一个综合性的大数据分析和开发环境,作为阿里云E-MapReduce的一部分,它提供了EMR Notebook和EMR Workflow两个核心功能。通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作...

IoT数据自动化同步至云端解决方案

大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。IoT设备大量的数据通常以半结构化的形式存储。...

通过仪表板分析数据

假设您是一家大型互联网新零售企业的数据分析师,您的经理刚刚拿到2019年8月份的月度运营分析数据,他发现近期企业运营状况不佳,8月份毛利额环比前几个月下滑较,三季度毛利额存在不达标风险。因此,需要您根据订单信息和流量渠道信息等...

数据分析整体趋势

本文为您介绍数据分析的技术发展趋势和市场趋势。技术发展趋势 商业数据库起步于二十世纪八十年代,主要代表为Oracle,SQL Server,DB2等结构化数据在线处理的关系型数据库,而以MySQL,PostgreSQL为代表的开源关系型数据库也在二十世纪九...

JindoFS实战演示

Impala如何高效查询OSS数据 Impala如何高效查询OSS数据 2021-06-08 Apache Impala是一个开源的大数据查询分析引擎,能够快速查询分析存储在Hadoop集群的PB级数据。如果您已将HDFS数据迁移至OSS中,可通过在Impala中使用JindoFS SDK,高效...

即席分析概述

即席分析面向一线业务人员,以表格形式提供拖拽式的表格分析能力,让懂业务的人自助实现数据分析。即席分析只适用于Quick BI专业版的群工作空间下,个人空间不支持。产品定位 千万级别规模数据量下的低门槛数据探查及分析工具。核心能力 ...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将...MaxCompute处理业务数据和日志数据后,可以通过Quick BI快速地以可视化方式展现数据处理结果,详情请参见 基于MaxCompute的大数据BI分析

2020年

MaxCompute Web控制台支持以STS访问认证,使用RAM角色在Web控制台操作访问MaxCompute项目空间,进行数据分析、数据开发。用户认证 用户规划与管理 2020-11-17 新增Python UDF使用第三方包操作指导。新说明 MaxCompute支持您在Python UDF中...

属性分析

功能操作 选择属性指标 选择所需要分析的属性,并按照属性类型进行计算,其中数值型属性除支持「去重数」指标外,还支持「累加值」、「最大值」、「最小值」和「平均值」指标。支持增加筛选条件 选择属性分组 选择属性对指标进行分组展示,...

兼容性概述

BI分析工具连接MaxCompute,能够充分利用MaxCompute强大的数据处理能力和高性能的计算资源,为您带来更高效的数据分析体验。为了帮助您更清晰地使用BI工具连接访问MaxCompute,本文为您介绍MaxCompute支持连接的BI分析工具,以及工具与...

应用场景

数据分析业务 云数据库 Memcache 版搭配大数据计算服务 MaxCompute。实现对大数据的分布式分析处理,适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版与 MaxCompute 间的同步,简化数据操作...

Flink VVP+DLF数据入湖与分析实践

背景信息 阿里云实时计算Flink版是一套基于Apache Flink构建的实时大数据分析平台,支持多种数据源和结果表类型。Flink任务可以利用数据湖统一存储的优势,使用Hudi结果表或Iceberg结果表,将作业的结果输出到数据湖中,实现数据湖分析。在...

聚合支付方案

阿里云从业务扩展性、数据流动性、服务高可用三方面入手,通过多款云数据库产品为利楚扫呗制定聚合支付方案,解决利楚扫呗在业务扩展期遇到的数据存储空间不足、读写性能下降以及大数据分析空缺等问题。业务痛点 武汉利楚商务服务有限公司...

基础分析

注意:关联性分析是以全部重复来电数据为分析对象,通过对大量数据分析找出高频的关联标签。重复来电是以某个客户为分析对象,找出他每通电话的标签,进而分析两通电话之间的关系。通话量趋势 通话量的趋势是分析全部通话的随时间的变化...

与Spark集成分析

基于DLA无服务器化(Serverless)数据湖分析服务与内置的Spark计算引擎,DLA Ganos提供了不同级别的数据分析模型,最基础的是GeometryRDD模型,用来实现Ganos数据中SimpleFeature与Spark中RDD模型的之间的转换。在GeometryRDD基础上,DLA ...

与Spark集成分析

基于DLA无服务器化(Serverless)数据湖分析服务与内置的Spark计算引擎,DLA Ganos提供了不同级别的数据分析模型,最基础的是GeometryRDD模型,用来实现Ganos数据中SimpleFeature与Spark中RDD模型的之间的转换。在GeometryRDD基础上,DLA ...

分析实例简介

构建实时数仓成本太高,公司留给数据分析的预算有限,只能默默忍受越来越长的卡顿时间,殊不知在无限的忍受中公司错过了很多机会。为解决上述问题,您可以在RDS MySQL控制台上创建一个分析实例。分析实例的复杂分析性能约为RDS MySQL实例的...

管理数据

注意事项 数据分析后续所有的分析工作、仪表盘制作和大屏制作都是基于数据集进行的,因此在进行其他功能前,必须先创建数据集。创建数据集 方式一:通过控制台顶部菜单栏操作创建数据集 登录 数据管理DMS 5.0。在顶部菜单栏中,选择 集成与...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。...数据展现与分享:数据提取成功后,可以通过报表、地理信息系统等多种展现方式,展示与分享大数据分析、处理后的成果。

DataV

DataV数据可视化是使用可视化大屏的方式来分析并展示庞杂数据的产品,您可以在DataV中新建 AnalyticDB MySQL 数据源,通过DataV对 AnalyticDB MySQL 数据进行可视化分析。在DataV中新建AnalyticDB MySQL数据源 登录 DataV控制台。选择 我的...

数据下载

在DataWorks的数据开发(DataStudio)、数据分析、安全中心模块下载的CSV、XLSX格式文件数据将同步保存至数据下载功能。通过该功能,您可将所需历史...数据分析的更多介绍,请参见 数据分析概述。安全中心的更多介绍,请参见 安全中心概述。

应用场景

前端的监控系统和大数据处理系统会利用 TSDB 的数据查询和计算分析能力进行业务监控和分析结果的实时展现。电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析。...

数据大屏

权限管理员可以为数据大屏资源授予编辑和查看数据大屏的权限。背景信息 权限管理员授予用户权限时,在协同状态和私密状态下的权限属性有所不同,见下图。其中,协同权限之间存在以下关系:编辑权限:当用户拥有 编辑 权限时,支持编辑和...

查询加速

本章将详细介绍如何在 云数据库 SelectDB 版 实例中进行查询优化和数据分析,云数据库 SelectDB 版 提供了多种分析SQL和优化方案,帮助您提升查询速度并实现高效的数据分析。概述 云数据库 SelectDB 版 采用了MySQL网络连接协议,兼容 标准...

划分数据

数据仓库是面向主题(数据综合、归类并进行分析利用的抽象)的应用。数据仓库模型设计除横向的分层外,通常也需要根据业务情况进行纵向划分数据域。数据域是联系较为紧密的数据主题的集合,是业务对象高度概括的概念层次归类,目的是便于...

产品优势

全托管的Databricks数据洞察大数据分析平台,可以让您从繁杂的环境运维、内核优化等工作中解脱出来,专注于开发Spark作业本身。本文介绍Databricks数据洞察的产品优势。高效稳定 产品内核使用Databricks商业版的Runtime和Delta Lake。与...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

数据分析概述

允许您利用工作空间中现有的数据源作为数据分析的数据集。数据源一部分是DataWorks支持的引擎自带数据源,一部分是自建数据源。在SQL查询中可预览数据集中的数据,并快速生成该表的查询SQL语句,详情请参见 SQL查询。电子表格 电子表格是...

基于混合负载的查询优化

传统数仓方案,通过组合多套数据库与大数据产品,利用各自不同的优势来解决不同的分析场景,带来的问题就是整个数据冗余,同时管理多个异构系统的代价。完备数据仓库,首要解决的问题包括:如何更好的支持数据库场景下的交互式分析以及...

Quick BI如何接入TSDB

Quick BI是一个基于云计算致力于大数据高效分析与展现的轻量级自助BI工具服务平台。通过对数据源的连接和数据集的创建,对数据进行即时的分析与查询;通过电子表格或仪表板功能,以拖拽的方式进行数据的可视化呈现。连入成功后,您可以在...

漏斗图

重要 在画布编辑器中添加BI分析组件时,图层栏内会自动在当前BI组件上方对应生成一个分析器,且需要提前创建数据集以供BI分析组件选择并配置使用,创建数据集和分析器交互使用说明详情,请参见 添加数据集 和 BI分析器交互使用说明。...

数据可视化展现

本文为您介绍如何通过DataWorks数据分析实现用户画像数据可视化展示。前提条件 在开始试验前,请确认您已经完成了 加工数据。即已通过数据开发DataStudio将数据加工为用户画像基本数据。数据分析场景 本案例通过数据分析对用户画像数据进行...

常见术语

数据湖分析 数据湖分析就是针对数据湖数据分析的方案。云原生数据湖分析(简称DLA)是新一代大数据解决方案,采取计算与存储完全分离的架构,支持数据库(RDS\PolarDB)与消息实时归档建仓,提供弹性的Spark与Presto,满足在线交互式查询、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 云原生大数据计算服务 MaxCompute 云数据库 RDS 云原生数据湖分析 (文档停止维护) 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用